О поиске эквивалентных текстов

О поиске эквивалентных текстов
sku: 19411903
158.00 руб.+6%
168.00 руб.
Shipping from: Russia
   Description
В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания). Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В результате проведенного эксперимента определены слабые стороны подхода. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации.
   Technical Details
age: 0
author: Д. С. Бухаров
genres_list: 5270,5271,6645,26795,95245,110717,111703
lang: ru
litres_isbn: 978-5-04-018884-0
publisher: Синергия
series: Прикладная информатика. Научные статьи
Type: book
year: 2016
Форматы: PDF
   Price history chart & currency exchange rate

Customers also viewed