О поиске эквивалентных текстов. Д. С. Бухаров
Скачать книгу в различных форматах или читать онлайн на сайте.

Название: О поиске эквивалентных текстов

Автор: Д. С. Бухаров

Издательство: НОЧ «МФПУ «Синергия»

Жанр: Программы

Серия: Прикладная информатика. Научные статьи

isbn:

isbn: 2016

Аннотация:

В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания). Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В результате проведенного эксперимента определены слабые стороны подхода. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации.

СКАЧАТЬ Читать онлайн

Лучшие книги из серии Прикладная информатика. Научные статьи

Лучшие книги жанра Программы

Лучшие книги издательства НОЧ «МФПУ «Синергия»