Программная система терминологического анализа научных полнотекстовых источников
Патенты
Язык: |
Русский |
Тип: |
Программа для ЭВМ |
Номер (11) |
RU 2015612072 |
Номер заявки (21): |
2014661158 |
Дата подачи заявки (22): |
5 нояб. 2014 г. |
Дата начала отсчета срока действия патента (24): |
5 нояб. 2014 г. |
Дата публикации патента (44,45,46): |
20 мар. 2015 г. |
Дата публикации заявки (43): |
|
Программа предназначена для поиска и извлечения общенаучных и специализированных терминов, а также терминоподобных словосочетаний - терминологического спектра, из коллекций первичных текстовых документов в области естественных наук, в частности химии. Анализируемые исходные тексты могут быть представлены в pdf-формате. Дальнейший анализ получаемого терминологического спектра коллекции публикаций может быть использован в целях создания новых эффективных процедур поиска и методов анализа текстовой информации, с последующим использованием результатов в системах принятия решений, специализированных поисковых сервисах, исследовании критериев выбора приоритетов научных исследований и т.д. Принцип работы основан на применении L-граммного анализа текстов с использованием оригинальных расширенных правил фильтрации терминоподобных словосочетаний, гибкой системы правил отбора и исключения терминов, анализа и использования морфологической информации, синтаксической и семантической структуры предложения. Программа предоставляет пользовательский веб-интерфейс, содержащий компоненты для просмотра и первичного анализа получаемого терминологического спектра вместе с текстом исходных документов.