Орфо® и Контекст® -  Лингвистические программы
495  269-06-30
  • English
  • Русский

Морфология

Морфологические библиотеки для русского, украинского, английского, немецкого, французского, испанского, итальянского и португальского языков

Морфологические библиотеки - объединяют несколько модулей предназначенных для морфологического анализа слов и позволяют решить следующие задачи:

  • Приведение слов к словарной форме. Для поиска одной формы слова по другой его форме. Этот модуль приводит слова к словарной форме в соответствии с информацией из основного словаря или пополняемого морфологического словаря пользователя неограниченного объема. Для каждого слова дополнительно сообщается часть речи и 4-х байтный цифровой хэш-код (hash-code), с помощью которого можно индексировать тексты;
  • Синтез всех форм заданного слова. Модуль выдает все формы заданного слова, если оно находится в основном словаре или пополняемом морфологическом словаре пользователя неограниченного объема.

Библиотека позволяет провести точный анализ слов, находящихся в словаре ОРФО. В русском словаре общей лексики содержится около 180 тысяч словарных статей (лексем), в специализированных словарях еще около 60 тысяч, дающих вместе более 4-х миллионов словоформ. База для украинского языка содержит около 130 тысяч лексем, для английского - около 115 тысяч, для немецкого – 100 тыс., итальянского – 80 тыс., французского - 45 тыс., испанского - 48 тыс., португальского - 50 тыс., португальского (Бразилия) - 43 тыс. лексем. Для неизвестных слов библиотека с высокой степенью достоверности помогает сделать предсказание грамматических характеристик и парадигмы на основе комплекса правил словоизменения.

Ключевые характеристики модуля:

  • словари общеупотребительной лексики большого объема;
  • система быстрого пополнения словаря: в 99% случаев система сама определит тип словоизменения вводимого слова;
  • система генерации уникальных идентификаторов слов: каждому слову, известному системе, ставится в соответствие уникальный идентификатор, позволяющий организовать компактный индекс произвольного массива документов с последующим поиском, учитывающим все словоформы.

Библиотека поможет включить морфологический анализ в системы информационного поиска. Она поддерживает все возможности морфологического анализа для известных слов: определение грамматических характеристик слова, приведение к словарной форме, получение требуемых словоформ.

Продукт поставляется в виде динамической библиотеки (*.dll) для Windows.

Потестировать работу морфологических модулей on-line можно здесь

API модуля морфологии можно прочитать он-лайн или скачать в виде PDF-файла.

Авторизация/Регистрация

Электронная почта

support@informatic.ru
Пожелания по работе магазина

sales@informatic.ru
Вопросы оплаты и получения программного обеспечения

Ваши пожелания по работе магазина

Программный комплекс ОРФО внесен в Реестр отечественного ПО под №4409 от 16.04.2018
Наш адрес: 121357, Москва, ул. Верейская, д. 29, стр. 134, этаж 7, пом. 2Н/7
ОГРН 5067746380455, ИНН 7703606133, КПП 773101001
© OOO "Информатик", 1989-2023