Создание мультилингвистического тезауруса

Создание мультилингвистического тезауруса

Специалисты КФУ приняли участие в проекте по созданию научного интернет-портала «Тюркская морфема», основным разработчиком которого выступил Институт прикладной семиотики Академии наук Республики Татарстан

Специалисты Крымского федерального университета приняли участие в проекте по созданию научного интернет-портала «Тюркская морфема», основным разработчиком которого выступил Институт прикладной семиотики Академии наук Республики Татарстан. Проект базируется на новых технологиях компьютерной лингвистики и объединяет данные о более чем 30-ти тюркских языках.

Проект позволяет ускорить изучение тюркских языков. 

Сайт предоставляет доступ к множеству сервисов для исследования языков выбранной группы и работы с ними. Его особенностью является обработка информации на основе специфики агглютинативных языков, а не английского, что способствует упрощению работы для тюркологов.

«Наш проект предоставляет разный функционал и состоит из подсистем, интегрированных в единое целое: подсистема научных лингвистических исследований, информационно-справочная, библиотека лингвистических сервисов. Один из ключевых критериев для нас – универсальность. Каждый коллектив пытается разрабатывать своё ПО, но в итоге они оказываются несовместимыми между собой. Мы разрабатываем пути их взаимодействия», – рассказала доцент кафедры английской филологии Института иностранной филологии КФУ им. В. И. Вернадского Ленара Кубединова.

При создании «Тюркской морфемы» применялись современные наработки в областях программирования и языкознания: модели таксономического типа (аналог – ресурс WordNet) и фреймового типа (аналог – ресурс FrameNet), автоматные грамматики и другие. На портале возможны два режима работы: читателя и эксперта. При втором исследователь может предлагать коррективы для мультилингвистического тезауруса.

«Базы данных портала могут быть использованы в учебном и научно-исследовательском процессах. Благодаря единству объёмных пластов материала в структурированной системе проект обеспечивает ускорение исследования и изучения тюркских языков. Сегодняшнее состояние портала не является окончательным, разработки ведутся постоянно. Мы приглашаем всех специалистов в этой области к сотрудничеству», – добавила Ленара Кубединова.  

Проект реализован в сотрудничестве с рядом вузов России. Результаты работы представлены в статье «Multilingual thesaurus for turkic languages», опубликованной в сборнике материалов международной конференции «5th International Conference on Computer Science and Engineering», вошедшем в базу Scopus.

 

Информация и фото предоставлены пресс-службой Крымского федерального университета

Источник: scientificrussia.ru



Добавить комментарий