Определение авторства текстов на каракалпакском языке: вычисление TF-IDF метрики
Семинар: Информационные технологии в задачах филологии и компьютерной лингвистики
Начало заседания: 17:30
Дата выступления: 9 Апрель 2024
Организация: НГУ (Новосибирск)
Авторы: Абдуллаев Руслан Махсетбай улы
Авторство текста определяется не только по уникальному выбору слов автором, но и через стилистические и лингвистические особенности, такие как использование определенных лексических конструкций, предпочтительные грамматические структуры, а также морфологические и синтаксические характеристики.
В рамках начальной стадии исследования был разработан алгоритм определения TF-IDF метрики для текстов каракалпакского языка. Проведено тестирование алгоритма.
(аннотация представлена в авторской редакции)
---
Онлайн-подключение на семинар будет осуществляться по ссылке:
https://vcs-6.ict.nsc.ru/rooms/be6-uui-gvg-ced/join