• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар НУГ «Кластерный анализ: метрики, алгоритмы и визуализация»

20 апреля 2024 года состоялся двадцатый семинар научно-учебной группы по исследованию частотных характеристик языка на тему: «Кластерный анализ: метрики, алгоритмы и визуализация». С докладом выступили участники НУГ: Дарья Куганова, Игорь Петров и Михаил Крайторов.

В рамках семинара были рассмотрены основные принципы и методы кластерного подхода. Участники изучили различные метрики и их роль в определении сходства между данными (Евклидово расстояние, Манхэттенское расстояние и другие), а также рассмотрели различные стратегии кластеризации, включая иерархические алгоритмы объединения и методы построения дендрограмм. Особое внимание было уделено вопросу определения оптимального числа кластеров и критериям для принятия решения о завершении процесса кластеризации. В частности, докладчиками были описаны: метод силуэта (Silhouette method), метод локтя (Elbow method) и валидационные индексы. В целом, проведенные обсуждения помогли участникам понять не только технические аспекты кластерного анализа, но и его практическую значимость в области стилометрических исследований.

 

Во второй части семинара студенты и преподаватели обсудили существующие директории и модули, которые могли бы помочь в реализации кластерного анализа на данных, собранных в рамках исследования НУГ. Особое внимание было уделено пакету Stylo. Также, было принято решение о развитии этой темы в последующих научных семинарах.


 

Презентация доклада: https://disk.yandex.com/i/87gZF9rdLJ404w

Запись семинара: https://disk.yandex.com/i/y_TFSE_vnJhIKg