Встреча-лекция "Крупномасштабная структура естественного языка"
9 февраля по приглашению научно-учебной группы в корпусе ВШЭ на Кантемировской улице состоялась встреча-лекция с профессором факультета компьютерных наук московской Вышки и заместителем департамента анализа данных и искусственного интеллекта Василием Александровичем Громовым. Тема лекции — «Крупномасштабная структура естественного языка» — вызвала большой интерес у студентов, аспирантов и преподавателей, занимающихся лингвистикой, анализом данных и искусственным интеллектом.
Василий Александрович начал с того, что язык — это самоорганизующаяся критическая система. Это означает, что язык, как и многие природные явления, развивается по своим внутренним законам, которые можно описать математически. Тексты в языке он сравнил с «лавинами», где количество слов подчиняется степенному закону распределения.
В ходе лекции были подробно рассмотрены модели, методы и алгоритмы анализа языковых данных. Особое внимание уделялось модели оценки размерности Хаусдорфа и модели оценки топологической размерности. Размерность Хаусдорфа — это математическая концепция, которая помогает измерить «сложность» структуры языка, а топологическая размерность позволяет понять, как устроено семантическое пространство — то есть пространство смыслов и значений слов. Эти подходы позволяют изучать сложные структуры языка, такие как области сгущения (где часто употребляются определенные n-граммы, то есть последовательности слов или символов) и «дырки» (где n-граммы практически отсутствуют).
Важной частью выступления стал топологический анализ данных. Топология — это раздел математики, который изучает свойства пространств, сохраняющиеся при непрерывных деформациях. Василий Александрович объяснил, как с помощью топологии можно выделять структуру семантического пространства и находить области, которые либо активно используются в языке, либо, наоборот, остаются «пустыми». Например, в языке есть «персистентные дырки» — области, которые почти никогда не заполняются словами или выражениями. Это открывает новые возможности для понимания того, как устроен язык и как он эволюционирует.
Также лектор рассказал о тексте как о многомерном хаотическом временном ряде. Это значит, что текст можно рассматривать как последовательность данных, где каждая точка зависит от предыдущей, но при этом обладает сложной, хаотической структурой. Для анализа таких данных используются такие характеристики, как энтропия-сложность (мера неопределенности или разнообразия в тексте) и размерности странных аттракторов (объекты, которые описывают долгосрочное поведение хаотических систем).
Отдельное внимание было уделено ботам — технологии искусственного интеллекта, способной генерировать тексты. Василий Александрович отметил, что тексты, созданные ботами, могут вводить в заблуждение и оказывать негативное влияние на развитие языковой личности. При этом на данный момент не существует надежных систем, способных эффективно отличать тексты, созданные ботами, от текстов, написанных людьми. Это одна из актуальных проблем, требующих дальнейших исследований.
Лекция вызвала живой интерес у аудитории. Студенты и преподаватели задавали вопросы, касающиеся как теоретических аспектов, так и практического применения представленных методов. Василий Александрович подробно ответил на каждый вопрос, подчеркнув важность междисциплинарного подхода в современных исследованиях.
Мероприятие завершилось на высокой ноте, оставив у слушателей не только новые знания, но и вдохновение для дальнейшего изучения этой увлекательной области. Мы благодарим лектора и всех участников и надеемся, что подобные встречи станут традицией и будут способствовать развитию научного сообщества в нашем университете.
Презентация В. А. Громова
С видео-записью лекции можно ознакомиться по ссылке:
https://rutube.ru/video/private/c2bcfaba3ec0366f09abad98c46ed794/?p=Sye3xnUCpVxdJgiqd9DFUw