Итоги месяца. Ноябрь – междисциплинарный подход

В ноябре 2021 года на открытых семинарах НУГ выступили С. О. Шереметьева и А. Ю. Володин. В своих докладах они познакомили участников с онтологическими и просопографическими ресурсами, их особенностями и ограничениями. О комплексных способах представления неструктурированных данных читайте в этом материале.

«Онтологии как база знаний систем искусственного интеллекта. Об одном подходе к использованию онтологических ресурсов для интеллектуальной обработки неструктурированной информации»

На встречах научно-учебной группы Светлана Олеговна Шереметьева, доктор филологических наук. профессор кафедры Лингвистики и Перевода и директор научно-образовательного центра «Лингво-инновационные технологии» Южно-уральского государственного университета, представила два доклада, посвященных онтологиям – инструментам инжиниринга знаний, широко применяющимся в системах искусственного интеллекта.

Первая лекция была вводной и позволила слушателям получить представление о том, что такое онтология, какие источники получения онтологических знаний существуют и какие подходы к построению таких ресурсов выделяются. Неизбежны и проблемы, с которыми сталкивается исследователь, разрабатывая предметные онтологии. Как они решаются – С. О. Шереметьева рассказывает на примерах исследований коллег и исходя из личного опыта.

Через неделю участники семинара НУГ продолжили обсуждение «онтологического» вопроса. Интеллектуальная обработка неструктурированных текстовых данных представляет собой непростую задачу. Ее решение видится в разработке и внедрении семантических технологий для анализа. С. О. Шереметьева делится результатами работы команды научно-образовательного центра Южно-Уральского государственного университета. Так, на примерах реализованных группой проектов, посвященных созданию концептуально аннотированных ресурсов для предметной области «Терроризм» и использованию онтологических ресурсов для извлечения эмоций из русского поэтического текста, были продемонстрированы этапы построения онтологий и применявшиеся для этого программы.

Видеозаписи семинаров доступны на нашем канале YouTube по ссылкам: доклад от 12 ноября (https://www.youtube.com/watch?v=UIVaSr3uuuw&t=4s) и доклад от 19 ноября (https://www.youtube.com/watch?v=RauNEMGw-ko&t=2s).

«История с биографией: капта из исторических источников на примере биографических онлайн-проектов»

Доклад Андрея Юрьевича Володина, кандидата исторических наук, доцента кафедры исторической информатики исторического факультета МГУ и одного из ведущих специалистов в области исторической информатики (historical information science) и «цифровой истории» (digital history), был посвящен вопросам, связанным с моделированием биографии.

Мы живем в эпоху «больших данных». Но что такое данные? В литературе сравнительно давно, еще в XX-м веке, в качестве оппозиции данным, которые собраны и даны, появилось понятие капта. Капта – это данные, которые получены, или «схвачены», каким-то образом, при этом методология их сбора, порой, оказывается даже важнее содержания.

Сбор данных – фундаментальная часть исследования в гуманитарных науках, когда данные все чаще становятся не столько отправной точкой анализа, сколько его итогом. На примере биографических онлайн-проектов А. Ю. Володин демонстрирует задачи, дихотомии, а также ограничения цифровой биографики.

Публикуем видеозапись мероприятия:

Post Scriptum

Выражаем благодарность Светлане Олеговне Шереметьевой и Андрею Юрьевичу Володину, а также всем участникам семинара. Спасибо за интерес и оживленную дискуссию!

До новых встреч!

Дата

5 декабря 2021

Темы

профессора студенты исследования и аналитика репортаж о событии

В статье упомянуты

Научно-учебная группа междисциплинарных филологических исследований Санкт-Петербургского кампуса НИУ ВШЭ