Открытый семинар «Контролируемая генерация текстов для речевой терапии пациентов с афазией: методология и разработка пайплайна»
2 октября на очередном открытом семинаре научно-учеюбной группы выступили ее руководитель Анастасия Владимировна Колмогорова, а также ее участники Анастасия Марголина, Алина Тельнова и Игорь Ильченко. Они рассказали о новом этапе нашего проекта, посвященного речевой терапии пациентов с афазией.
Основная проблема в области речевой терапии взрослых — дефицит специализированных текстов, которые одновременно должны быть простыми для восприятия (частотная лексика, простые предложения) и при этом содержательно интересными для пациента. На прошлом этапе в НУГ тестировался метод симплификации (упрощения) готовых текстов художественной литературы и СМИ для пациентов с разной степенью тяжести речевого нарушения. Однако более продуктивным оказался метод генерации таких текстов с нуля с помощью большой языковой модели (LLM), о чем и рассказали выступающие.
На семинаре был представлен разработанный пайплайн, позволяющий генерировать коллекции таких текстов с помощью многоэтапного промптинга. Этот подход дает возможность контролировать как лингвистические параметры, так и смысловое наполнение итоговых материалов.
⁃ требования к грамматическим структурам, сложности лексики и длине текста были разработаны совместно с логопедами,
⁃ способ контроля содержания представляет собой трехчастную комбинаторную систему: 12 тематических категорий, 10 архетипических персонажей и 11 ключевых объектов комбинируются между собой,
⁃ набор тематических категорий основывается на топе популярных Google запросов,
⁃ список архетипических персонажей опирается на типы персонажей по В.Проппу,
⁃ список прототипических объектов разработан с опорой на теорию аргументации в языке О.Дюкро и Ж.-П.Анскомбра.
К семинару присоединились и наши коллеги-логопеды из Москвы и Красноярска! После доклада состоялась продуктивная дискуссия о дальнейших путях развития проекта, а также о возможностях валидации и применения текстов, сгенерированных по нашей методике, для работы с реальными пациентами.
Участникам семинара были продемонстрированы примеры текстов трех уровней сложности, сгенерированных для пациентов с комплексной моторной афазией разной степени тяжести. Представленный метод позволил создать корпус из более чем 1.000 текстов, который вскоре будет валидирован в клинической практике!
Благодарим Анастасию Владимировну и др. за интересный доклад и предлагаем вам посмотреть наше выступление - https://rutube.ru/video/c471283dbe00271b99c4488ff446962e/
