• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

В Санкт-Петербурге научились предсказывать курс акций на неделю вперед по новостям в СМИ

Ученые из  НИУ ВШЭ — Санкт-Петербург и ВТБ разработали первый для российского рынка алгоритм, позволяющий предсказывать колебания котировок акций на основе анализа новостного потока —  STTM (Stock Tonal Topic Modeling ). Благодаря новой технологии инвесторы смогут строить более эффективные финансовые стратегии: алгоритм позволяет делать прогнозы в пределах месяца. Результаты работы опубликованы в журнале PeerJ Computer Science.

В Санкт-Петербурге научились предсказывать курс акций на неделю вперед по новостям в СМИ

ISTOCK

Можно ли предсказать рост или падение акций на фондовом рынке? Согласно одной из основных инвестиционных теорий — гипотезе эффективного рынка — акции торгуются на бирже по справедливой стоимости, в которой уже учтена вся доступная общественности информация, способная повлиять на котировки. Поэтому анализ этой информации и основанные на ней прогнозы не могут служить базой для построения эффективной инвестиционной стратегии.

Однако инвесторы не оставляли попыток угадать изменения котировок акций на бирже. Для этого использовались различные подходы, которые можно разделить на две основные группы: прогнозы на основе прошлых котировок акций и прогнозы на основе анализа внешних источников информации, таких как финансовые отчёты, новости, мнение аналитиков. Но общепринятого алгоритма для предсказания поведения акций на бирже с учётом новостного потока не существовало.

Учёные из НИУ ВШЭ — Санкт-Петербург и ВТБ разработали новый метод для прогнозирования колебаний котировок акций на основе анализа новостей — STTM (Stock Tonal Topic Modeling). Его особенность в том, что он использует сразу два источника данных: изменение цены акций во времени и новостные статьи, а также алгоритмы тематического моделирования и определения тональности, что позволяет делать более точные прогнозы. Это первая модель, разработанная специально для российского финансового рынка.

Алгоритм STTM собирает новости из крупнейших российских СМИ, пишущих о бизнесе, финансах, политике («Коммерсантъ», «Ведомости», РИА «Новости»), затем сортирует эти новости по темам (например, спорт, политика, экономика, бизнес). Сортировка происходит на основе алгоритмов тематического моделирования (LDA и DTM). В тематических блоках выделяются ключевые слова и их тональность: позитивная, негативная, нейтральная. Метод STTM также отслеживает изменение котировок акций российских компаний во времени, например, за прошедшую неделю. Сочетание этих факторов — колебание цены во времени, тематическое моделирование и тональность новостей — позволяет рассчитать коэффициент STTM. Если он больше 1, то акции вырастут в цене, если меньше 1, то упадут.

Пайплайн алгоритма STTMA. Ryabykh et al. / Peer J Computer Science 2022

В рамках исследования было проанализировано более 197 тысяч экономических статей из российских СМИ и использованы данные котировок наиболее ликвидных акций российских компаний за 8 лет, с 2013 по 2021 год. Эффективность метода STTM проверялась с помощью теста на причинность по Грейнджеру: авторы исследования изучали причинно-следственную связь между новостным потоком, разбитым на темы, и колебаниями котировок акций.

Кроме того, на основании полученных прогнозов моделировалась возможная инвестиционная стратегия, эффективность которой оценивалась по коэффициенту Шарпа — показателю эффективности инвестиционного портфеля. Исследователи отмечают, что разработанный метод позволяет довольно точно предсказывать колебания цен на фондовом рынке и превосходит 26 существующих моделей по индексу Шарпа.

Мы не первые придумали анализировать новости для предсказания котировок, но мы впервые использовали эту модель для российского рынка. И мы впервые использовали тематическое моделирование и тональность для предсказания поведения акций на бирже с учётом множества тем. Нашу модель можно настроить под свои потребности: выбрать интересующие СМИ, нужный временной интервал, алгоритм тематического моделирования, даже язык.

Сергей Кольцов
Один из авторов исследования, ведущий научный сотрудник Лаборатории социальной и когнитивной информатики НИУ ВШЭ — Санкт-Петербург

На сегодня алгоритм STTM позволяет делать недельные прогнозы, а код лежит в открытом доступе на Zenodo.