Freedom Broker

Реклама

  1. Главная
  2. Государство
  3. В AERC проанализировали тональность новостей казахстанских СМИ

В AERC проанализировали тональность новостей казахстанских СМИ

Аналитики исследовали материалы за последние 10 лет

Фото: Валерия Змейкова
Фото: Валерия Змейкова

Авторы: аналитики AERC Рустам Бекишев, Даулет Талипов, Асанали Шаяхметов

В настоящее время использование методов машинного обучения и технологий искусственного интеллекта становится одним из центральных инструментов современного экономического анализа и управления. Эти технологии позволяют работать с большими массивами данных, выявлять скрытые закономерности и формировать прогнозы, недоступные при традиционных подходах. Одним из перспективных направлений их применения выступает анализ текстов новостных материалов, который приобретает все большее значение в условиях перенасыщенного информационного пространства. AERC провела исследование материалов казахстанских СМИ и поделилась его данными. 

Новости в современном обществе перестали быть лишь источником информации: они сами становятся фактором, влияющим на экономическое поведение. В научной литературе убедительно показано, что интенсивность и тональность новостного освещения способны изменять инфляционные ожидания населения. Например, исследование Федерального резервного банка Сан-Франциско (Chahrour, Shapiro, Wilson, 2025) показало, что увеличение частоты негативных новостей об инфляции повышает инфляционные ожидания населения в среднем на 0,4 процентного пункта, тогда как позитивные сообщения оказывают значительно более слабое воздействие. Практика международных организаций также подтверждает важность текстового анализа. МВФ совместно с исследователями разработал World Uncertainty Index, который основан на подсчете частоты употребления слова «uncertain» (неопределенность) в материалах Economist Intelligence Unit (Ahir et al., 2022).  Этот индекс замеряется ежемесячно и сегодня рассматривается как индикатор уровня глобальной неопределенности, который косвенно объясняет волатильность на финансовых рынках. В Европейском центральном банке были проведены эксперименты с применением крупных языковых моделей, включая ChatGPT, для анализа комментариев деловых опросов, что позволило улучшить краткосрочные прогнозы ВВП. Eugster, Uhl (2024), собрав базу из 730 тыс. новостей, измерили их тональность и построили новостной индекс, который стали использовать как «фактор» предсказания будущей инфляции. Таким образом, сейчас подобные исследования очень популярны, как в академической, так и в регуляторной сфере.

Для Казахстана использование подобных инструментов особенно перспективно. Во-первых, растет потребность в своевременной оценке общественных и экономических настроений, которые напрямую влияют на инфляционные ожидания, инвестиционные решения и доверие к политике государства. Во-вторых, накапливается значительный массив локальных новостных данных, что делает возможным создание национальных индексов  уже с учётом казахстанских медиа, языка и экономических реалий.

О чем писали казахстанские новостные порталы в последние 10 лет?

В AERC уже начали работу в направлении использования текстового анализа: собрана база из более чем 338 тыс. экономических новостей с 2007 года по июль 2025 года, охватывающая материалы 18 ведущих казахстанских изданий. Этот массив данных открывает возможность системного анализа, выявления наиболее обсуждаемых тем и отслеживания трансформации экономического дискурса по годам.

Например, на основе собранной базы новостей аналитики увидели, что интенсивность публикаций по экономическим темам в Казахстане резко возросла. При этом пик пришелся как раз на 2022 год, что связано с началом войны России и Украины, введением санкций против России (см. рис. 1) – этот внешнеэкономический шок актуализировал такие темы, как внешняя торговля, валютный курс, внешняя торговля.

Для большего понимания того, какой потенциал имеет анализ новостей, агентство в качестве примера приводит более глубокий анализ новостей именно по 2025 году, по месяцам. Всего с января по июль 2025 года 18 новостными порталами уже опубликовано 18,8 тыс. новостей по экономике и финансам.

Ниже приведена структура новостных публикаций в 2025 году по крупным тематическим блокам:

Как видно, больше всего новостей – по блоку финансового сектора и кредитования, валютного рынка и обменных курсов, государственных финансов и налогов. К слову, тема государственных финансов стала наиболее популярна именно в последние три года. Одновременно анализ в разрезе каждого новостного источника показывает, что в январе-июле 2025 года наиболее интенсивно на тему экономики и финансы публиковали новости Kapital.kz, DKNews.kz, Zakon.kz и LSM.kz (см. рис. 3).

После выделения тематических кластеров для каждой темы были построены временные ряды, отражающие количество новостей по данным темам во времени. Такой подход позволяет исследовать эволюцию информационной повестки и выявлять, каким образом интерес к различным аспектам экономики и общества изменялся на протяжении исследуемого периода. Вдобавок, в крупных тематических блоках можно выделять отдельные подтемы.

Например, из недавнего аналитики отметили, что в блоке «международные отношения и внешняя торговля» в январе-феврале 2025 года появился отдельный «яркий» сюжет – «политика США и Дональд Трамп». По этой подтеме было опубликовано 36 новостей, правда, основная масса – в январе-феврале 2025 года, а с марта 2025 года количество новостей по этой теме уменьшалось, сходя на нет (см. рис. 4).

Вот именно такое разложение на подтемы позволяет отделить краткосрочные информационные импульсы от долгосрочного тренда и точнее интерпретировать повестку экономических новостей по месяцам. В частности, долгосрочной повесткой характеризуется, например, тема «инфляции и роста цен»: с начала года по этой теме ежемесячно публиковалось не менее 20 новостей, то есть в среднем каждый портал минимум один раз в месяц упоминает тему инфляции (см. рис. 5).

Отдельно проанализировали общую тональность публикаций за 2025 год с помощью модели Gemini. Под тональностью понимается общее «настроение» новости: позитивное, нейтральное или негативное. То есть все, когда читают новость, считывают не просто факты, но и «окрас» новости. Одни материалы откровенно окрашены в негатив, другие несут позитивный подтекст, третьи остаются максимально нейтральными. И для современного государственного управления мониторинг тональности новостного потока, учитывая объемы ежедневно выливаемой информации, становится критически важным, поскольку этот новостной поток способен оказывать влияние на динамику общественных настроений.

Стоит отметить, что пока агентство не настраивало модель на особую категорию пользователя, то есть «тональность» оценивалась так, как если бы текст читал «условный средний пользователь». При этом модель можно дообучить под разные профили восприятия – под разные интересы.  Например, если задать перспективу «инвестора», темы финансовых рынков или валютного курса, которые для массового читателя выглядят нейтрально, могут приобрести «негативную» эмоциональную окраску.

Пока в AERC провели анализ тональности в базовой конфигурации, то есть для «условного среднего пользователя», разбив корпус новостей на подтемы, чтобы продемонстрировать возможности языковых моделей. Например, как видно на рис. 7, модель классифицировала основную часть публикаций по теме «валютный рынок и курс» как нейтральные, поскольку при настройке не задавалось, что читатель — житель Казахстана, для которого вопросы инфляции и обменного курса могут иметь более выраженный эмоциональный оттенок.

Тем не менее уже в такой «базовой» настройке можно заметить, что доля негативных материалов превышает 20% по тематическим блокам «макроэкономика и инфляция», «государственное управление и право», а также «автомобильный рынок». В этих блоках чаще встречаются сообщения о конфликтах интересов, ценовых и регуляторных рисках.

Напротив, темы бизнес и предпринимательство, промышленность и производство, региональное развитие и СЭЗ, туризм, культура и досуг демонстрируют выраженную положительную тональность. Здесь преобладают новости о запусках проектов, инвестициях, расширении мощностей и инфраструктурных инициативах.

Следует заметить, что большая часть новостей все же имеет «нейтральный» окрас, как ввиду того, что тональность рассматривалась для усредненного пользователя, так и ввиду того, что в целом в экономических новостях доминируют фактология и официальные сообщения, которые не имеют явного эмоционального окраса (в отличие, например, от новостей «спорта и культуры»).

От информационного шума к системному анализу: роль ИИ в понимании экономических настроений

В условиях стремительного роста новостного потока создание национальных инструментов текстового анализа становится не вопросом выбора, а вопросом времени. Ручная обработка новостей уже не отвечает современным вызовам: один исследователь физически не способен охватить массив из тысяч сообщений в сутки и увидеть полную картину. Только машинное обучение и методы обработки естественного языка обеспечивают необходимый масштаб и аналитическую глубину.

Развитие локальных технологий позволит использовать огромный массив казахстанских новостных данных как практический инструмент для мониторинга общественных настроений, выявления ключевых тем, а также для улучшения прогнозно-аналитических моделей и выстраивания эффективной коммуникации государства с обществом.

Отметимданные собирались автоматически — веб-скрейпингом — с очисткой: удалялись технические шумы, дубликаты, очень короткие тексты; источники унифицировались по названиям. В выборку входят 18 изданий, освещающих деловую и общественно-экономическую повестку.

При работе с материалами Центра деловой информации Kapital.kz разрешено использование лишь 30% текста с обязательной гиперссылкой на источник. При использовании полного материала необходимо разрешение редакции.

Вам может быть интересно

    Читайте Kapital.kz в

    TelegramInstagramFacebook
    telegram