Яндекс Казахстан в 2024 году запустит языковую модель YandexGPT, которая умеет писать и перерабатывать тексты на казахском языке, запоминать ход беседы и отвечать на уточняющие вопросы пользователя. YandexGPT станет первой публичной генеративной нейросетью, специально обученной понимать и говорить на казахском языке.
Нейросеть будет доступна пользователям через виртуального ассистента в приложении Яндекс, а также в Поиске и Яндекс Браузере. Пользователи смогут общаться с нейросетью, как с живым собеседником. Например, она сможет дать совет, объяснить ребёнку сложную тему простыми словами, придумать идею для рекламы или написать пост для соцсетей.
Также на облачной платформе Yandex Cloud планируется запуск коммерческой версии YandexGPT на казахском для бизнеса. Она позволит казахстанским компаниям и разработчикам развивать продукты и сервисы на основе генеративных нейросетей. Например, с помощью YandexGPT они смогут анализировать отзывы пользователей, создавать тексты по шаблонам для рассылок и запускать чат-ботов для службы поддержки.
За основу была взята базовая модель YandexGPT. Для её дообучения на первом этапе были подготовлены сотни тысяч запросов и ответов на казахском языке, охватывающих различные темы и контексты бесед. Это обеспечивает модели необходимую основу для понимания языка и культурного кода.
В обучении нейросети участвуют AI-тренеры Яндекс Казахстан. Они оценивают ответы нейросети — точность, полноту, фактическую правильность, грамматику и стиль — и пишут эталонные запросы и ответы на казахском языке. Затем на них обучают нейросеть и таким образом повышают точность её ответов.