Как оптимизировать работу колл-центров?
Стартапер Ануар Шарафудинов рассказал, как с помощью искусственного интеллекта трансформировать голосовые сообщения в текстВ настоящее время колл-центры крупных банков и компаний обрабатывают в день несколько тысяч звонков. На анализ этой информации может уходить несколько месяцев. Идея решить данную проблему пришла стартаперу Ануару Шарафудинову в конце 2018 года. Он со своей командой разработал систему, которая помогает более оперативно обрабатывать информацию по звонкам, поступающим в колл-центр. С помощью сервиса AILabs Speech Analytics вся голосовая информация в режиме реального времени трансформируется в текстовую. В результате можно анализировать звонки колл-центра по ключевым словам и мониторить эмоциональные звонки. Корреспондент «Капитал.kz» поговорил со стартапером и узнал, сколько стоит система по распознаванию голоса и какие языки ей под силу.
Ануар Шарафудинов
- Ануар, как к вам пришла идея разработать сервис по распознаванию голосовых звонков?
- Наша команда из восьми человек начала работать над проектом полгода назад. Ранее у нас уже был опыт построения систем на основе машинного обучения (это составляющая искусственного интеллекта). Дело в том, что у нас в научном центре при Назарбаев Университете был проект с Министерством финансов РК по выявлению неблагонадежных заемщиков на основе машинного обучения.
В целом же, идея по построению собственной модели, которая распознавала бы голосовые треки и моментально переводила их в письменные данные, возникла в конце 2018 года. По нашей информации, на тот момент многие колл-центры Казахстана не имели программного обеспечения, которое помогало бы им оперативно анализировать огромный массив данных. Известно, что зачастую в крупные колл-центры банков, сотовых операторов в день может поступать несколько тысяч звонков. Для того чтобы обработать эту голосовую информацию, компаниям приходится тратить несколько месяцев и огромные бюджеты. При этом обработка таких данных требует больших трудовых ресурсов. К тому же немаловажно, что аналитики банка при работе с голосовыми сообщениями колл-центра могут проанализировать только случайную выборку звонков, – как правило,до 10%от общего числа обращений. В результате данная аналитика не дает полной, объективной картины о поступающих обращениях, проблемах клиентов и соответственно о проблемах банка.
- Расскажите подробнее, как работает ваша система?
- Наша система по распознаванию речи интегрируется с системой для записи звонков, которые поступают в колл-центры. Далее записанные треки сохраняются на сервере компании, после наша система подключается к серверу и скачивает аудиозаписи. На следующем этапе происходит обработка трека с помощью технологии машинного обучения, и «голос» переводится в текстовую информацию. Уточню, наша система может практически в режиме реального времени распознавать как русскую, так и казахскую речь.
- Как ваша система помогает организациям, банкам, где есть колл-центры?
- Во-первых, за счет нашей системы компании смогут сэкономить огромную часть бюджета на аналитике звонков, поступающих в колл-центры. Во-вторых, анализировать обращения, поступающие в колл-центры, становится легче за счет различных модулей.
У нас есть три модуля, которые рассчитаны на распознавание и анализ разного рода информации.
С помощью первого модуля можно выявлять эмоциональные звонки, где есть какие-то жалобы на работу компании, жалобы на качество работы ее персонала, услуг. Такие звонки можно выявлять через ключевые слова. Эти «слова-маячки» может установить непосредственно организация, банк. Это очень удобно, потому что можно оперативно находить недочеты в работе организации. Также можно оперативно выявлять, на каких операторов чаще всего поступают жалобы – соответственно можно будет оценить качество работы персонала колл-центра. К тому же за счет анализа жалоб, касающихся продуктов и услуг, можно определить, какой продукт непонятен для клиента. Например, если в колл-центр поступают вопросы, как начисляются проценты по кредиту, как действует бонусная система или какой-то тарифный план, то это говорит о том, что условия по продукту (депозиту, кредиту) непонятны для клиента. И, возможно, условия по продуктам стоит сделать более понятными или даже пересмотреть.
Второй модуль помогает определять трендовые вопросы, то есть вопросы, которые наиболее часто интересуют клиентов колл-центра. За счет этого компания сможет понять, на какие продукты наблюдается наибольший спрос и масштабировать их, сделать условия по ним более привлекательными. Кстати, если по каким-то продуктам в колл-центр поступает много вопросов, то, возможно, информация на корпоративном сайте по ним отображена не в полной мере.
Третий модуль рассчитан на выявление данных, насколько оператор колл-центра следует скриптам (инструкциям) при беседе с клиентами колл-центра. А именно, поприветствовал ли клиента при поступлении звонка, переключил ли на нужного специалиста при получении вопроса, касающегося погашения кредита, и так далее.
Подытожу, с помощью речевой аналитики организации могут выявить свои проблемы, повысить доходы за счет роста эффективности продаж, скорректировать рекламную кампанию, повысить удовлетворенность клиентов.
- Сколько стоит каждый из модулей?
- Если компании требуется только распознавать голосовые сообщения и самостоятельно анализировать эти данные, то такая опция обойдется в 500 тыс. тенге в месяц. Первый и второй модули стоят по 300 тыс. тенге каждый, третий – 400 тыс. тенге в месяц.
- Насколько мне известно, в США также есть аналогичные системы по распознаванию речи.
- Действительно, в США и России есть программы, которые преобразовывают голосовые сообщения в текстовую информацию. Когда мы работали над проектом, мы увидели, что одна из американских компаний предлагает софт по распознаванию речи, технически подобный нашему. На тот момент такой софт обходился организациям в сумму от $500 тыс. до 1 млн за лицензию. Это очень большая сумма для малого и среднего бизнеса.
Уточню, компания разово платит минимум $500 тыс. за американскую лицензию, устанавливает программное обеспечение, но есть риск, что продукт может не оправдать ее ожиданий. Между тем, наша модель подписки работает таким образом, что компания может подписаться на продукт, и если он ей не понравится – она может закрыть подписку. Таким образом, ей не нужно тратить несколько сот тысяч долларов на лицензию.
- Какие проблемы у вас возникали при работе над проектом? Ведь у всехклиентов, которые звонят в колл-центр, разная речь: у кого-то быстрая, у кого-то нечеткая, и, думаю, что это усложнило работу над проектом. И, возможно, были трудности с казахской речью.
- Наш модуль распознает так называемый шала казахский язык: это когда в казахской речи присутствуют также и русские слова, фразы. При работе над проектом этот нюанс создал для нас определенные сложности: ведь систему нужно было настроить так, чтобы она одновременно распознавала два языка. Например, бывает так, что модель распознает русскую речь как казахскую. Хотя человек ни разу не произносил ни одного слова на казахском языке. Матрица системы пока не совершенна, вероятность ошибки в работе модулей составляет до 20%. Но мы работаем над снижением этого уровня риска.
Еще она проблемы – мы работали над тем, чтобы система могла аккумулировать как можно больше данных. Уточню, для того чтобы запустить нашу систему по распознаванию голосовой речи, мы проанализировали треки продолжительностью 100 часов. Это огромный массив данных, на разметку информации потребовалось несколько месяцев.
- Сколько средств было инвестировано в проект? Это были ваши личные вложения или вам помог бизнес-ангел?
- В 2018 году наш стартап участвовал в программе международной акселерации Startup Kazakhstan, TechGarden, по которой мы получили $20 тыс. Часть этих средств была вложена в наш проект.
- Сколько клиентовуже пользуется вашей системой по распознаванию речи?
- В настоящее время мы внедряем нашу систему в двух финорганизациях. Пока активные переговоры ведутся с двумя компаниями.
- Есть ли у вас потребность в инвестициях?
- Да, сейчас мы находимся в поиске инвестора, который бы вложился и в продвижение нашего проекта, и в его совершенствование. Сейчас технические возможности нашего проекта могут покрывать потребности только четырех клиентов. Если же у нас появятся инвесторы, то мы сможем привлекать больше компаний для обслуживания. Мы не намерены останавливаться на казахстанском рынке, планируем внедрить наш проект на рынке США. Мы уже сотрудничали с крупной американской компанией по одному из наших проектов, который работал на основе искусственного интеллекта.
При работе с материалами Центра деловой информации Kapital.kz разрешено использование лишь 30% текста с обязательной гиперссылкой на источник. При использовании полного материала необходимо разрешение редакции.