Говорят, если данные — это новая нефть, то машинное обучение — нефтеперерабатывающий завод. Если научиться правильно анализировать тот колоссальный объем данных, которые накопили компании, можно революционно повысить скорость и эффективность всех бизнес-процессов. Уже сейчас, по данным исследования MIT Technology Review и Google Cloud, 60% компаний по всему миру в том или ином виде используют машинное обучение в своем бизнесе. В числе первых, конечно, технологические компании и телеком-структуры, финансы и ретейл.
Как это работает? Самый понятный и простой пример — персонализированные рекламные рассылки или результаты поиска, адаптированные под историю ваших просмотров. Или рекомендации, которые вы видите в интернет-магазинах. Например, недавно российский бренд одежды Rafinad запустил алгоритм подбора «идеального платья» на основе машинного обучения. Система анализирует фото в соцсетях и выдает варианты нарядов, которые будут максимально соответствовать индивидуальным предпочтениям.
О том, что за такими технологиями будущее клиентского бизнеса, понимают и в Казахстане. В нашей стране больше стоит вопрос кадров, которые могут разрабатывать и внедрять такие технологии. Студенты ведущих казахстанских технических вузов уже начинают пробовать себя в таких проектах, а IT-компания DAR с удовольствием поддерживает молодые таланты. В компании создан проект DAR Lab, где студенты имеют возможность пройти практическое обучение и попасть на стажировку.
«Мы видим очень много талантливых студентов, математиков. На нашем рынке в принципе очень мало специалистов по машинному обучению и большим данным. Мы с этим столкнулись и решили пойти в университеты, объявить конкурс, посмотреть, где есть потенциал. Оказалось, что ребятам это интересно», — рассказал Болат Садыкулов, руководитель R&D направления компании DAR.
Недавно в DAR Lab закончили месячное обучение по самым разным направлениям — от backend до UI/UX — 25 студентов из ведущих технических вузов страны — КБТУ, СДУ и МУИТ. Десять из них осваивали направление Machine Learning и участвовали в конкурсе проектов по машинному обучению.
Пять команд по двое участников в течение месяца проходили обучение, у каждой из них был свой ментор-наставник, который помогал им на протяжении всего конкурса, но итоговые решения участники принимали сами. Для разработки собственных проектов всем командам были выданы индивидуальные задания, направленные на решение конкретной бизнес-задачи. «Ребята — молодцы, ответственно подошли к своим заданиям, которые, кстати, были достаточно сложными. Хотя команды и работали с ограниченной выборкой данных, но они тем не менее уже решали прикладные задачи — рекомендательные модули, лояльность, кроулинг. Пока эти проекты — больше теория. Но мы точно будем двигаться в данном направлении», — отметил Игорь Рыбаков, главный IT-архитектор компании DAR.
Команды представили пять проектов:
— модели по рекомендательным системам для стриминговых аудио- и видеосервисов;
— исследование в области рекомендательных систем для площадок электронной коммерции;
— агент-бот, оценивающий стоимость недвижимости относительно квартир;
— градация клиентов и расчет кредитной ставки по продукту CreditOn;
— создание собственных кроулеров по сбору информации по казахстанским пользователям в социальных сетях.
Первое место и поездку в «Сколково» выиграли Муслим Бейбитулы и Санжар Амиржан, которые занимались разработкой модели по рекомендательным системам для стриминговых аудио- и видеосервисов. Что это значит на практике? «Допустим, вы посмотрели фильм с Чаком Норрисом. И сразу видите рекомендации сервиса для вас: это боевики или еще фильмы с этим актером. Мы пытаемся сделать рекомендации более умными, чтобы они учитывали больше параметров и подбирали идеальные для вас варианты», — рассказали победители.
Второе место заняли Асхат Темiр и Маулен Кемалов, которые занимались созданием кроулеров по сбору информации. На третьем месте оказались ребята, разработавшие агент-бот для оценки недвижимости.
По итогам конкурса команды, занявшие первое и второе место, были награждены трехдневным обучением в стартап-академии «Сколково», где посетили лекции по машинному обучению и основам запуска стартапов. Остальные участники получили денежные призы, всем участникам также было предложено пройти оплачиваемую стажировку в DAR.
«Получение и применение новых знаний, на наш взгляд, это самая лучшая награда для молодых и подающих большие надежды программистов», — говорит Айнур Бекдаирова, руководитель DAR Lab.
Салтанат Тажибаева, разработчик по данным, рассказывает, что на самом деле месяца недостаточно для того, чтобы узнать и понять, что такое машинное обучение и большие данные. Но однозначно высоко оценивает математическую подготовку ребят.
По словам Болата Садыкулова, machine learning для компаний пока все-таки больше наука, такие проекты начнут приносить деньги через несколько лет, но даже сейчас видны их огромный потенциал и большие перспективы, а молодые кадры могут ускорить этот процесс.
Data Science — область исследования, изучающая проблемы анализа, обработки представления данных в цифровой форме.
Machine Learning — обширный подраздел искусственного интеллекта, изучающий методы построения моделей, способных обучаться, и алгоритмов для их построения и обучения.