Искусственный интеллект учат предсказывать заболевания и решать проблему старения
Искусственный интеллект уже научился определять некоторые заболеванияИскусственный интеллект уже научился определять некоторые заболевания быстрее стандартных методов диагностики. Медицина накопила огромный объем информации о причинах и течении самых разных заболеваний. Анализ этих больших данных может существенно помочь врачам в работе. Например, возможность предсказать вероятность развития сердечно-сосудистых заболеваний за несколько месяцев до их проявления может спасти сотни тысяч жизней. Именно это пытаются сделать участники хакатона, который проводит Республиканский центр электронного здравоохранения Минздрава РК при содействии компаний Insilico Medicine и Mail.Ru Group. Это первый хакатон на территории стран ЕАЭС, участники которого пытаются применить технологии машинного обучения в поисках решений обеспечения долголетия и здоровья.
Как отметил основатель Insilico Medicine Александр Жаворонков, «предсказание возраста при выборке разнообразных типов данных с помощью глубоких нейросетей — первый шаг к созданию биологически значимых биомаркеров старения и состояния здоровья. В этом проекте мы хотели бы увидеть свежие идеи и подходы при выборке в 100 тысяч человек с небольшим количеством параметров и выявить чемпионов в машинном обучении, которым интересно решать такие вопросы».
Конкурс проводится на ML BootCamp — площадке по машинному обучению от Mail.Ru Group. Он стартовал 15 июня, и уже в эту субботу будут подведены его итоги.
«Перед участниками стоит задача предсказать вероятность риска сердечно-сосудистых заболеваний у пациента по 11 параметрам, используя предоставленную выборку из 100 тысяч реальных клинических анализов. Кроме того, часть признаков с субъективными факторами (активность курения, употребление алкоголя и интенсивность физических нагрузок) в нашей выборке мы намеренно скрыли для некоторых пациентов. А это значит, что участникам нужно будет либо определить эти данные по объективным параметрам, либо учитывать их лишь в связке с остальными параметрами пациента», — рассказывает Ольга Августан, руководитель образовательных проектов Mail.Ru Group.
Эти данные нужно представить в машиночитаемом виде, то есть удобном для того, чтобы применять к ним алгоритмы машинного обучения.
Как пояснил «Капитал.kz» Олжас Абишев, и.о. генерального директора Республиканского центра электронного здравоохранения Минздрава РК, сейчас министерство использует более 20 информационных систем на портальном решении для сбора и обработки медицинской информации. Это вся информация об оказанных медицинских услугах в рамках государственного объема бесплатной медицинской помощи населению РК, это более 11 терабайтов данных. Цель хакатона — используя обезличенные данные (деперсонафицированные), проанализировать с помощью алгоритмов и машинного обучения предположительную продолжительность жизни, а также факторы, влияющие на качество и продолжительность жизни.
Чтобы победить, участнику необходимо создать работающую модель определения вероятности риска сердечно-сосудистых заболеваний, используя базу клинических анализов. «Мы выбрали функцию логарифмических потерь в качестве метрики, это поощряет точное предсказание и наказывает за ошибку, так что от полученной модели мы ожидаем прежде всего стабильности работы. В техническом же плане участники вольны выбирать любой подходящий инструментарий, любые эвристики и методы», — объясняет Ольга Августан.
Важно, что решения, которые предложат победители хакатона, не просто теоретические, скоро они могут действительно стать доступными на практике. «Конечно, все будет зависеть от сложности архитектуры решений, но на основе предыдущих хакатонов, которые мы проводили в конце мая 2017 года, можем сказать, что сроки внедрения — от 2 месяцев до 1 года», — говорит Олжас Абишев.
Практика показывает, что решения, полученные в ходе подобных чемпионатов, не идут в работу «как есть». Их ценность заключается не в программном коде, а в идеях и методиках, которые придумывают и используют участники для достижения цели. Если же говорить о важности соревнования в целом, это возможность заинтересовать широкий круг IT-специалистов реальной проблемой в смежной для них области. «Если по итогам соревнования кому-то из апологетов отрасли data science захочется применить свой талант в сфере медицины, то я буду считать, что чемпионат удался и принес пользу», — считает Ольга Августан.
В любом случае предсказать и заняться профилактическими мерами, выбирать индивидуальную терапию всегда лучше и легче, чем лечить запущенное заболевание. Как шутят врачи, отделение экстренной медицинской помощи — это последнее место, где хотелось бы узнать о наличии сердечной недостаточности. И все мы надеемся, что технологии машинного обучения помогут избежать такого развития событий.
AgeHack@MLBootCamp — индивидуальное соревнование. На данный момент решения прислали 600 человек. По опыту предыдущих ML BootCamp можно сказать, что традиционно около 70% участников присоединяются с самого начала соревнования, а остальные 30% - в первые выходные после «экватора» чемпионата, когда ровно половина выделенного участникам времени истекла. В нашем чате в мессенджере чемпионат обсуждают более 950 человек. Всего за этот чемпионат участники загрузили более 12,5 тыс. решений
В мае этого года Республиканский центр электронного здравоохранения провел хакатон «Мобильная медицина», в котором приняли участие 24 команды из 6 городов Казахстана. Конкурсанты представили логически завершенные прототипы мобильных приложений.
По данным Американской ассоциации кардиологов, каждый год около 23 млн человек по всему миру страдают от сердечной недостаточности. Эта болезнь поражает человека в тот момент, когда его сердечная мышца ослаблена и не может эффективно перекачивать достаточно крови и кислорода в органы человека. Половина диагностируемых умирает в течение пяти лет.
При работе с материалами Центра деловой информации Kapital.kz разрешено использование лишь 30% текста с обязательной гиперссылкой на источник. При использовании полного материала необходимо разрешение редакции.