«Хакеры взломали американский банк Capital One и получили доступ к данным более 100 млн клиентов», «Facebook заплатил штраф в 5 млрд долларов», «Kazakhstan government is now intercepting all HTTPS traffic» – новости, прогремевшие в медиапространстве только за последнюю неделю. Если сделать выборку за год, окажется что мир практически каждый день обсуждает вопросы персональных данных. И не только обсуждает, а предпринимает серьезнейшие меры по их защите. Принятый в 2016 году в Европе GDPR (Общий регламент по защите данных) – важнейший труд и наиболее продвинутый в мире подход к вопросу. Что же такое персональные данные и почему их защита вдруг стала такой актуальной?
Классическое определение гласит: «Персональные данные – любая информация, относящаяся к определенному или определяемому на основании такой информации физическому лицу». Если перевести на обычный язык – любая информация, прямо связанная с вами, или та, по которой можно установить вашу личность. То есть листок с вашими анализами в больнице – не персональная информация, если на нем не стоит ваше имя. Как только имя вписано – информация становится персональной, и ее нужно защищать. Под это определение подпадает масса всего. Начиная от всех фотографий с вашим участием, заканчивая банковскими транзакциями. В общем-то, такая информация существовала и раньше, но вопрос ее защиты встал остро довольно недавно. Почему так произошло? Сыграли роль два фактора. Первый – стремительная цифровизация всех документов, реестров и баз данных. Например, раньше, допустим, информация о вашем адресе хранилась в бумажной картотеке, и для того чтобы ее найти, даже сотрудник, имеющий доступ, тратил достаточно времени. Помните очереди за справкой в адресный стол? Теперь же это компьютерная база данных с мгновенным доступом. И, мало того, база данных, имеющая выход в интернет. Поэтому теперь в случае проблем с безопасностью данные о вашем адресе может узнать не просто любопытный архивариус, а любой из сотен миллионов пользователей сети Интернет. Это самое простое свойство цифровых данных. Второй фактор сложнее. Данные, содержащиеся в разных базах, можно сопоставлять друг с другом и анализировать. Анализ может быть вполне невинный, например, поисковые системы в интернете на основе ваших запросов могут предложить рекламу. А может быть и вполне серьезный. Анализ ваших банковских транзакций может дать информацию о ваших доходах, какие заведения вы посещаете, на основе анализа платежей можно выявить вашу связь с другими людьми (вы платите за телефон своим детям?) или с объектами недвижимости (по коммунальным платежам). Анализ медицинской информации или даже информация о покупке билетов (с кем это вы ехали в прошлом месяце в спальном купе?) может дать повод для шантажа или даже позволит признать вас недееспособным и лишить активов.
Одним из популярных методов снизить риски при хранении и анализе информации является ее обезличивание. То есть мы берем все тот же список транзакций, например, но убираем из него данные владельцев. Анализируя такой список, мы можем получить примерное представление о среднем портрете нашего клиента, способе, которым клиенты использует наши продукты, ну и так далее. В случае медицинской информации мы узнаем данные о динамике заболеваемости, группах риска, возможно, пресечем эпидемию на этапе развития. Казалось бы, отличное решение. Такие данные можно не только анализировать, но и передавать другим для анализа, не рискуя потерять персональные данные. Но тут проскальзывает еще один заголовок, тоже буквально с прошлой недели: «Мнимая анонимность. Безымянные данные в интернете позволяют идентифицировать любого человека». В статье идет речь о том, что, сопоставив несколько показателей из обезличенной базы данных, можно с высокой точностью вычислить личность человека. Достаточно всего трех полей, для того чтобы резко ограничить круг искомых лиц. И 15 – для полной идентификации. Что-то подобное умеет и Google – анализируя информацию о структуре поиска, какие сайты вы посещаете, те видеоролики, которые вы смотрите в YouTube, и то, как на них реагируете, – поисковая система с высокой вероятностью может определить кто вы, даже если вы не залогинились в систему.
Многие скажут: «Мои данные никому не интересны, пусть смотрят». Но и это не всегда так. Приведу пример с известным интернет-мемом. Никому не известный ранее электрик из Подмосковья, попав на свадебную фотографию в роли свидетеля, стал известен гораздо больше, чем многие поп-звезды. По запросу «свидетель из Фрязино» вы найдете сотни тысяч страниц в интернете, в том числе и вне русскоговорящего сегмента Сети. Говорят, он пытался обращаться в издания, с тем чтобы «его фото убрали из интернета», и, если бы он жил после 2016 года в Европе, по нормам GDPR, интернет-ресурсы вынуждены были бы приложить все усилия для реализации его «права на забвение». Однако он жил и умер в России, прожив последние годы в не самой комфортной психологической обстановке.
Поэтому, когда государственный орган заявляет о том, что он собирается перлюстрировать весь интернет-трафик целой страны «в целях безопасности граждан, такое утверждение вызывает серьезные сомнения в целесообразности и тем более безопасности данного мероприятия. А его возможные последствия вызывают серьезную озабоченность.
Автор: Константин Пак, директор Центра по развитию финансовых технологий и инноваций Ассоциации финансистов Казахстана (АФК)