Анонимизация данных - Data anonymization

Анонимизация данных это тип дезинфекция информации чье намерение защита конфиденциальности. Это процесс удаления личная информация из наборы данных, так что люди, которых описывают данные, остаются анонимный.

Обзор

Анонимизация данных была определена как «процесс, посредством которого личные данные необратимо изменяются таким образом, что субъект данных больше не может быть идентифицирован прямо или косвенно ни одним оператором данных, ни в сотрудничестве с любой другой стороной». [1] Анонимизация данных может позволить передачу информации через границу, например, между двумя отделами внутри агентства или между двумя агентствами, при одновременном снижении риска непреднамеренного раскрытия информации и в определенных средах таким образом, чтобы обеспечить постанонимизацию оценки и аналитики.

В контексте медицинские данные, анонимные данные относятся к данным, по которым пациент не может быть идентифицирован получателем информации. Имя, адрес и полный почтовый индекс должны быть удалены вместе с любой другой информацией, которая в сочетании с другими данными, хранящимися у получателя или раскрытыми им, может идентифицировать пациента.[2]

Всегда существует риск того, что анонимные данные не останутся анонимными с течением времени. Соединение анонимного набора данных с другими данными, умные методы и грубая мощь - вот некоторые из способов деанонимизации ранее анонимных наборов данных; Субъекты данных больше не анонимны.

Деанонимизация - это обратный процесс, при котором анонимные данные подвергаются перекрестным ссылкам с другими источниками данных для повторной идентификации источника анонимных данных.[3] Обобщение и возмущение - два популярных подхода к анонимизации реляционных данных.[4] Процесс скрытия данных с возможностью их повторной идентификации позже также называется псевдонимизация и односторонние компании могут хранить данные таким образом, чтобы HIPAA совместимый.[5]

Существует пять типов операций анонимизации данных: обобщение, подавление, анатомизация, перестановка и возмущение.[6]

Требования GDPR

В Евросоюз новый Общие правила защиты данных (GDPR) требует, чтобы хранимые данные о людях в ЕС подвергались либо анонимизации, либо псевдонимизация процесс.[7] GDPR Recital (26) устанавливает очень высокую планку того, что представляют собой анонимные данные, тем самым освобождая данные от требований GDPR, а именно: «… информация, которая не относится к идентифицированному или идентифицируемому физическому лицу или к личным данным, которые становятся анонимными в таких таким образом, чтобы субъект данных не был или больше не идентифицируем ". Европейский надзорный орган по защите данных (EDPS) и испанское агентство Agencia Española de Protección de Datos (AEPD) выпустили совместное руководство, касающееся требований анонимности и освобождения от требований GDPR. Согласно EDPS и AEPD, никто, включая контролера данных, не должен иметь возможность повторно идентифицировать субъекты данных в должным образом анонимизированном наборе данных. [8] Исследования специалистов по данным[9] в Имперском колледже в Лондоне и Католическом университете Лувена в Бельгии, а также на решение судьи Михала Агмон-Гонена из окружного суда Тель-Авива,[10] выделить недостатки «анонимизации» в современном мире больших данных. Анонимизация отражает устаревший подход к защите данных[11] он был разработан, когда обработка данных была ограничена изолированными (разрозненными) приложениями, до того, как стала популярной обработка «больших данных», предполагающая широкое распространение и объединение данных.

Смотрите также

Рекомендации

  1. ^ ISO 25237: 2017 Медицинская информатика - Псевдонимизация. ISO. 2017. с. 7.
  2. ^ «Анонимизация данных». Бесплатный медицинский словарь. Получено 17 января 2014.
  3. ^ «Деанонимизация». Whatis.com. Получено 17 января 2014.
  4. ^ Бинь Чжоу; Цзянь Пей; WoShun Luk (декабрь 2008 г.). «Краткий обзор методов анонимизации для публикации данных социальных сетей с сохранением конфиденциальности» (PDF). Информационный бюллетень ACM SIGKDD Explorations Newsletter. 10 (2): 12–22. Дои:10.1145/1540276.1540279. S2CID  609178.
  5. ^ «Деидентификация данных - более простой способ соответствия HIPAA». Truevault. TrueVault.
  6. ^ Эйюпоглу, Джан; Айдын, Мухаммед; Заим, Абдул; Сертбас, Ахмет (17 мая 2018 г.). «Эффективный алгоритм анонимизации больших данных, основанный на методах хаоса и возмущений». Энтропия. 20 (5): 373. Дои:10.3390 / e20050373. ISSN  1099-4300. CC-BY icon.svg Текст был скопирован из этого источника, который доступен под Международная лицензия Creative Commons Attribution 4.0.
  7. ^ Наука о данных в соответствии с GDPR с псевдонимизацией в конвейере данных Опубликовано Dativa, 17 апреля 2018 г.
  8. ^ «ВВЕДЕНИЕ В ХЕШ-ФУНКЦИЮ КАК МЕТОД ПСЕВДОНИМИЗАЦИИ ПЕРСОНАЛЬНЫХ ДАННЫХ» (PDF).
  9. ^ «Ваши данные были« анонимными »? Эти ученые все еще могут идентифицировать вас».
  10. ^ "Attm (TA) 28857-06-17 Ассоциация медицинских сестер против Министерства обороны".
  11. ^ «Данные могут быть получены из-за устаревшего израильского закона о конфиденциальности, - заявляет аналитический центр».

дальнейшее чтение

  • Рагхунатан, Баладжи (июнь 2013 г.). Полная книга по анонимизации данных: от планирования до реализации. CRC Press. ISBN  9781482218565.
  • Халед Эль-Эмам, Люк Арбакл (август 2014 г.). Анонимизация данных о здоровье: примеры из практики и методы для начала работы. O'Reilly Media. ISBN  978-1-4493-6307-9.
  • Рольф Х. Вебер, Ульрике И. Генрих (2012). Анонимизация: SpringerBriefs в кибербезопасности. Springer. ISBN  9781447140665.
  • Арис Гкулалас-Диванис, Григориос Лукидес (2012). Анонимизация электронных медицинских записей для поддержки клинического анализа (SpringerBriefs in Electrical and Computer Engineering). Springer. ISBN  9781461456674.
  • Пит Уорден. «Почему вы не можете действительно анонимизировать свои данные». O'Reilly Media, Inc. Архивировано с оригинал 9 января 2014 г.. Получено 17 января 2014.

внешняя ссылка