Big Data technologies: challenges and opportunities
Big Data technologies: challenges and opportunities
Abstract
The article analyses the challenges and opportunities emerging in relation to the development of big data technologies in the context of legal regulation. The author examines the problem of correlation between the legal regulation of personal data and the realities of the digital era, characterized by an exponential growth in the volume of processed information. The paper highlights the key features of big data, analyses the contradictions between the use of these technologies and the basic principles of personal data legislation. Special attention is paid to the comparative analysis of approaches to the regulation of big data in Russia, the EU, the USA and China. The author concludes that it is necessary to develop legal regulation taking into account international experience and national peculiarities, suggesting a number of possible directions for improving the legislation.
1. Введение
Проблематика «больших данных» (big data) имеет долгую историю в естественных науках, восходящую к первой половине ХХ века . Однако в сфере права эта тема приобрела особую актуальность лишь в конце XX века, после начала масштабной обработки персональных данных машинным способом и в связи с принятием Шенгенского соглашения (1985).
Несмотря на то, что во многих странах, включая Россию, уже приняты законы о персональных данных, значительный круг вопросов все еще нуждается в глубоком исследовании. Актуальность темы обусловлена стремительным развитием технологий обработки данных, которые создают новые вызовы для существующих правовых механизмов защиты персональных данных и прав граждан
.В данной работе мы сосредоточимся на публично-правовых аспектах регулирования больших данных, анализируя существующие нормативные акты и выявляя пробелы в правовом регулировании. Особое внимание будет уделено поиску баланса между защитой прав субъектов данных и потребностями общества в использовании новых технологий.
2. Методы и принципы исследования
В ходе исследования применяется комплекс общенаучных и специальных юридических методов. Ключевое значение имеет технико-юридический (формально-догматический) метод, позволяющий провести детальный анализ нормативно-правовых актов в сфере регулирования больших данных и персональной информации в различных юрисдикциях
.Сравнительно-правовой метод используется для сопоставления подходов к регулированию больших данных в различных правовых системах. В частности, проводится комплексный анализ законодательства Европейского Союза (Общий регламент по защите данных – GDPR), США (секторальный подход и федеральные законы), Китая (Закон о защите персональных данных) в сравнении с российским законодательством
.Системный подход обеспечивает рассмотрение проблемы правового регулирования больших данных в контексте взаимосвязанных технологических, экономических и социальных факторов. Это особенно важно при анализе различных моделей регулирования, от саморегулирования отрасли в США до активного государственного вмешательства в Китае
.Метод правового моделирования применяется для прогнозирования возможных путей развития российского законодательства в сфере больших данных с учетом международного опыта и национальных особенностей
.Исследование опирается на ряд фундаментальных принципов, включая принципы объективности, научности, системности и междисциплинарности. Последний принцип особенно важен, учитывая необходимость привлечения знаний из области информатики, экономики и социологии для всестороннего анализа проблемы
.3. Исторический контекст и определение больших данных
Термин «большие данные» (big data) имеет долгую историю в естественных науках. Еще в первой половине ХХ века ученые сталкивались с проблемой обработки огромных объемов данных. Например, в работе Коуинга и ДеАмичиса (1948) упоминаются трудности, связанные с подсчетом большого количества измерений при исследовании радиоактивных изотопов .
В области компьютерных наук проблема больших данных стала активно обсуждаться с 1970-х годов. Янцен (1973) отмечал сложности в обработке больших массивов данных в экологических исследованиях
. Барк (1981) рассматривал роль инженерных решений в обработке растущих объемов данных в контексте автоматизации . Важный вклад в концептуализацию проблемы больших данных внесли Кокс и Эллсворт (1997), которые одними из первых использовали термин "big data" в современном понимании .В правовой сфере актуальность темы больших данных возросла в 1980-х годах, что было связано с началом масштабной машинной обработки персональных данных и принятием Шенгенского соглашения (1985). Это соглашение предусматривало создание общей информационной системы для обмена данными между странами-участницами, что породило новые правовые вызовы в области защиты персональных данных
.В настоящее время под большими данными в правовом контексте понимается, согласно Стратегии развития информационного общества в Российской Федерации на 2017-2030 годы, «совокупность подходов, инструментов и методов автоматической обработки структурированной и неструктурированной информации, поступающей из большого количества различных, в том числе разрозненных или слабосвязанных, источников информации, в объемах, которые невозможно обработать вручную за разумное время».
4. Правовые аспекты регулирования больших данных
Несмотря на принятие во многих странах законов о персональных данных, правовое регулирование больших данных сталкивается с рядом вызовов. Основные проблемы связаны с необходимостью обеспечения баланса между использованием инновационных технологий и защитой прав субъектов данных
.Принцип ограничения цели обработки. Законодательство о персональных данных требует, чтобы обработка данных осуществлялась для заранее определенных и законных целей. Однако технологии больших данных часто предполагают использование информации для целей, которые могли быть неизвестны на момент сбора данных. Это создает правовую неопределенность и требует пересмотра традиционных подходов к регулированию.
Минимизация данных vs. максимизация данных. Принцип минимизации данных, закрепленный в законодательстве, вступает в противоречие с логикой больших данных, которая предполагает сбор максимально возможного объема информации для выявления скрытых закономерностей. Необходимо найти правовые механизмы, позволяющие реализовать потенциал больших данных без нарушения прав субъектов
.Проблема информированного согласия. Традиционная модель получения информированного согласия на обработку персональных данных оказывается неэффективной в контексте больших данных. Субъекты данных часто не могут предвидеть все возможные способы использования их информации. Требуется разработка новых правовых конструкций, обеспечивающих защиту прав субъектов в условиях неопределенности.
Обеспечение прозрачности алгоритмов. Использование сложных алгоритмов машинного обучения для анализа больших данных создает проблему «черного ящика», когда процесс принятия решений становится непрозрачным. Это затрудняет реализацию права субъектов на объяснение логики автоматизированных решений, затрагивающих их права и законные интересы
.5. Сравнительный анализ регулирования больших данных в России и за рубежом
Для более полного понимания особенностей правового регулирования больших данных в России целесообразно провести сравнительный анализ с подходами, принятыми в других странах.
5.1. Европейский Союз
В ЕС ключевым нормативным актом в сфере защиты данных является Общий регламент по защите данных (GDPR), вступивший в силу в 2018 году. GDPR устанавливает более строгие требования к обработке персональных данных, чем российское законодательство:
1. Вводит понятие «псевдонимизации» данных как способа снижения рисков для субъектов данных.
2. Закрепляет «право на забвение» и право на переносимость данных.
3. Устанавливает высокие штрафы за нарушения (до 20 млн евро или 4% годового оборота компании).
В отличие от российского законодательства, GDPR напрямую затрагивает вопросы больших данных, устанавливая особые требования к профилированию и автоматизированному принятию решений.
5.2. США
В США отсутствует единый федеральный закон о защите персональных данных. Вместо этого действует секторальный подход:
1. Закон о переносимости и подотчетности медицинского страхования (HIPAA) регулирует защиту медицинских данных.
2. Закон Грамма-Лича-Блайли регулирует защиту финансовой информации.
3. Закон о защите конфиденциальности детей в интернете (COPPA) защищает данные детей.
В отношении больших данных в США преобладает подход саморегулирования отрасли. Федеральная торговая комиссия США выпустила рекомендации по использованию больших данных, акцентируя внимание на предотвращении дискриминации и обеспечении прозрачности
.5.3. Китай
Китай в 2021 году принял Закон о защите персональных данных, который во многом схож с GDPR
. Однако китайское законодательство предусматривает более широкие полномочия государства в доступе к данным:1. Устанавливает особые требования к трансграничной передаче данных.
2. Вводит понятие «важных данных», обработка которых подлежит особому контролю.
В отношении больших данных Китай реализует стратегию активного государственного регулирования и поддержки развития технологий
.5.4. Сравнение с российским подходом
Россия, как и ЕС, имеет комплексный закон о защите персональных данных (Федеральный закон «О персональных данных» от 27.07.2006 N 152-ФЗ), но он менее детализирован в вопросах больших данных.
В отличие от США, в России преобладает подход государственного регулирования, а не саморегулирования отрасли. Российское законодательство, подобно китайскому, уделяет особое внимание локализации данных и контролю за их трансграничной передачей. В России, как и в других рассмотренных юрисдикциях, наблюдается тенденция к ужесточению требований к обработке персональных данных, но пока отсутствуют специальные нормы, регулирующие использование технологий больших данных
.6. Направления развития правового регулирования
Для решения выявленных проблем предлагается ряд направлений развития и совершенствования законодательства в сфере регулирования больших данных:
1. Модернизация нормативно-правовой базы. Необходимо провести комплексный пересмотр существующего законодательства с целью его актуализации в соответствии с технологическими реалиями. Это включает в себя:
1) уточнение и расширение понятийного аппарата, в том числе введение законодательного определения больших данных и связанных технологий
;2) разработку специальных норм, регулирующих обработку больших данных с учетом их технологических особенностей и потенциальных рисков.
2. Внедрение принципов этичного использования данных. Целесообразно законодательно закрепить концепцию «этичного использования данных» (data ethics), которая должна стать основополагающим принципом при работе с большими данными. Это поможет предотвратить дискриминационные практики и обеспечить справедливое использование информации
.3. Развитие механизмов отраслевого саморегулирования. Стимулирование разработки отраслевых кодексов поведения и стандартов обработки больших данных позволит более гибко реагировать на технологические изменения и учитывать специфику различных секторов экономики.
4. Внедрение превентивных механизмов защиты. Развитие института оценки воздействия на защиту данных (Data Protection Impact Assessment) применительно к проектам, связанным с обработкой больших данных, позволит предотвращать потенциальные нарушения прав субъектов данных на ранних стадиях реализации проектов
.5. Стимулирование инноваций в области защиты данных. Государственная поддержка разработки и внедрения технологий, обеспечивающих приватность на этапе проектирования (privacy by design), поможет создать техническую базу для соблюдения требований законодательства
.6. Гармонизация международного законодательства. Учитывая трансграничный характер потоков данных, важно стремиться к унификации подходов к регулированию больших данных на международном уровне, что может быть достигнуто через участие в разработке международных соглашений и стандартов в этой области.
7. Совершенствование механизмов реализации прав субъектов данных. Необходимо разработать новые правовые инструменты, позволяющие субъектам данных эффективно осуществлять контроль над использованием их информации в контексте больших данных, включая право на объяснение логики автоматизированных решений и право на переносимость данных.
7. Заключение
Проблематика правового регулирования больших данных находится на пересечении права и информационных технологий, что требует междисциплинарного подхода к ее изучению. Исторический анализ показывает, что вопросы обработки больших объемов данных возникли задолго до цифровой эпохи, однако именно развитие современных технологий придало этой теме особую актуальность в правовом поле
.Существующее законодательство о персональных данных, сформированное в период до широкого распространения технологий больших данных, не в полной мере учитывает их специфику. Это создает ряд правовых коллизий и пробелов, требующих внимания законодателя и научного сообщества.
Сравнительный анализ подходов к регулированию больших данных в России, ЕС, США и Китае выявил различия в моделях регулирования и степени вмешательства государства в данную сферу. При этом все рассмотренные юрисдикции сталкиваются с похожими вызовами в области защиты прав субъектов данных и обеспечения инновационного развития
.Предложенные направления развития правового регулирования направлены на создание сбалансированной системы норм, способной обеспечить защиту прав субъектов данных без чрезмерного ограничения инновационного потенциала технологий больших данных. Особое значение приобретают механизмы саморегулирования отрасли и внедрение этических принципов работы с данными.
Важно отметить, что эффективное регулирование в этой сфере требует постоянного мониторинга технологических изменений и готовности к оперативному обновлению нормативно-правовой базы. Кроме того, учитывая глобальный характер цифровой экономики, необходимо стремиться к международной гармонизации подходов к регулированию больших данных
.В заключение следует подчеркнуть, что поиск оптимальных моделей регулирования должен опираться на глубокое понимание технологических особенностей больших данных, учет интересов всех заинтересованных сторон и стремление обеспечить высокий уровень защиты прав граждан в цифровую эпоху. Дальнейшие исследования в этой области должны быть направлены на разработку конкретных правовых механизмов, способных эффективно решать выявленные проблемы и отвечать на новые вызовы, возникающие в связи с развитием технологий обработки данных.