Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

LegalTech, FinTech, RegTech-1

.pdf
Скачиваний:
17
Добавлен:
07.09.2022
Размер:
1.83 Mб
Скачать

1. Компоненты цифровых технологий в правовом контексте

сообщения электронной почты, данные о перемещении мобильного абонента, веб-страницы, аналоговые записи, файлы PDF и пр. Как правило, неструктурированные данные представлены в виде текста, содержащего факты, даты, цифры, которые хранятся обычно в форме электронных документов. Машинная обработка таких данных возможна только тогда, когда они извлечены из электронного документа и преобразованы в понятный для машины формат, то есть интерпретированы;

слабоструктурированные (полуструктурированные) данные – данные, доступные для машинного распознавания, но требующие применения дополнительных приемов для получения конкретной информации (они определенным образом структурированы, но не имеют характерного для структурированных данных формата таблицы).

Исходя из сказанного, big data можно рассматривать как постоянный поток огромных объемов информации, непрерывно поступающей из различных источников, причем часть данных изначально не структурирована и не обработана иным образом.

Отмечая, что бóльшая часть информации поступает в виде неструктурированных данных, эксперты признают, что в отношении них, а также полуструктурированных данных затруднено использование программ, предназначенных для работы со структурированными данными, вследствие чего требуется разработка специальных технических решений. В частности, для хранения неструктурированных и полуструктурированных данных используются не привычные для всех базы данных (в которых структурированная информация хранится, будучи упорядоченной «по строкам и столбцам»), а хранилища данных, в которых по-иному организуется хранение разнообразных по своим характеристикам данных1.

То есть в условиях непрерывного появления – постоянным потоком – огромных объемов информации потребовалось изменение не только методов сбора и накопления информации, но и методов ее хранения, а также иной обработки, что дало повод характеризовать вновь разрабатываемые методы как альтернативные традиционным системам управления базами данных. В этих условиях возник закономерный вопрос о допустимости распространения на хранилища big data положений ГК РФ о базах данных.

1  В отличие от традиционных баз данных, в которых данные измеряются количеством информационных единиц («материалов» в терминологии разработчиков ГК РФ), применительно к big data традиционно говорят о трех V: volume (физическом объеме); velocity (скорости прироста); variety (многообразию самих данных, их источников и пр.).

151

LegalTech, FinTech, RegTech etc.

Действительно, для хранилища данных, в котором организуется хранение как структурированной, так и неструктурированной информации, затруднительно получить авторско-правовую охрану в качестве базы данных. Это связано с тем, что в силу положений гл. 70 ГК РФ авторское право на базу данных возникает в том случае, если при подборе и компоновке ее составляющих (т.е. при определении структуры (схемы) базы данных) был реализован новаторский подход, использовались оригинальные творческие идеи, креативность1. Иными словами, нормами авторского права охраняется именно порядок подбора и компоновки составляющих базы данных. Применительно к сбору, накоплению, обработке и хранению big data не идет речь о каком-ли- бо подборе и компоновке составляющих – альтернативные системы хранения предусматривают иные методы при накоплении и хранении различных наборов (англ. dataset) структурированных, неструктурированных и полуструктурированных данных, что и осложняет признание за хранилищами big data значение базы данных в смысле гл. 70 ГК РФ.

Проблемной является и правовая охрана хранилищ big data в качестве объекта смежных прав – инвестиционной базы данных. Это связано с тем, что база данных становится объектом смежных прав и получает правовую охрану в соответствии с положениями § 5 гл. 71 ГК РФ, если она является результатом существенных финансовых, материальных, организационных или иных вложений (инвестиций) изготовителя базы в ее создание (отсюда и распространенное название – «инвестиционная база данных», или «нетворческая база данных»). То есть в отличие от охраняемой авторским правом базы данных, для которой определяющим является подбор и компоновка (структура, схема) ее составляющих, для инвестиционной базы данных главенствующее зна-

чение имеет накопление и обработка значительных объемов информации:

всилу п. 1 ст. 1334 ГК РФ инвестиционной признается база данных, которая содержит не менее 10 000 «самостоятельных информационных элементов (материалов)». Причем вне зависимости от того, какие «информационные элементы» составляют базу, правовую охрану получает не содержание, а, по сути, целостность базы данных – от нелегальных копирования и использования скопированной части – что нацелено на защиту инвестиций, затраченных при ее создании. Это отражено

вабз. 2 п. 1 ст. 1334 ГК РФ, закрепляющем правило, согласно кото-

1  См. об этом подробнее: Рожкова М.А. Базы данных и сервисы онлайн-классифай- дов: пользование базой и использование информации // Журнал Суда по интеллектуальным правам. 2019. № 26 (декабрь). C. 25–32. URL: http://ipcmagazine.ru/legal-issues/ databases-and-services-online-classification-use-of-the-database-and-use-of-information

152

1. Компоненты цифровых технологий в правовом контексте

рому никакое лицо не имеет право без разрешения правообладателя переносить содержание всей базы данных или существенной части ее материалов на другой информационный носитель (извлекать материалы) и осуществлять их последующее использование (за исключением случаев, предусмотренных ГК РФ).

В условиях, когда правовой режим информации не определен (о чем говорилось выше), и с учетом того, что в хранилище могут поступать данные из разных, в том числе открытых источников, сложно распространять положения § 5 гл. 71 ГК РФ на хранилища big data. Это,

вчастности, связано с тем, что множество лиц может одновременно собирать и хранить данные, полученные из одних и тех же открытых источников, поэтому не представляется возможным определить, права какого лица будут подлежать защите в соответствии с положениями § 5 гл. 71 ГК РФ. Эта, а также иные проблемы стали катализатором разработки предложения о введении в закон понятия «массив данных» (о чем подробно говорилось в параграфе 1.5.3) – в существующей правовой действительности крайне затруднительно защитить права на big data.

Ценность big data хорошо охарактеризована известной фразой «Данные – это новая нефть!» (англ. “Data is the new oil!”), прозвучавшей

в2006 г. и приписываемой британскому математику Клайву Хамби1. Примечательно, что ее смысл не в признании равнозначности данных и нефти, а в констатации того, что, как и сырая нефть, необработанные (сырые) данные не представляют собой особой ценности: для того, чтобы данные создавали действительную прибыль, они должны быть использованы – подвергнуты анализу, визуализированы, интегрированы и т.д. для целей принятия того или иного решения. Таким образом, огромные объемы собранной и накопленной информации, требующие существенных затрат на хранение, имеют только потенциальную коммерческую ценность. Реальную же коммерческую ценность данные, полученные из потоков big data, могут приобрести лишь тогда, когда они используются для решения той или иной научной / социальной / коммерческой задачи.

Под использованием big data понимают прежде всего аналитику больших данных (англ. big data analytics), которая в настоящее время признается «новой формой производства знаний». Поскольку понятие бизнес-аналитики раскрывается как «процесс поиска системных закономерностей в массивах информации и интерпретации найденных фактов с целью получения важных для бизнеса сведений (инсайтов,

1  URL: https://ana.blogs.com/maestros/2006/11/data_is_the_new.html

153

LegalTech, FinTech, RegTech etc.

insights), которые позволят оптимизировать деятельность: увеличить доход, сократить затраты или достичь других важных результатов»1, следует обозначить то, что ее проведение требует структуризации данных, создания алгоритмов анализа данных, агрегации и анализа данных, выявления связей между данными, установления закономерностей и скрытых тенденций, построения прогнозов и т.п. И здесь необходимо обратить внимание на целый ряд обстоятельств.

1.Значимым является то, что составляющие big data данные не создаются специально для проведения какого-либо анализа, а возникают естественным образом: упомянутый поток данных – это результат непрерывной генерации данных, которые появляются в процессе осуществления различной деятельности и (или) при решении разных задач. Иными словами, под big data, как правило, понимают вторичные данные, которые первоначально предназначались для других целей, – их нередко рассматривают, скорее, как побочный результат различных процессов.

Так, пользователи соцсетей размещают в своих аккаунтах личную информацию и фото, преследуя цель поведать о себе миру; автоматическое сообщение контроллером сведений о состоянии и работоспособности технического узла предназначено для предотвращения нарушений его работы; онлайн-отзывы о ресторане / гостинице / прокате авто обычно направлены на улучшение качества услуг соответствующих компаний; передача с метеостанции данных о температуре воздуха, осадках, снежном покрове нацелена на генерацию необходимых сведений о метеорологических условиях и т.д.

Такого рода информация вливается в бесконечный непрерывный поток big data и, будучи собранной и (или) накопленной компанией, может использоваться при проведении big data analytics – для принятия взвешенных, обоснованных решений и построения прогнозов.

2.С учетом того, что big data analytics осуществляется не вручную,

аавтоматизировано, предполагается создание специальных алгоритмов анализа данных и иных инструментов. И здесь важно заметить, что аналитику данных в зависимости от уровня сложности работы с информацией и степенью человеческого участия принято подразделять на 4 вида, которые выстраиваются в определенную иерархию. Это:

описательная (дескрептивная) аналитика, которая предполагает сбор, систематизацию и обобщение необработанных («сырых») данных из разных источников с целью понимания происходящих процессов

1  URL: https://www.oracle.com/ru/business-analytics/what-is-analytics/

154

1. Компоненты цифровых технологий в правовом контексте

для дальнейшего их анализа (отвечает на вопрос «что произошло?»). Так, в качестве примера можно указать аналитику данных в рамках технологии интернета вещей: необходимая информация собирается со всевозможных IoT-устройств или IIoT-устройства, «умных» контроллеров и датчиков и обобщается для целей дальнейшего анализа;

диагностическая аналитика, которая строится на основании описательной аналитики и предполагает обнаружение и анализ данных,

атакже корреляцию (отвечает на вопрос «почему это произошло?»). Хорошей иллюстрацией здесь будет упоминание IoT-системы «Газпромнефти», с помощью которой удалось разрешить проблему сбоев у автоматического перезапуска насосов после аварийного отключения электричества. Сводка, собранная по результатам мониторинга 200 млн записей с разных контроллеров систем управления, позволила установить причину сбоев и прекратить их;

предиктивная (прогнозная, предикативная) аналитика, в рамках которой с учетом результатов диагностической аналитики осуществляется прогнозирование и моделирование, основанное на выявленных статистических закономерностях (отвечает на вопрос «что может произойти?»). Здесь вспоминается известный курьезный случай, произошедший в сети магазинов Target, когда по результатам аналитики данных была установлена беременность американской школьницы еще до того, как об этом узнала она сама и ее родители (на основе полученных данных робот начал предлагать ей скидки на детские товары и памперсы). Примечательно, что в результате этого случая было принято решение скорректировать алгоритм применительно к несовершеннолетним;

предписывающая (предписательная) аналитика, которая опирается на предиктивную аналитику и помогает принять правильное решение посредством анализа необработанных данных, в том числе с опорой на методы ИИ (отвечает на вопрос «что делать?»). Например, в e-commerce и логистике существует проблема «последней мили» – последнего этапа доставки товара до покупателя, осуществляемого обычно из распределительного центра до двери квартиры покупателя: «последняя миля» стоит примерно 28% от общей стоимости доставки (водитель объезжает жилые массивы, ищет место для парковки и пр.). Поэтому компания DHL в стремлении снизить затратность «последней мили» учла результаты аналитики данных, что не только позволило ей оптимизировать маршруты, сократить время на доставку и снизить расход топлива, но способствовало тому, чтобы начать использование полностью автоматизированного и интеллектуального беспилотника, который может осуществлять доставку «последней мили».

155

LegalTech, FinTech, RegTech etc.

Вследствие сказанного применительно к процессу big data analytics можно говорить о том, что особую значимость здесь приобретают специально разрабатываемые технологические решения, которые позволяют эффективно и оперативно решать поставленные задачи.

3. Заслуживает внимания и то, что для целей big data analytics приоритетное значение приобретает не количественная, а качественная сторона данных.

Это проявляется, в частности, в том, что для решения различных задач подразумевается задействование разных доступных для аналитики данных – собранных в различном контексте и полученных из многих источников (например, современные автомобили сегодня способны накапливать данные о водителе, погоде и окружающей среде, самом авто и допущенных системой ошибках, подключенных устройствах и др.). При этом big data analytics допускает использование одних и тех же доступных для аналитики данных для достижения различных целей: для этого они соответствующим образом трансформируются и агрегируются – с добавлением новых наборов данных или без таковых. То есть анализу могут быть подвергнуты все доступные компании данные либо выборки из собранных и накопленных данных в зависимости от поставленной задачи. Это позволяет акцентировать внимание на том, что упомянутые данные могут использоваться бесконечное количество раз и в целях, которые заранее сложно предвидеть.

С учетом сказанного в отношении аналитики данных термин big data употребляется скорее для обозначения именно алгоритмов и иных IT-решений в сфере анализа данных, тогда как подвергающиеся анализу объемы данных уходят на второй план.

Вышеизложенное позволяет акцентировать внимание на том, что неверно понимать big data в одном ключе. Когда речь идет о сборе,

накоплении, хранении и иной обработке данных, термин big data может быть использован для обозначения, во-первых, огромных объемов разнообразной информации и, во-вторых, новейших технологий и инструментов сбора, накопления, хранения и иной обработки данных, альтернативных тем, которые используются для баз данных. В случае если говорится об использовании больших данных, в контексте аналитики данных термин big data употребляется, скорее, для обозначения именно алгоритмов и иных IT-решений в сфере анализа данных. В связи с изложенным не вызывает удивления то обстоятельство, что ученые никак не могут договориться о едином понимании больших данных, предлагая различные определения, которые другим не кажутся удовлетворительными.

1.6.Компоненты tech: базы данных

1.6.1.Понятие базы данных

Базы данных являются одним из самых распространенных объектов интеллектуальной собственности. Вместе с тем в условиях цифровизации само понятие «база данных» несколько размывается, а кроме того, усиливается конфликт между свободой распространения информации

иинтересами изготовителей баз данных, что порождает потребность в рассмотрении ряда вопросов.

Применительно к базам данных и их охраноспособности, помимо рассмотрения ее в качестве объекта интеллектуальной собственности, зачастую встает вопрос о соотношении понятий «данные» и «информация», что уже затрагивалось в параграфе 1.5.1 настоящей монографии. В российском праве основу для разграничения терминов «данные» и «информация» дает дефиниция, содержащаяся в Законе об информации, в которой данные определены как разновидность информации (п. 1 ст. 2).

Как указывалось в параграфе 1.5.1 настоящей монографии, данные следует рассматривать как совокупность информации, объединенной

иупорядоченной по какому-либо признаку, нескольким признакам или критериям. Схожую позицию высказывает М.В. Якушев, высказывающийся в том ключе, что данные являются формой представления информации, пригодной для использования в упорядоченных информационных системах1.

Между тем в отечественной литературе высказываются и иные позиции, в рамках которых с акцентом на различие в характеристиках информации и данных предпринимаются попытки дать их определения и выявить критерии их разграничения (о чем упоминалось в параграфе 1.5.1).

Изучение зарубежных доктринальных источников показывает, что термины «информация» (information) и «данные» (data) рассматриваются в разных аспектах.

1  См.: Якушев М.В. Цифровая трансформация в праве: новые подходы в регулировании данных. 2018. URL: https://pravo.hse.ru/mirror/pubs/share/direct/228383369

157

LegalTech, FinTech, RegTech etc.

Так, профессор Школы информационных технологий Калифорнийского Университета в Беркли Рэй Р. Ларсон проводит следующее разделение данных и информации: данные (data) – сырой, необработанный информационный материал, а информация (information) – кем-то структурированные и описанные данные1. Данное разделение основано на концепции DIKW (англ. data, information, knowledge, wisdom – данные, информация, знания, мудрость), тогда как сама концепция DIKW строится на том, что имеется некая информационная иерархия, где каждый уровень добавляет определенные свойства к предыдущему уровню. Данная концепция используется для анализа данных, машинного обучения и других направлений в сфере информационных технологий.

В свою очередь, Лоттер Деттерман, комментируя концепцию DIKW, указывает: «некоторые специалисты в сфере информационных технологий используют термин “данные” для того, чтобы описать дискретные, объективные факты или наблюдения, которые характеризуются такими признаками, как неструктурированный и необработанный характер, а также отсутствием конкретного значения, при этом термин “информация” относится к данным, которые были преобразованы в форму, имеющую смысл, и приобретшую тем самым пользу для человека»2. В то же время автор подчеркивает, что во многих научных работах и законодательных актах термины «информация» и «данные» являются терминами-синонимами, а трактовка понятий зависит от конкретной дисциплины и избранного подхода. В развитие можно сослаться и на другие устоявшиеся понятия, которые в международноправовой перспективе выражаются через различные термины «данные» или «информация»: data scientist – «информационный аналитик», genetic data – «генетическая информация» и др.

Сказанное подтверждает изложенную в параграфе 1.5.1 настоящей монографии позицию о практической невозможности провести в законодательстве четкий рубеж между понятиями «данные» и «информация». Действительно, разграничение понятий «данные» и «информация» является довольно зыбким и определяется конкретным подходом и сферой,

1  См.: Larson, R.R. Database management: Introduction to Terms and Concepts. University of California, Berkley. School of Information Management and Systems. 31 October 2000. URL: https://slideplayer.com/slide/4954853/; MIS – Quick guide. Basic information concepts. URL https://www.tutorialspoint.com/management_information_system/pdf/mis_quick_guide. pdf; Information concepts, Information: A quality product classification of the information. 2020. URL https://theintactone.com/2020/01/07/information-concepts-information-a-quality- product-classification-of-the-information/

2  См.: Determann, L. No One Owns Data. 14 February 2018. UC Hastings Research Paper No. 265. URL: https://ssrn.com/abstract=3123957 or http://dx.doi.org/10.2139/ssrn.3123957

158

1.Компоненты цифровых технологий в правовом контексте

вкоторой данный термин применяется. При этом в сравнительно-пра- вовом ключе также могут возникать разночтения, связанные исключительно или главным образом с особенностями перевода.

Соотношение понятий «данные» / «информация» с термином «база данных» также вызывает вопросы. Если исходить из технических характеристик баз данных, то, как отмечает Рэй Р. Ларсон, в широком смысле слова базой данных может являться вообще любой набор данных, однако для практических целей под базой данных понимается «совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и управления данными, независимая от прикладных программ»1.

Схожие определения можно найти в отечественной литературе по информационным технологиям. Так, в одном из учебников сформулировано: «база данных представляет собой совокупность специальным образом организованных данных, хранимых в памяти вычислительной системы и отображающих состояние объектов и их взаимосвязей

врассматриваемой предметной области»2.

При этом в законодательстве и юридической литературе, как правило, понятие «база данных» раскрывается через иной понятийный аппарат, который существенно варьируется в зависимости от конкретной юрисдикции и подхода конкретного автора.

Так, в российском законодательстве (абз. 2 п. 2 ст. 1260 ГК РФ) под базой данных понимается «представленная в объективной форме совокупность самостоятельных материалов (статей, расчетов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ)».

Вто же время в европейском законодательстве дано другое определение базы данных: «собрание независимых произведений, данных или иных материалов, расположенных систематическим или методическим способом и индивидуально доступных через электронные

ииные средства»3.

Вамериканских источниках зачастую встречается определение базы данных как «подборки большого количества отдельных информацион-

1  См.: Larson, R.R. Op. cit.

2Кумскова И.А. Базы данных: учебник. М: КНОРУС, 2018. С. 22/ URL: https://cdn1. ozone.ru/multimedia/1019240800.pdf

3  Директива 96/9/ЕС Европейского парламента и Совета «О правовой охране баз данных» от 11.03.1996 (ст. 1(2)).

159

LegalTech, FinTech, RegTech etc.

ных единиц, произведенной с целью их объединения в одном месте или через один источник, так чтобы обеспечивалась возможность доступа к ним»1. Такое определение предлагалось закрепить на законодательном уровне в рамках так называемого законопроекта о базах данных

инеправомерном присвоении информации, который рассматривался Конгрессом США в 2003 г. (но так и не был принят2).

Как правило, анализ данных определений вызывает у правоприменителей и исследователей ряд вопросов. В частности, активно обсуждается, что именно является критерием или критериями, которые предопределяют охраноспособность базы данных.

Согласно наиболее распространенному подходу основная ценность базы данных проявляется именно в упорядочивании и структурировании3. Иными словами, в отношении правовой охраны баз данных первостепенную ценность имеет вклад создателя базы данных в преобразование отдельных элементов в организованные совокупности таких элементов, полученная структура базы данных.

При этом по смыслу законодательства правовая охрана, предоставляемая базам данных, не может предоставляться отдельным составляющим этих баз, так как формально правовая охрана баз данных как самостоятельного объекта интеллектуальной собственности не означает наличие у составителя базы прав на материалы, входящие в состав базы данных, и не запрещает третьим лицам использовать отдельные элементы, входящие в состав базы данных, или создавать свои собственные базы данных на основе аналогичных материалов при условии соблюдения интеллектуальных прав правообладателей. Но вместе с тем правовой режим баз данных накладывает ограничения на извлечение

ииспользование данных, которые входят в состав охраноспособной базы. Более того, специальный правовой режим данных, входящих в состав базы (например, персональных данных), или ограниченность прав правообладателя в отношении некоторых составляющих базу объектов (к примеру, в случае лицензии), как минимум, создают определенные дополнительные обязанности для правообладателя базы данных.

1  См., например: Trosow, S.E. Sui Generis Database Legislation: A Critical Analysis. Yale J.L. & Tech. 534. URL: https://yjolt.org/sites/default/files/trosow-7-yjolt-534.pdf

2  См.: Database and Collections of Information Misappropriation Act, 108th Congress, H.R. 3261, section 2(5)(A). URL: https://www.congress.gov/bill/108th-congress/house-bill/3261 3  См., например: Derclaye, E. The Legal Protection of Databases: A Comparative Analysis (Edward Elgar 2008). P. 47; Duch-Brown, N., Martens, B., Mueller-Lange, F. The economics of ownership, access and trade in digital data. JRC Digital Economy Working Paper 2017-01.

Р. 13–14.

160

Соседние файлы в предмете Предпринимательское право