Nowe propozycje regulacji w zakresie text and data mining

Dyrektywa 2001/29/WE Parlamentu Europejskiego i Rady z dnia 22 maja 2001 r. w sprawie harmonizacji niektórych aspektów praw autorskich i pokrewnych w społeczeństwie informacyjnym (Dyrektywa InfoSoc) przestała odpowiadać na wiele wyzwań świata cyfrowego. Dlatego już od dłuższego czasu prowadzone są prace nad projektem nowego aktu prawnego, tj. dyrektywy w sprawie praw autorskich na jednolitym rynku cyfrowym.

W ubiegłym miesiącu pojawiły się propozycje zmian do wspomnianego projektu. Warto w szczególności zwrócić uwagę na przebieg ostatnich dyskusji dotyczących tzw. text and data mining (TDM), które powinny zainteresować szczególnie te firmy, które dokonują analiz na dużych zbiorach danych, czyli tzw. big data.

TDM to procesy wykorzystujące techniki obliczeniowe i analityczne, które pozwalają na szybkie, efektywne i szerokie przeszukiwanie i analizowanie dużych zbiorów danych, w celu odkrywania i opisywania trendów, zależności, powiązań i wyciągania innych wniosków na bazie analizowanych danych. Techniki te są wykorzystywane zarówno przez instytuty badawcze, uczelnie, ale również przez przedsiębiorstwa, które są kojarzone z nowymi technologiami, ale również przez reprezentantów bardziej tradycyjnych branż gospodarki, choćby branży energetycznej czy transportowej. Dzięki wiedzy pozyskiwanej za pomocą technik TDM przedsiębiorcy mogą odkrywać zależności, wykrywać błędy, zagrożenia i szanse dla swojej działalności, jak również lepiej rozumieć zachowania klientów i ich preferencje oraz potrzeby. Na te oczekiwania odpowiadają firmy dostarczające usługi analityczne na wielkich zbiorach danych (big data). Dla każdego, kto choć trochę stara się zrozumieć przemiany technologiczne, konieczność pozyskiwania i analizowania danych na wielką skalę jest oczywista i nie ma od niej odwrotu. Czy na potrzeby te odpowiada projekt dyrektywy o prawie autorskim na jednolitym rynku cyfrowym?

Przez ostatnie lata uznawano, że stosowanie technik TDM w odniesieniu do danych niechronionych prawem autorskim lub danych, które co prawda są chronione, ale są i tak ogólnie dostępne w Internecie, nie rodzi szczególnych problemów prawno-autorskich, a nawet jeżeli pewne wątpliwości dostrzegają prawnicy, TDM i big data są zbyt atrakcyjne i ważne dla gospodarki, aby prawne ograniczenia mogły je krępować. Skoro mogę zapoznać się z informacją dostępną w Internecie, nawet gdy jest ona chroniona prawem autorskim, dlaczego miałbym nie móc jej analizować i badać w powiązaniu z innymi danymi?

Trudno jednak nie zgodzić się z zastrzeżeniami, iż w przypadku, gdyby w trakcie stosowania TDM dochodziło do zwielokrotniania i gromadzenia tekstów i danych stanowiących utwór, nie znajdujemy w obecnych przepisach wystarczająco komfortowych i bezpiecznych podstaw prawnych, które pozwoliłyby działać bez konieczności uzyskiwania odrębnych zgód od uprawnionych. Można oczywiście dla potrzeb stosowania TDM dokonywać życzliwych interpretacji obowiązujących przepisów. Chodzi w szczególności o art. 231 ustawy o prawie autorskim i prawach pokrewnych dotyczący prawa do tymczasowego zwielokrotniania utworów, o charakterze przejściowym lub incydentalnym, niemającego samodzielnego znaczenia gospodarczego, a stanowiącego integralną i niezbędną część procesu technologicznego, którego celem jest wyłącznie (…) zgodne z prawem korzystanie z utworu. Drugim przepisem, który może być podstawą do stosowania TDM, jest art. 27 ustawy o prawie autorskim i prawach pokrewnych, który przyznaje określone uprawnienia instytucjom oświatowym, uczelniom oraz jednostkom naukowym, które mogą w celu prowadzenia badań naukowych, korzystać z rozpowszechnionych utworów i zwielokrotniać je. Przepis ten nie przyznaje podobnych praw innym podmiotom, w szczególności nie daje takich możliwości przedsiębiorcom.

Aby wspierać badania i rozwój, poprzedni projekt dyrektywy w sprawie prawa autorskiego na jednolitym rynku cyfrowym wprowadził nową formę dozwolonego użytku publicznego w zakresie stosowania TDM. Propozycja ta jednak mogła stać się bardziej pocałunkiem śmierci niż rzeczywistym krokiem naprzód w budowaniu lepszego środowiska prawnego dla biznesu TDM i szerzej nowych technologii.

Zgodnie z pierwotnym brzmieniem art. 3 ust. 1 propozycji dyrektywy, Państwa Członkowskie powinny wprowadzić nową formę dozwolonego użytku „w odniesieniu do zwielokrotnień i pobrań dokonywanych przez instytucje badawcze w celu przeprowadzenia eksploracji tekstów i danych (text and data mining) na utworach lub innych przedmiotach objętych ochroną, do których mają legalny dostęp, do celów badań naukowych”.

Propozycja ta spotkała się z jak najbardziej uzasadnionymi protestami i pytaniami. Po pierwsze, dlaczego z tej formy dozwolonego użytku miałyby korzystać wyłącznie instytucje badawcze, a nie choćby przedsiębiorcy, nauczyciele, dziennikarze lub po prostu freelancerzy badający trendy w świecie cyfrowym? Po drugie, czy jedynym dopuszczalnym celem TDM mają być badania naukowe?

Wsłuchując się w te wątpliwości, 10 marca 2017 roku, eurodeputowana Therese Comodini wprowadziła zmiany do dotychczasowej propozycji brzmienia art. 3 ust. 1 proponowanej dyrektywy. Nowy przepis brzmiałby następująco:

„Państwa członkowskie przewidują wyjątek od praw przewidzianych w art. 2 dyrektywy 2001/29/WE, w art. 5 lit. a) i art. 7 ust. 1 dyrektywy 96/9/WE oraz w art. 11 ust. 1 niniejszej dyrektywy w odniesieniu do zwielokrotnień i pobrań dokonywanych przez osobę mającą zgodnie z prawem dostęp do utworów lub innych przedmiotów objętych ochroną, pod warunkiem, że zwielokrotnienia lub pobrania są wykorzystywane wyłącznie w celu przeprowadzenia eksploracji tekstów i danych.”

Zgodnie z treścią uzasadnienia nowej propozycji, ponieważ sam proces text and data mining polega na czytaniu i analizie cyfrowo gromadzonych informacji, to sam w sobie nie jest istotny z punktu widzenia ochrony praw autorskich. Jednak czynnościami, które są relewantne z punktu widzenia prawa autorskiego (inaczej: godzą w monopol prawno-autorski) są czynności uzyskiwania dostępu oraz normalizacji danych w celu umożliwienia ich dalszej analizy. Normalizacja baz danych jest procesem, który pozwala na takie porządkowanie danych wejściowych, aby zminimalizować błędy w późniejszych analizach. Naturalną częścią normalizacji jest zwielokrotnianie danych.

Innymi słowy, w procesie uzyskiwania dostępu oraz edytowania danych może dojść do czynności, które są objęte monopolem prawno-autorskim, co oznacza, że aby umożliwić TDM, należy wprowadzić nową formę dozwolonego użytku. Zwróćmy jednak uwagę na to, że czynności zwielokrotniania i uzyskiwania dostępu, na które zezwala nowa propozycja art. 3 ust. 1 dyrektywy, muszą być dokonywane w celu przeprowadzenia eksploracji tekstów i danych (TDM). Pojawia się więc ważne pytanie, czy w takim razie podmiot wykonujący TDM może gromadzić i przechowywać teksty i dane po zakończeniu ich eksploracji, aby na przykład móc do nich wrócić przy kolejnych analizach lub wręcz stale się do nich odnosić w ramach swojej działalności gospodarczej? Wydaje się, że odpowiedź nie zawsze będzie pozytywna.

Dalsze prace nad nową dyrektywą, jak również późniejsza jej implementacja powinna moim zdaniem być tak prowadzona, aby jak najbardziej rozszerzyć zakres stosowania technik TDM dla wszystkich zainteresowanych podmiotów oraz aby nie ograniczać możliwości zwielokrotniania danych i ich przechowywania w późniejszym okresie. Takie ograniczanie możliwości wykorzystywania TDM byłoby nieuzasadnione, gdyż pozyskiwanie, gromadzenie i analiza big data zazwyczaj nie godzą w interesy podmiotów praw autorskich, a co więcej, w przypadku, gdyby takie słuszne interesy były zagrożone – zawsze jest możliwość powoływania się na ogólne zasady prawa autorskiego, które stanowią, iż dozwolony użytek nie może naruszać normalnego korzystania z utworu lub godzić w słuszne interesy twórcy.

Mikołaj Sowiński, partner w kancelarii Sołtysiński, Kawecki & Szlęzak