Què és el “web scraping”?

El web scraping, rastreig, o extracció de dades, és un procés que consisteix en navegar automàticament en un lloc web i, mitjançant bots, extreure informació i dades d’aquest web. Això suposa que es pot duplicar o copiar tot el contingut d’un lloc web a un altre lloc.

El web scraping s’utilitza en moltes empreses digitals que es dediquen a la recopilació de base de dades (com per exemple Google, que busca a tota la xarxa per després recollir la informació a través de les cerques). Alguns casos o exemples pels que s’acostuma a utilitzar el web scraping són:

  • Els motors de cerca que rastregen un lloc web, analitzen el seu contingut i després el classifiquen.
  • Llocs de comparació de preus que implementen bots per obtenir automàticament preus i descripcions de productes per a llocs web de venedors aliats.
  • Companyies d’investigació de mercat que l’utilitzen per extraure dades de fòrums i xarxes socials, entre altres.

És legal fer scraping?

Depèn de com ho fem i de quina és la finalitat d’aquesta acció. La base de la seva legalitat es troba a la Sentència del Tribunal Suprem, de 9 d’octubre de 2012, sobre el cas Atrapalo vs. Ryanair. En aquest cas, Ryanair al·legava que Atrapalo estava cometent una il·legalitat en rastrejar i copiar la informació de la seva pàgina web per plasmar-la a la seva pròpia web.

En primer lloc, la sentència determina que no existeix una relació contractual entre les parts ja que el fet d’accedir a veure unes ofertes i per fer-ho acceptar unes condicions, no implica que es generi una relació contractual entre les parts, pel que Atrapalo no pot vulnerar les condicions d’ús de la pàgina. En segon lloc, es considera que el buscador de vols de Ryanair no és pot considerar una base de dades protegida per drets d’autor perquè es tracta d’un sistema informàtic qui genera la informació, i no hi ha cap element d’originalitat de l’autor. I, finalment, com que no hi ha base de dades, s’entén que tampoc hi ha una extracció d’aquestes dades per part d’Atrapalo. És per això que el Tribunal determina que és correcte l’scraping que fa Atrapalo.

Així doncs, l’scraping serà legal si es té en compte el següent:

  1. Propietat intel·lectual: El lloc d’on es treuen les dades no pot estar protegit per drets de propietat intel·lectual, és a dir, quan la informació que conté una pàgina web es pot considerar una obra protegida, llavors no es podrà extreure la informació perquè es vulneraria drets d’autor.
  2. Competència deslleial: l’scraping no es pot fer per obtenir informació i crear un contingut que imiti a l’original, i que aquest fet pugui comportar una confusió per als usuaris.
  3. Termes i condicions legals del web original: no es poden vulnerar aquests preceptes, tot i que aquest punt és una mica relatiu ja que en el cas de la Sentència Atrapalo-Ryanair el Tribunal determina que entre les parts no hi ha cap relació contractual ja que l’acceptació de les condicions d’ús per poder veure ofertes no genera una relació contractual entre les parts.
  4. Protecció de dades: la legitimació per recollir i tractar les dades es podria encabir en el supòsit d’interès legítim. D’aquesta manera no hi ha problema en tractar aquestes dades. Però, pel que fa a la finalitat, això ja és diferent. Si s’utilitzen només per a estudi o per una finalitat semblant (ús propi), no hi ha inconvenient. D’altra banda, si aquesta informació s’utilitza per crear una base de dades per després enviar publicitat i contactar a les persones titulars de les dades, això sí que vulnera RGPD al no tenir el consentiment exprés del titular.

En resum, doncs, el web scraping és una pràctica molt habitual i legal, sempre que es compleixin els requisits citats i que la finalitat sigui adequada.

Si t’has plantejat utilitzar aquesta pràctica per al teu negoci i tens dubtes sobre si ho faries correctament, ens pots contactar i des d’e-dret t’assessorarem.

 

Mireia Alcàzar Cutié

Assessora legal TIC

Comments are closed.