MijnDataProvider » Blog » Is webscraping illegaal?

Is webscraping illegaal?

  • by

Ook wel webcrawling of spidering genoemd, verwijst webscraping naar het geautomatiseerde proces van het verzamelen van gegevens van websites van andere personen. Deze praktijk is ongetwijfeld een van de beste methoden voor het delven van gegevens van concurrenten. Hoewel er unaniem overeenstemming kan worden bereikt over de efficiëntie ervan, wordt bij deze praktijk een voorbehoud gemaakt: het is een van de moeilijkste tools om vanuit juridisch perspectief te analyseren. Maar is webscraping illegaal?

In wezen werkt webscraping door de pagina's van een doelwebsite te doorlopen om gegevens te extraheren. Zoekmachines zoals binge en Google doen hetzelfde bij het indexeren van pagina's. Scraping-software gaat echter een tandje hoger en converteert alle geëxtraheerde gegevens naar een formaat dat gemakkelijk kan worden overgezet naar een spreadsheet of een database.

Het is absoluut noodzakelijk om te vermelden dat een webschraper niet hetzelfde is als een API. Een bedrijf kan soms een API leveren om de interactie van andere systemen met data te vergemakkelijken. De hoeveelheid en kwantiteit van de gegevens die beschikbaar zijn via API is echter relatief lager dan de gegevens die worden gebruikt via webscraping. Bovendien bieden webschrapers vaak informatie die actueler is in vergelijking met API-informatie. Dit maakt het veel gemakkelijker om de informatie structureel aan te passen.

Webscraping geniet wijdverbreide toepassingen. Een journalist kan het bijvoorbeeld gebruiken om voetbalstatistieken te volgen en te volgen en met een nieuw sportverhaal te komen waar ze mogelijk aan werken. Evenzo kan een e-commercebedrijf zaken als producttitels, SKU's en prijzen van concurrerende websites schrappen om ze verder te analyseren.

Hoewel het op zichzelf een krachtig hulpmiddel is, worstelt webscraping met juridische zaken. Aangezien het hele proces betrekking heeft op het toe-eigenen van reeds bestaande inhoud van verschillende websites, komen er talloze dilemma's van zowel ethische als juridische aard voor bedrijven die scraping voor hun eigen voordelen willen gebruiken. Momenteel zijn de juridische implicaties van webscraping in een soort staat van verandering. Het is echter van onschatbare waarde om voet aan de grond te krijgen aan de rechterkant van de medaille, juridisch gezien.

 Wat is webscraping?

Laten we eens kijken wat webscraping is om er zeker van te zijn dat deze in hetzelfde tempo zitten. Het is het automatisch verwijderen van webgegevens en het gebruiken van de verzamelde informatie om uw bedrijf te laten groeien. De informatiekrabben worden overal opgeslagen - database of bestanden

Is webscraping illegaal?

In de loop der jaren is de reputatie van webscraping afgenomen. Hieronder vindt u de redenen hiervoor.

  • Webscraping wordt door bedrijven gebruikt om concurrentievoordeel te behalen.
  • Het druist volledig in tegen de auteursrechtwetten en servicevoorwaarden.
  • Webscraping is beledigend van aard in die zin dat de webscrapers vaker talrijke verzoeken kunnen verzenden dan menselijke activiteiten, waardoor de website onnodig wordt belast. Erger nog, webschrapers kunnen ervoor kiezen om anoniem te werken.

Veel mensen en bedrijven hebben hun webschrapers. Het bestaan ​​van tonnen webscraping-software op de markt heeft hoofdpijn veroorzaakt bij websites die meestal worden geschraapt, zoals sociale netwerkwebsites (Facebook, Twitter, Instagram). En online winkels zoals Amazon of eBay. Dit is de reden waarom Facebook is gedwongen om de voorwaarden voor het verzamelen van gegevens te scheiden.

Integendeel, webscraping wordt door zoekmachines zoals Google of Yahoo gebruikt om de webindex te downloaden. Webscraping-activiteit heeft de bedrijven van zoekmachines geholpen om in de loop van de tijd een goede reputatie op te bouwen, omdat ze altijd informatie krijgen die waarde toevoegt aan hun website.

Veelvoorkomende juridische problemen bij webscraping

schending van het auteursrecht

De term auteursrecht heeft misschien geen betrekking op het webschrapingsproces zelf, maar het komt naar voren als het gaat om wat u doet met de inhoud van het eindproces. Als de gegevens van de sites die u aan het scrapen bent, auteursrechtelijk beschermd zijn, kunt u de gegevens op geen enkele manier gebruiken. U kunt het bijvoorbeeld niet uploaden naar uw site of gebruiken voor commerciële doeleinden. Dit betekent dat het verstandig is om, voordat u een website schrapt, uit te zoeken of de inhoud auteursrechtelijk is beschermd.

Overtreding van de wet computerfraude en misbruik

Hoewel de wet in dergelijke scenario's kan worden toegepast, is deze uitgevonden om webscraping te voorkomen. Het is eigenlijk tegen hackers. In een notendop gaat het erom zonder geautoriseerde toegang toegang te krijgen tot de inhoud van een website. Aangezien webscraping iemand alleen toegang geeft tot openbare informatie, lijkt het misschien niets met deze wet te maken te hebben.

Toch kunnen sommigen die we schrapen sinistere motieven hebben, zoals misbruik maken van mensen of zelfs grappen maken. Dit maakt het proces in strijd met de wet. Een typisch voorbeeld is wanneer Jerk.com in 2009 foto's van Facebook verkreeg voordat hij om geld vroeg om ze te verwijderen. In dit geval is het niet alleen onethisch, maar ook onwettig.

Overtreding naar chattel

Deze wet wordt overtreden wanneer de webschraper de websiteserver op enigerlei wijze rechtstreeks schaadt. De meeste webschrapers zijn dol op het beschadigen van servers tijdens hun activiteiten. Een andere fout die een beginneling van een webschraper gemakkelijk zou maken, is om iets te vaak verzoeken te doen. In het begin maakt het niet uit hoeveel HTTP-verzoeken een scraper doet. Het enige waar ze om geven, is het zo snel mogelijk verkrijgen van de gegevens die ze nodig hebben.

De implicatie van het doen van zoveel verzoeken aan een server zorgt ervoor dat de getroffen website de prestaties vermindert. Dit is wat het een slechte gewoonte maakt. Het overtreden van de overtreding naar chattel vindt daarom plaats wanneer de schraper de server traag maakt en de prestaties van de website belemmert. Soms kan de schraper iets doen dat de natuurlijke werking van de website verstoort.

Erger nog, de eigenaar van de website kan denken dat u opzettelijk met hoge frequentie informatie op zijn pagina's opvraagt. Het kan zich voordoen als een poging om de website aan te vallen.

In een notendop, de juridische implicaties van webscraping zijn een grijs gebied. Toch zijn er bepaalde bestaande wetten die erop kunnen wijzen dat de praktijk van webscraping illegaal is. Sommige wetten insinueren echter dat het hele proces niet illegaal is wanneer de bedoeling van het schrapen van gegevens kwaadaardig is.