MeinDatenanbieter » Blog » Web Scraping für Journalisten

Web Scraping für Journalisten

  • by

Scraping bringt einen Computer dazu, Informationen von mehreren Websites online zu sammeln, was es ihnen ermöglicht, große Datenmengen zu sammeln, und ist der effektivste Weg für Journalisten, zuerst an die Geschichte zu gelangen und Exklusives zu finden, das sonst niemand hat. Es ist auch ein großartiges Werkzeug für Reporter, die wissen, wie man codiert, da immer mehr öffentliche Einrichtungen ihre Daten jetzt auf ihren Websites veröffentlichen. Gibt es Web Scraping für Journalisten?

Die Legalität

Es wird jedoch die Frage aufgeworfen, auf welche Daten ein Journalist zugreifen kann, ohne das Gesetz zu brechen oder ohne „scheinbar“ zu hacken. Hier ist ein sehr schmaler Grat, und fast alle Journalisten lassen sich von einem Ethikkodex leiten. Es ist auch eine faire Annahme, dass in Fällen, in denen eine Institution Daten auf ihrer Website veröffentlicht hat, dies nicht unbedingt öffentlich ist.

Regierungsserver hosten private Informationen über ihre Bürger. Der Zugriff darauf wäre ein Verstoß gegen die Datenschutzgesetze. Es gibt einen sehr schmalen Grat zwischen Scraping und Hacking, und das ist die Achtung des Gesetzes. Geschützte Daten sollten nicht ausgespäht werden.

Wenn es der Öffentlichkeit nicht zugänglich ist, dann ist es auch nicht für Journalisten verfügbar. Selbst in einer so halsabschneiderischen Karriere, in der die Geschichte aufgedeckt wird, die niemand sonst hat, gilt immer noch die Achtung des Gesetzes.

Web Scraping für Journalisten-Tools

Es gibt ein paar Web-Scraping-Tools, die sich perfekt für das Web-Scraping von Journalisten eignen.

Schaber

Scraper ist eine kostenlose Chrome-Erweiterung. Das Tool ist einfach zu verwenden, wenn Sie einfache Daten von der Website extrahieren müssen. Nachdem Sie die Software heruntergeladen und in Ihrem Browser installiert haben, markieren Sie die Website, die Sie löschen möchten. Klicken Sie mit der rechten Maustaste und klicken Sie auf die ähnliche Schaltfläche. Es öffnet sich ein Fenster mit Informationen, die denen ähneln, die Sie markiert haben.

Scraper ist das beste Web-Scraping-Tool zum Extrahieren von Klartext. Sie können mit dem Werkzeug keine Bilder oder komplizierten Objekte schaben. Es erntet keine großen Textmengen, ist aber einfach zu bedienen und am besten für Anfänger geeignet. Das Tool verwendet XPath, um zu bestimmen, welche Informationen zu scrapen sind. Mit diesem Tool können Sie leicht navigieren, wenn Sie über Programmierkenntnisse verfügen.

Outwit-Hub

Outwit Hub ist ein weiteres Web-Scraping-Tool, das Sie kostenlos erhalten können. Dieses Tool ist eine Firefox-Erweiterung. Das Tool kann von Anfängern und Experten problemlos verwendet werden. Mit diesem Tool können Sie ganz einfach Bilder, Dokumente und PDFs schaben.

Nach dem Scraping von Daten gibt das Tool Daten in einer visuellen Präsentation zurück. Dies hilft Nicht-Codierern dabei, die zurückgegebenen Daten leicht zu verstehen. Die extrahierten Daten werden in verschiedene Formate exportiert, während Bilder und Dokumente auf der Festplatte gespeichert werden.

Scraperwiki

Die Scraper-Wiki-Plattform wurde kürzlich aktualisiert. Die Plattform ermöglichte es erfahrenen Programmierern, ihre eigenen Codes im Browser auszuführen. Vor kurzem ist die Plattform auf benutzerdefinierte oder vorgefertigte Tools umgestiegen, die für Anfänger am besten geeignet sind.

BeautifulSuppe

Schöne Suppe ist ganz anders als die oben genannten Optionen. Das Scraping-Tool befasst sich mehr mit Codierungswissen. Trotzdem ist das Tool einfach zu bedienen und zu navigieren. Wenn Sie dieses Tool verwenden, benötigen Sie nicht viel Code, um Daten aus dem Internet zu extrahieren.

BeautifulSoup leistet gute Arbeit beim Abrufen von Daten aus der URL und ermöglicht es Ihnen, Daten problemlos zu analysieren. Falls Sie nach einem Tool suchen, mit dem Sie Codes erstellen können, um das zu extrahieren, was Sie benötigen, ist dies das richtige Tool für Sie.

Scrapy

Scrapy Web-Scraping-Tool ähnelt BeautifulSoup. Es funktioniert, indem Sie Ihren eigenen Code erstellen, mit dem Sie die gewünschten Daten extrahieren können. Das Scrapy-Web-Scraping-Tool ist jedoch robuster als BeautifulSoup. Es kann als vollständiges Web-Scrape-Framework fungieren. Scrapy ist ein Beispiel für ein Python-Paket und wird über Pip installiert.

CODIERUNG

Es gibt eine ganze Reihe von Fähigkeiten, die Journalisten beherrschen müssen. Codierung ist eine davon. Es stellt sicher, dass ein Journalist der Masse voraus ist. Es gibt ihnen auch die Möglichkeit, auf kostengünstige Weise computererfahrener zu werden. Es gibt viele kostenlose Nachhilfe-Tools, die online verfügbar sind. Sie können sie verwenden, um zu lernen, wie man Daten kratzt. Alles, was Sie brauchen, ist Selbstvertrauen! Mit der heutigen Technologie ist das Web Scraping für Journalisten einfacher geworden, da jeder dies tun kann.