Saugroboter on Tour: Web-Scraping - Harvesting bei HESSENMAGAZIN.de

Samstag, den 28. Januar 2023 um 08:08 Uhr Gut zu wissen - Neues aus der Redaktion (bm)
| Drucken |

HESSENMAGAZIN.de Statistik: Überblick im Janauar 2023 - Screenshot (c) HESSENMAGAZIN.de

[WWW] Der Monat ist noch nicht zu Ende, in dem wir begonnen haben, verstärkt wenig bekanntes Wissen zu fördern. Und schon landen ganz besondere Rechner auf unserer Seite. Üblicherweise sind es nur die Crawler - Bots von Suchmaschinen. Doch diesmal tut sich unter den TOP 10 unserer Statistik ein Rechner unter der Adresse "ge-0.car03.colo2.iacd.net" hervor mit bisher 690 Besuchen und mehr als 20.000 Anfragen sowie einem riesigen Downloadvolumen (siehe rote Balken).

Da wir uns vorgenommen haben, bei der Cookienerverei nicht mitzumachen, also: unsere Besucher nicht zu tracken, konnten wir bislang zudem noch nicht herausfinden wer beispielsweise die 20-tausend Besuche am 11. und 12. Januar 2023 getätigt hat (siehe gelbe Balken).

Doch die Volumensauger kommen auch "von hinten", um Daten aus der Seite zu "extrahieren", sprich: auszulesen und zu kopieren. Dieses Webscraping geschieht auf jeden Fall ohne unsere Erlaubnis und kann damit nicht legal sein!

Wikipedia erklärt dazu: Der Begriff Screen Scraping (engl., etwa: „am Bildschirm schürfen“) umfasst generell alle Verfahren zum Auslesen von Texten aus Computerbildschirmen. Gegenwärtig wird der Ausdruck jedoch beinahe ausschließlich in Bezug auf Webseiten verwendet (daher auch Web Scraping oder Web Harvesting). In diesem Fall bezeichnet Screen Scraping speziell die Techniken, die der Gewinnung von Informationen durch gezieltes Extrahieren der benötigten Daten dienen. Mehr dazu <-KLICK.

Interessante weitere Aspekte zu der Methode findet man auf:
https://wolf-of-seo.de/was-ist/scraping/#:~:text=Web%20Scraping%20ist%20unter%20vielen%20anderen

... to be continued!

Quelle: Brigitta Möllermann, HESSENMAGAZIN.de