Google News Crawling-Fehler: Neue Funktionen nach Webmaster Tool Update

Post image for Google News Crawling-Fehler: Neue Funktionen nach Webmaster Tool Update

von ludwig am März 14, 2012

Das Handling von Google News-Crawlingfehlern über das Backend der Webmaster Tools war ja schon immer etwas suboptimal. Das Update der Webmaster Tools verspricht hier Besserung, also schauen wir mal, was sich getan hat.

Das größte Problem bisher: keine Visualisierung der Häufigkeit der verschiedenen Google News-Crawling-Fehler. Zweitens: eine nicht gerade transparente Reaktion der Tools auf Änderungen und Korrekturen am Content und auch keine manuelle Möglichkeit, einen Fehler als “behoben” zu markieren.

Was kann die neue Crawling-Fehler-Sektion in den Webmaster Tools?

Ok, also was hat sich getan? Was als erstes positiv ins Auge springt: endlich kann man die zeitliche Entwicklung der verschiedenen Fehler-Arten optisch nachvollziehen. Die neue Darstellung hilft schon sehr, auf den ersten Blick zu erkennen, in welche Richtung sich die Fehlermeldung entwickeln.

Die Übersicht zeigt zunächst einmal vier Überkategorien von Fehlern im Google-News-Bereich: Server-Fehler (503), nicht gefunden (404), Artikelinhalt oder Artikeltitel:

Webmastertools: Google News Crawlingfehler: Übersicht

Webmastertools: Google News Crawlingfehler: Übersicht

In diesen vier Tabs kann man sich dann jeweils im Detail ansehen, was genau schief gelaufen ist.

404-Fehler erscheinen wie bereits erwähnt im Bereich “Nicht gefunden”:

News Crawlingfehler 404 in der Kategorie "Nicht gefunden"

News Crawlingfehler 404 in der Kategorie "Nicht gefunden"

Hier ist etwas faul, man sieht ab dem 16.01. steigt die Zahl drastisch an – die Kurve hilft definitiv, Handlungsbedarf zu erkennen.

Google News Fehler “Artikelinhalt”

Schauen wir uns den Bereich “Artikelinhalt” an: Hier werden formale Crawling-Fehler wie “Artikel zu kurz” gesammelt:

Google News Crawlingfehler "Artikel zu kurz"

Google News Crawlingfehler "Artikel zu kurz"

 

Google News Fehler “Artikel-Titel”

Der Artikel-Title hat wiederum seinen eigenen Tab:

Google News Crawlingfehler "Title nicht gefunden"

Google News Crawlingfehler "Title nicht gefunden"

Alle vier Fehler-Kategorien haben gemeinsam, dass ein Klick auf einen fehlerhaften Artikel ein Dialog-Fenster öffnet:

Google News Crawling-Fehler: Detailansicht

Google News Crawling-Fehler: Detailansicht

Dort habe ich die Möglichkeit, den Fehler als “korrigiert zu melden” – das heisst, er wird mir nicht weiter angezeigt, es sei denn, Google findet ihn beim nächsten Crawling erneut.

Will ich ich die fehlerhafte URL direkt aufrufen (zum Beispiel per Rechtsklick “Link in neuem Tab öffnen”), muss ich also erst das Dialog-Fenster öffnen, was ich etwas umständlich finde. Aber zur Not hilft ja hier ein .CSV Download der gefundenen Fehler.

Die Daten, die Google hier vorhält reichen dabei 90 Tage zurück. Wer länger archivieren möchte, sollte also die Daten ggf. exportieren und selbst Zeitreihen bilden.

Google News Crawlingfehler beheben

Im Dialogfenster gibt es zu jedem Fehler auch einen Link “Weitere Informationen” – die dortigen Fehler-Erläuterungen sind leider weiterhin sehr allgemein gehalten und helfen bei Problemen nicht unbedingt weiter. Daher hier mal ein paar Best Practices / Fehlerlösungen, die mir in den letzten Monaten begegnet sind:

  • Artikel zu lang: Google News erkennt das Artikel-Template nicht richtig und zählt andere Teile der Seite (z.B. Nutzerkommentare, related Articles o.Ä.) zum Artikel hinzu. Lösung: Artikeltemplate Quelltext überprüfen – gibt es im Template Hinweise darauf, was den Crawler in die Irre führen könnte?
    Wenn dieser Fehler sehr häufig auftritt, dann unter Umständen mal den Google News Support (source-suggestions@google.com) kontaktieren. Dort gibt es die Möglichkeit, dass Crawling  justieren zu lassen, zumindest kann man dies anfragen. Muss aber nicht unbedingt helfen. Leider ein Fehler, der nicht sehr einfach zu beheben ist.
  • Artikel zu kurz: Content überprüfen: Artikel vielleicht nur wenige Zeilen lang? Oder wie beim Fehler vorher, hat der Google News-Crawler Probleme, das Artikel-Template zu “lesen” und erkennt nicht den vollen Text als Inhalt. Hier kann eine Fragmentierung des Artikels durch DIVs, Boxen mit weiterführenden Links, Werbemittel o.Ä. dazu führen, dass der Crawler zu früh aussteigt und dann die Fehlermeldung “Artikel zu kurz” auswirft.
  • Artikeltext nicht gefunden:  siehe die beiden Punkte zuvor, nur dass er den Inhalt einfach komplett nicht erkennt.
  • Artikel zu alt: Ursache ist meistens, dass das Artikel-Datum beim Einreichen des Artikels älter als 24 Stunden in der Vergangenheit lag. Damit ist der Artikel für Google News zu alt.
  • Titel nicht gefunden: hat meist zwei häufige Ursachen: 1. Probleme mit dem Artikeltemplate wie bei den ersten Fehlern (siehe oben). 2. Der Title enthält nur ein Wort – dies wird von Google News nicht als valider Title akzeptiert. Kleiner Tipp: Es ist ratsam, dass Title und H1 identisch sind.

Also mir gefällt das Webmaster Tool-Update zum Handling der Crawling-Fehler sehr gut, Vanessa Fox äußert  sich ja etwas enttäuscht und auch hier liest man leichte Kritik (hier offizieller Google Blogpost dazu). Wie siehst Du das – kannst Du damit besser arbeiten?

SEO und Online-Marketing für redaktionelle Inhalte

Contentdriven.de ist ein Blog zum Thema Suchmaschinen-Optimierung und Online-Marketing für redaktionelle Inhalte und Nachrichten-Portale. Schwerpunkt-Themen sind SEO für Redakteure und die Optimierung für Google News. Wer schreibt hier? Mehr über den Autor erfahren.

 RSS-Feed abonnieren

Hinterlasse einen Kommentar

{ 3 Trackbacks }

Vorheriger Beitrag:

Nächster Beitrag: