it-swarm.com.de

Laut Google Webmaster Tools handelt es sich bei meiner XML-Sitemap anscheinend um eine HTML-Seite.

Wir betreiben viele Websites und haben in den Webmaster-Tools viele dieser Fehler festgestellt:

Sitemap ist HTML
Ihre Sitemap scheint eine HTML-Seite zu sein. Bitte verwenden Sie stattdessen ein unterstütztes Sitemap-Format.

Eine der problematischen Sitemaps:

<?xml version="1.0" encoding="UTF-8"?> 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
    <url> 
        <loc>http://www.same_domain.co.uk/folder/file1.shtml</loc> 
        <lastmod>2011-05-11</lastmod> 
        <changefreq>weekly</changefreq> 
        <priority>0.5</priority> 
    </url> 
    <url> 
        <loc>http://www.same_domain.co.uk/folder/file2.shtml</loc> 
        <lastmod>2011-05-11</lastmod> 
        <changefreq>weekly</changefreq> 
        <priority>0.5</priority> 
    </url> 
    <url> 
        <loc>http://www.same_domain.co.uk/folder/file3.shtml</loc> 
        <lastmod>2011-05-11</lastmod> 
        <changefreq>weekly</changefreq> 
        <priority>0.5</priority> 
    </url> 
    <url> 
        <loc>http://www.same_domain.co.uk/folder/file4.shtml</loc> 
        <lastmod>2011-05-11</lastmod> 
        <changefreq>weekly</changefreq> 
        <priority>0.5</priority> 
    </url> 
</urlset>

Warum glauben GWTs, dass dies alles andere als XML ist?

(Server: IIS)


Bearbeiten:

"Dieses Dokument wurde erfolgreich als wohlgeformtes XML geprüft!" -W3C Validator.


Bearbeiten:

Ich habe zwei problematische Sitemaps erneut eingereicht, eine ohne Änderungen und eine mit ein paar zusätzlichen Zeilen, um sicherzustellen, dass sie als XML behandelt werden. Führen Sie das Diagnosetool "Als Googlebot abrufen" aus. Beiden geht es jetzt gut. Ich werde einfach alle Sitemaps mit dem Fehler "Sitemap ist HTML" erneut senden

Die Frage bleibt:

Warum ist das passiert? Warum hielten GWTs diese XML-Sitemaps für HTML?

6
Adam Lynch

Der Vorschlag von Farseeker ist ein guter erster Schritt bei der Fehlerbehebung (ein text/html -Inhaltstyp würde mit Sicherheit zu diesem Ergebnis führen). Die Google Webmaster-Tools sollten eine andere Fehlermeldung anzeigen, wenn die Sitemap-Datei ungültiges XML enthält.

Haben Sie in Anbetracht der vorübergehenden Natur des Problems Ihre Serverprotokolle überprüft, um festzustellen, ob eine Fehlerseite aufgrund der vorherigen Anfragen von Google erstellt wurde?

Wenn Sie Sitemap-Dateien dynamisch generieren, kann ein Skriptfehler, ein Datenbank-Timeout oder ein anderes Problem zeitweise zu einer HTML-Fehlerseite führen.

2
danlefree

Wegen des content-type -Headers, den es ausspuckt. Überprüfen Sie es mit Ihrem Lieblingswerkzeug (Firebug usw.) und sehen Sie, was es sendet.

3
Mark Henderson

Sie können den Header so erweitern, dass er die Schemas enthält:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">

und dann online validieren

Wenn es geht, muss es Googles Problem sein.

1
paulmorriss

Überprüfen Sie, ob Probleme auf dem Webserver vorliegen. Oder wenn die Google IP gesperrt ist. Wenn Sie ein protokollbasiertes Tracking-System verwenden, versuchen Sie, die Google Bot-Aktivität zu analysieren. Wir hatten vor kurzem das gleiche Problem und stellten fest, dass wir Google Bots aufgrund von Data Mining nicht erlauben konnten, durch die Änderung der IP-Adresse von Google zu crawlen. Problem wurde endlich behoben.

0
Tapan Patel