Startseite SEO
|
 |
 |
 |
 |
|
|
|
 |
Sitemap Indexdatei |
05.11.2008 Sitemaps dürfen nur 50.000 Dateinamen enthalten, bzw. dürfen nur 10MB groß sein, damit die Web-Server nicht in die Knie gehen. Was macht man bei größeren Websites?
Enthält eine Site mehr als 50.000 Dateinamen, müssen mehrere Sitemap-Dateien zu je maximal 50.000 URLs oder maximal 10 MB Größe erstellt werden. Wurden so mehrere Sitemaps.xml erstellt, kann man diese in einer Sitemap Indexdatei (Sitemap Index File) für die Robots bereitstellen. Eine Sitemap Indexdatei darf 1.000 Sitemap-Dateien enthalten.
Somit kann man 50.000 * 1.000 = 50.000.000 = maximal 50 Millionen Dateien in der sitemap_index.xml einer Website bereit stellen.
Moderne kostenlose Sitemap-Tools wie z.B. derGsiteCrwaler erstellen jeweils für 40.000 URLs eine sitemap.xml und dazu noch den Sitemap Index File.
|
Protokoll der Sitemap Indexdatei |
Das Protokoll der Sitemap Indexdatei wird ausführlich in den Google Webmaster Tools beschrieben. Die Allgemeine Form ist
<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.beispiel.de/sitemap1.xml.gz</loc> <lastmod>2008-11-05T13:07:17+00:00</lastmod> <changefreq>monthly</changefreq> <priority >0.9</priority> </sitemap> <sitemap> <loc>http://www.beispiel.de/sitemap2.xml.gz</loc> <lastmod>2008-11-04</lastmod> <changefreq>weekly</changefreq> <priority >0.8</priority> </sitemap> </sitemapindex>
Wie bei der Sitemap.xml sind auch hier die Werte der Parameter changefreq und priority lediglich Empfehlungen für die Bots und keine Kommandos. Werden aber z.B. keine unterschiedlichen Prioritäten angegeben, meckern die Webmaster Tools. Bei der Verwendung der Parameter changefreq und priority erwartet der Googlebot, daß die einzelnen Dateien unterschiedlich priorisiert werden. Alle URLs auf always und 1.0 zu setzen, bringt also überhaupt nichts.
|
Codeseite UTF-8 |
Weiterhin wird erwartet, daß die Sitemap Indexdatei in der Codeseite UTF-8 codiert ist.
Beispielsweise sieht der Webcode http://www.beispiel.de/übung.html&q=name da in UTF-8 so aus: http://www.beispiel.de/%C3%BCbung.html&q=name Die Sitemap dann dann ebenfalls mit gzip komprimiert werden, darf im unkomprimierten Zsutand allerdings auch nicht größer als 10 MB sein.
|
Ordner der Sitemap |
Der Ordner, in dem die Sitemap Datei abgelegt ist, legt die Dateien fest, die von den Bots indiziert werden. Daher sollte man die Sitemap immer in das Quellverzeichnis des Webservers. Eine Sitemap im Verzeichnis http//www.beispiel.de/Artikel/sitemap.gz findet alle URLs unter dem Verzeichnis http//www.beispiel.de/Artikel aber nicht die URLs im Verzeichnis http//www.beispiel.de
Allerdings kann man über die Robot.txt auch einen anderen Ort für die Sitemap bestimmen. Die Bots finden die Sitemap aber nur, wenn die Bots die Robot.txt auch auswerten.
|
Sitemaps bei Suchmaschinen anmelden |
Nach der Erstellung der Sitemaps z.B. mit dem kostenlosen GsiteCrawaler sollten diese auch bei den Suchmaschinen angemeldet werden. Die wichtigsten Anmeldungen per PING sind
http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.beispiel.de/sitemap.xml http://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap=http://www.beispiel.de/sitemap.xml http://submissions.ask.com/ping?sitemap=http://www.beispiel.de/sitemap.xml http://webmaster.live.com/ping.aspx?siteMap=http://www.beispiel.de/sitemap.xml
oder man meldet die Sitemap gleich gemeinsam an mit
http://www.sitemapwriter.com/notify.php?crawler=all&url=http://www.beispiel.de/sitemap.xml
|
Sitemap in shop to date |
In shop to date wird man mit der Erstellung von Sitemap Indexdateien nicht konfrontiert, weil dieses CMS einfach zu klein für derartig große Websites ist.
Normale Sitemap Dateien kann man mit s2d freilich einrichten und auf der Website mit dem Plugin Sitemap auch auf einer Unterseite für den Besucher grafisch ansprechend darstellen.
|
Zusammenfassung |
Die Sitemap Indexdatei wird immer dann erstellt, wenn mehrere Sitemap Dateien erforderlich sind, um mehr als 50.000 Unterseiten einer Website crawlbar zu machen.
Dr. Wolf Blass & Sabine Blass
|
Kommentare |
Hier klicken, um einen Kommentar zu schreiben
|
|
|