it-swarm.com.de

Et-Zeichen (&) in der tatsächlichen URL und Sitemap

Ich habe eine Sitemap (die zur Indizierung an Google gesendet wird), in der ich URLs hinzufüge, die ein kaufmännisches Und (&) enthalten. Da in der Sitemap & maskiert werden muss, habe ich & in den URLs in der Sitemap durch & ersetzt. Meine eigentlichen Seiten-URLs enthalten nur &.

Da ich neu bei Google Webmaster und SEO bin, möchte ich verstehen, ob dieser Unterschied zwischen kaufmännischem Und in URL und Sitemap Probleme verursacht. Werden meine Seiten indiziert? Dies mag wie eine Frage auf Noob-Ebene erscheinen, da ich auf die Site zugreifen kann, nachdem ich & durch & in der URL ersetzt habe. Trotzdem wird jede Hilfe an dieser Front sehr geschätzt.

3
user109308

wenn dieser Unterschied zwischen kaufmännischem und in URL und Sitemap ein Problem verursacht.

tl; dr Kein Problem, da die RLs identisch sind.

Da in der Sitemap _&_ entkommen werden muss, habe ich _&_ durch _&_ ersetzt ...

Ihre Sitemap ist ein XML-Dokument. Wie bei jedem XML-Dokument müssen die Datenwerte XML-entitätscodiert gespeichert werden. Das Zeichen _&_ ist ein Sonderzeichen (es bezeichnet selbst den Anfang einer XML-Entität) und muss daher codiert werden, um seine spezielle Bedeutung zu negieren. Dies ist nur die Art und Weise, wie Daten gespeichert werden in einem XML-Dokument.

Wenn das XML-Dokument von einem XML-Parser gelesen wird, sind die Datenwerte XML-Entity decoded, zurück zum tatsächlichen Wert. So wird _&_ zu _&_, wenn das XML-Dokument gelesen wird.

Eine URL der Form _/page?foo=1&bar=2_, die in einem XML-Dokument ​​gespeichert ist identisch mit der URL _/page?foo=1&bar=2_ in Ihrem HTML5-Dokument.

Meine eigentlichen Seiten-URLs enthalten nur _&_

In HTML5 ist das vollkommen in Ordnung, vorausgesetzt, es gibt keine Mehrdeutigkeiten. In HTML4.1 (und früheren Versionen) hätten Sie jedoch die HTML-Entität korrekt codieren müssen, um in Ihrem HTML-Quellcode für gültiges HTML _&_ als _&_ zu codieren. Browser sind jedoch sehr tolerant und Ihr HTML-Dokument hätte höchstwahrscheinlich noch "funktioniert".

In HTML5 müssen Sie ausschließlich need, um die _&_ -Entität zu codieren, wenn es eine Mehrdeutigkeit gibt. Nehmen Sie das folgende erfunden Beispiel. Wir wollen die Literalzeichenfolge "& dollar;" im URL-Parameter foo.

_<!-- In an HTML document (WRONG) -->
<a href="/page?foo=&dollar;">link</a>
_

Die Gewünschte URL ist _http://example.com/page?foo=&dollar;_, der obige HTML-Anker führt jedoch dazu, dass der Benutzer an _http://example.com/page?foo=$_ gesendet wird - was nicht beabsichtigt ist. Um das gewünschte Ergebnis zu erzielen, muss die _&_ must ​​HTML-Entität codiert sein, um ihre spezielle Bedeutung zu negieren. Dies führt zu folgendem (korrektem) HTML:

_<!-- In an HTML document (CORRECT) -->
<a href="/page?foo=&amp;dollar;">link</a>
_

Es ist immer sicherer, die _&_ in Ihrem HTML-Dokument konsistent mit einer HTML-Entität zu kodieren. Wenn Sie Ihre Inhalte über ein CMS generieren, sollte dies automatisch erfolgen.

Ich kann auf die Site zugreifen, nachdem ich _&_ durch _&amp;_ in der URL ersetzt habe.

Vermutlich meinst du "in der URL, in deinem HTML"? Denn wenn Sie eine HTML-Entität haben, kodieren Sie den _&_ mit _&amp;_ in der Adressleiste des Browsers (zum Beispiel). Außerhalb eines HTML-Kontexts erhalten Sie dann nicht die erwarteten Ergebnisse. Wenn Sie beispielsweise Folgendes direkt in die Adressleiste des Browsers eingegeben haben:

_/page?foo=1&amp;bar=2
_

Dann würden Sie die beiden URL-Parameter _[foo] => 1_ und _[amp;bar] => 2_ erhalten, was eindeutig nicht beabsichtigt ist.

4
MrWhite

Die URLs, die Sie in die Sitemap aufnehmen, müssen dem RFC-3986-Standard entsprechen. Wie Sie im Google Official Guide lesen können, muss & mit &amp; maskiert werden, damit Sie loslegen können.

Sobald Sie Ihre Sitemap über Google Searh Console einreichen, können Sie jedoch feststellen, ob ein Problem mit den übermittelten URLs vorliegt.

Nur für den Fall, dass Sie nur die endgültigen URLs angeben sollten, bedeutet dies, dass Sie möglicherweise einige Parameter vermeiden könnten. Zum Beispiel:

 - https://example.com/shoes (good one)
 - https://example.com/shoes?order=1&amp;color=blue (remove this one)
2
Emirodgar