it-swarm.com.de

Wie funktionieren Sonderzeichen in einer URL? Sind die gefälscht?

Ich bin auf eine URL mit nicht-lateinischen Zeichen mit koreanischen Glyphen gestoßen:

http://en.wiktionary.org/wiki/여보세요

Durch Kopieren erhalte ich eine andere URL:

http://en.wiktionary.org/wiki/%EC%97%AC%EB%B3%B4%EC%84%B8%EC%9A%94

Welche Technologie steckt dahinter? Ist es nur Google Chrome browser "magic" oder steckt tatsächlich UTF-8 oder ähnliches dahinter?

1
grunwald2.0

Die Technologie dahinter heißt Internationalized Resource Identifiers (IRIs) und ist in RFC 3987 definiert. Die Verwendung in URLs ist in RFC 3986 definiert. Zeichen sind in der Tat in UTF-8 kodiert. Das "unlesbare" Formular ist UTF-8 konvertiert mit roher Prozentcodierung.

4
vartec

Die Zeichen müssen wie in Ihrer "unlesbaren" Version codiert sein, damit sie von der gesamten Software richtig interpretiert werden.

Was in Chrome geschehen muss, ist, dass diese nur zur Anzeige in ihre Unicode-Version konvertiert werden.

1
ChrisF