joerghuelsermann.de Sonderzeichen verwenden

Sonderzeichen verwenden

Zeichen in Internetadressen

Diverse Zeichen wie die deutschen Sonderzeichen sollte man für eine URL als eine Adresse im Internet anders darstellen. Oder man geht gleich dazu über die folgenden Zeichen erst gar nicht zu verwenden.

Zeichendarstellung in einer Internetadresse
ZeichenZeichen in Internetadresse
&%26
" "%20
'%27
é%C3%A9
ß%C3%9F
ä%C3%A4
ö%C3%B6
ü%C3%BC
Ä%C3%84
Ö%C3%96
Ü%C3%9C

Kodieren einer Internetadresse

Nach Schreiben dieser Seite fiel mir auf das mit Hilfe von PHP man praktisch als Einzeiler schnell eine Kodierung einer Internetadresse erreichen kann. Deshalb habe ich dann den Mehrzeiler der sich dann doch daraus entwickelt hat noch auf dieser Seite eingefügt. Die Ausgabe wird aber in der Form erfolgen wie eine URL korrekt in einer Webseite eingebunden wird.

Dieses geschieht mit der Funktion rawurlencode , die daraufhin wenn dem Zeichen theorethisch eine spezielle Bedeutung zukommen kann wieder ersetzt wird. Für solche Fälle wenn einem speziellen Zeichen keine Bedeutung zukommt wird zusätzlich auch eine Ausgabe getätigt die das kodierte Zeichen enthält. Deshalb sollte man nur den Teil einer Adresse eingeben die Probleme bereitet.

Url kodieren

Liste der Zeichen die nicht kodiert werden

HTML und XML

Wirkliche Schwierigkeiten bereitet nur das & Zeichen bei Verwendung des Zeichensatzes UTF-8 in HTML oder XML, welches man als Entity & oder als & in der hexadezimalen UTF-8 Schreibweise angeben kann. Die deutschen Umlaute sind überhaupt kein Problem ohne Verwendung einer Entity entsprechend darzustellen. In einigen Fällen wenn man auf externe Adressen verweist kann es vorkommen, das man das Zeichen für eine URL man doch durch eine dieser beiden Möglichkeiten ersetzen muss. Es ist in den Fällen der Fall wenn dem & Zeichen eine spezielle Bedeutung zu kommt.