joerghuelsermann.de Ersetzbare Entitäten unter UTF-8

Ersetzbare Entitäten unter UTF-8

Definiert wurden diese benannten Entitäten mit HTML für den Zeichensatz ISO 8859-1 auch bekannt als Latin-1. An dieser Stelle die Zeichenreferenz.

Die benannte Entität für das einfache Anführungszeichen wurde erst später eingeführt. Für XML und somit auch XHTML benötigt man bei Verwendung des Zeichensatzes UTF-8 daher nur &, < und >, wenn man nicht gerade in einem Attribut ein Anführungszeichen verwenden möchte.

Funktionen in PHP

An dieser Stelle geht es um die durch get-html-translation-table benannten Entitäten die durch die folgenden PHP Funktionen betroffen sind.

Betroffene Entitäten

Die Funktion htmlspecialchars wirkt sich deshalb auch nur auf die für XML definierten Entitäten aus. Dagegen kann mit beiden Funktionen die Entitäten zu Zeichen umwandeln, ausser den hier genannten alle Zeichenreferenzen in Unicode Schreibweise umwandeln.

Aufbau einer Entität

Alle Entitäten beginnen mit & und enden mit dem ; Zeichen. In der folgenden Tabelle fehlen diese beiden Zeichen und müssen entsprechend ergänzt werden. Für die Unicode Zeichenreferenzen folgt nach dem & Zeichen ein # und in hexadezimaler Schreibweise zusätzlich noch ein x. Führende Nullen können angegeben werden und die hexadezimale Form lässt Großschreibung sowie Kleinschreibung zu.

Betroffene benannte Entitäten bei den erwähnten PHP Funktionen in verschiedenen Schreibweisen
ZeichenBenanntUnicode DezimalUnicode Hexadezimal
"quot#34#x22
&amp#38#x26
'apos#39#x27
<lt#60#x3c
>gt#62#x3e
nbsp#160#xa0
¡iexcl#161#xa1
¢cent#162#xa2
£pound#163#xa3
¤curren#164#xa4
¥yen#165#xa5
¦brvbar#166#xa6
§sect#167#xa7
¨uml#168#xa8
©copy#169#xa9
ªordf#170#xaa
«laquo#171#xab
¬not#172#xac
­shy#173#xad
®reg#174#xae
¯macr#175#xaf
°deg#176#xb0
±plusmn#177#xb1
²sup2#178#xb2
³sup3#179#xb3
´acute#180#xb4
µmicro#181#xb5
para#182#xb6
·middot#183#xb7
¸cedil#184#xb8
¹sup1#185#xb9
ºordm#186#xba
»raquo#187#xbb
¼frac14#188#xbc
½frac12#189#xbd
¾frac34#190#xbe
¿iquest#191#xbf
ÀAgrave#192#xc0
ÁAacute#193#xc1
ÂAcirc#194#xc2
ÃAtilde#195#xc3
ÄAuml#196#xc4
ÅAring#197#xc5
ÆAElig#198#xc6
ÇCcedil#199#xc7
ÈEgrave#200#xc8
ÉEacute#201#xc9
ÊEcirc#202#xca
ËEuml#203#xcb
ÌIgrave#204#xcc
ÍIacute#205#xcd
ÎIcirc#206#xce
ÏIuml#207#xcf
ÐETH#208#xd0
ÑNtilde#209#xd1
ÒOgrave#210#xd2
ÓOacute#211#xd3
ÔOcirc#212#xd4
ÕOtilde#213#xd5
ÖOuml#214#xd6
×times#215#xd7
ØOslash#216#xd8
ÙUgrave#217#xd9
ÚUacute#218#xda
ÛUcirc#219#xdb
ÜUuml#220#xdc
ÝYacute#221#xdd
ÞTHORN#222#xde
ßszlig#223#xdf
àagrave#224#xe0
áaacute#225#xe1
âacirc#226#xe2
ãatilde#227#xe3
äauml#228#xe4
åaring#229#xe5
æaelig#230#xe6
çccedil#231#xe7
èegrave#232#xe8
éeacute#233#xe9
êecirc#234#xea
ëeuml#235#xeb
ìigrave#236#xec
íiacute#237#xed
îicirc#238#xee
ïiuml#239#xef
ðeth#240#xf0
ñntilde#241#xf1
òograve#242#xf2
óoacute#243#xf3
ôocirc#244#xf4
õotilde#245#xf5
öouml#246#xf6
÷divide#247#xf7
øoslash#248#xf8
ùugrave#249#xf9
úuacute#250#xfa
ûucirc#251#xfb
üuuml#252#xfc
ýyacute#253#xfd
þthorn#254#xfe
ÿyuml#255#xff