Ersetzbare Entitäten unter UTF-8
Definiert wurden diese benannten Entitäten mit HTML für den Zeichensatz ISO 8859-1 auch bekannt als Latin-1. An dieser Stelle die Zeichenreferenz.
Die benannte Entität für das einfache Anführungszeichen wurde erst später eingeführt. Für XML und somit auch XHTML benötigt man bei Verwendung des Zeichensatzes UTF-8 daher nur &, < und >, wenn man nicht gerade in einem Attribut ein Anführungszeichen verwenden möchte.
Funktionen in PHP
An dieser Stelle geht es um die durch get-html-translation-table benannten Entitäten die durch die folgenden PHP Funktionen betroffen sind.
Betroffene Entitäten
Die Funktion htmlspecialchars wirkt sich deshalb auch nur auf die für XML definierten Entitäten aus. Dagegen kann mit beiden Funktionen die Entitäten zu Zeichen umwandeln, ausser den hier genannten alle Zeichenreferenzen in Unicode Schreibweise umwandeln.
Aufbau einer Entität
Alle Entitäten beginnen mit & und enden mit dem ; Zeichen. In der folgenden Tabelle fehlen diese beiden Zeichen und müssen entsprechend ergänzt werden. Für die Unicode Zeichenreferenzen folgt nach dem & Zeichen ein # und in hexadezimaler Schreibweise zusätzlich noch ein x. Führende Nullen können angegeben werden und die hexadezimale Form lässt Großschreibung sowie Kleinschreibung zu.
| Zeichen | Benannt | Unicode Dezimal | Unicode Hexadezimal |
|---|---|---|---|
| " | quot | #34 | #x22 |
| & | amp | #38 | #x26 |
| ' | apos | #39 | #x27 |
| < | lt | #60 | #x3c |
| > | gt | #62 | #x3e |
| nbsp | #160 | #xa0 | |
| ¡ | iexcl | #161 | #xa1 |
| ¢ | cent | #162 | #xa2 |
| £ | pound | #163 | #xa3 |
| ¤ | curren | #164 | #xa4 |
| ¥ | yen | #165 | #xa5 |
| ¦ | brvbar | #166 | #xa6 |
| § | sect | #167 | #xa7 |
| ¨ | uml | #168 | #xa8 |
| © | copy | #169 | #xa9 |
| ª | ordf | #170 | #xaa |
| « | laquo | #171 | #xab |
| ¬ | not | #172 | #xac |
| | shy | #173 | #xad |
| ® | reg | #174 | #xae |
| ¯ | macr | #175 | #xaf |
| ° | deg | #176 | #xb0 |
| ± | plusmn | #177 | #xb1 |
| ² | sup2 | #178 | #xb2 |
| ³ | sup3 | #179 | #xb3 |
| ´ | acute | #180 | #xb4 |
| µ | micro | #181 | #xb5 |
| ¶ | para | #182 | #xb6 |
| · | middot | #183 | #xb7 |
| ¸ | cedil | #184 | #xb8 |
| ¹ | sup1 | #185 | #xb9 |
| º | ordm | #186 | #xba |
| » | raquo | #187 | #xbb |
| ¼ | frac14 | #188 | #xbc |
| ½ | frac12 | #189 | #xbd |
| ¾ | frac34 | #190 | #xbe |
| ¿ | iquest | #191 | #xbf |
| À | Agrave | #192 | #xc0 |
| Á | Aacute | #193 | #xc1 |
| Â | Acirc | #194 | #xc2 |
| Ã | Atilde | #195 | #xc3 |
| Ä | Auml | #196 | #xc4 |
| Å | Aring | #197 | #xc5 |
| Æ | AElig | #198 | #xc6 |
| Ç | Ccedil | #199 | #xc7 |
| È | Egrave | #200 | #xc8 |
| É | Eacute | #201 | #xc9 |
| Ê | Ecirc | #202 | #xca |
| Ë | Euml | #203 | #xcb |
| Ì | Igrave | #204 | #xcc |
| Í | Iacute | #205 | #xcd |
| Î | Icirc | #206 | #xce |
| Ï | Iuml | #207 | #xcf |
| Ð | ETH | #208 | #xd0 |
| Ñ | Ntilde | #209 | #xd1 |
| Ò | Ograve | #210 | #xd2 |
| Ó | Oacute | #211 | #xd3 |
| Ô | Ocirc | #212 | #xd4 |
| Õ | Otilde | #213 | #xd5 |
| Ö | Ouml | #214 | #xd6 |
| × | times | #215 | #xd7 |
| Ø | Oslash | #216 | #xd8 |
| Ù | Ugrave | #217 | #xd9 |
| Ú | Uacute | #218 | #xda |
| Û | Ucirc | #219 | #xdb |
| Ü | Uuml | #220 | #xdc |
| Ý | Yacute | #221 | #xdd |
| Þ | THORN | #222 | #xde |
| ß | szlig | #223 | #xdf |
| à | agrave | #224 | #xe0 |
| á | aacute | #225 | #xe1 |
| â | acirc | #226 | #xe2 |
| ã | atilde | #227 | #xe3 |
| ä | auml | #228 | #xe4 |
| å | aring | #229 | #xe5 |
| æ | aelig | #230 | #xe6 |
| ç | ccedil | #231 | #xe7 |
| è | egrave | #232 | #xe8 |
| é | eacute | #233 | #xe9 |
| ê | ecirc | #234 | #xea |
| ë | euml | #235 | #xeb |
| ì | igrave | #236 | #xec |
| í | iacute | #237 | #xed |
| î | icirc | #238 | #xee |
| ï | iuml | #239 | #xef |
| ð | eth | #240 | #xf0 |
| ñ | ntilde | #241 | #xf1 |
| ò | ograve | #242 | #xf2 |
| ó | oacute | #243 | #xf3 |
| ô | ocirc | #244 | #xf4 |
| õ | otilde | #245 | #xf5 |
| ö | ouml | #246 | #xf6 |
| ÷ | divide | #247 | #xf7 |
| ø | oslash | #248 | #xf8 |
| ù | ugrave | #249 | #xf9 |
| ú | uacute | #250 | #xfa |
| û | ucirc | #251 | #xfb |
| ü | uuml | #252 | #xfc |
| ý | yacute | #253 | #xfd |
| þ | thorn | #254 | #xfe |
| ÿ | yuml | #255 | #xff |