Zum Inhalt springen

Codes europäischer Sonderzeichen

Die Unicodes und HTML-Entitäten der Europäische Sonderzeichen, Euro Sonderzeichen, diakritische Zeichen und Sonderbuchstaben

INFO: Im dritten Artikel »Codes europäischer Sonderzeichen« geht es um die Unicodes und die HTML-Entitäten dieser. Im ersten Artikel »Europäische Sonderzeichen« habe ich aufgezeigt, wie vielfältig die Alphabete der europäischen Sprachen sind, die in lateinischen Buchstaben schreiben. Im zweiten Artikel »Eingabe europäischer Sonderzeichen« ging es die Eingabe per Tastatur dieser Zeichen. Wie immer unter dem Motto »Von Null auf …« stelle ich hier die Unicodes und die HTML-Entitäten vor. Das ist etwas für technisch interessierte »Feinschmecker«.

Am Ende des Artikel finden sie die Codes europäischer Sonderzeichen als Tabelle aller 198 diakritische Zeichen und Sonderbuchstaben, die vor allem Font-Designer helfen soll, die nötigen Zeichen in ihrem Zeichensatz zu erstellen.

(Download:) Die Artikelserie »Europäische Sonderzeichen« steht auch als PDF-Download (7,2 MB) hier zur Verfügung.
(Hilfe:) Probleme beim Download?
English: The article series »European Special Characters« is also available as a PDF download (7.2 MB) here.

ASCII-7 war der Anfang

ASCII-7 steht für »American Standard Code for Information Interchange« in der 7-Bit-Kodierung. So konnten Ab dem Jahr 1963 konnten so 27 = 128 Zeichen kodiert werden, wobei 33 nicht druckbare und 95 druckbare Zeichen enthalten war. Aus dem lateinischen Alphabet waren es die Kleinbuchstaben »a« bis »z« und die Großbuchstaben »A« bis »Z«, sowie die Ziffern »0« bis »9« und (mathematische) Sonderzeichen wie Klammern und Interpunktionszeichen.

ASCII-8 mit internationalen Zeichen

Mit Verbreitung der Personal Computers (PC) durch Apple, Atari, Commodore, IBM und anderen wuchs der Wunsch nach nationalen Zeichen aus den europäischen Ländern. Ab 1981 wurde dies mit Einführung von ASCII-8 in der 8-Bit-Kodierung möglich. IBM bot 18 unterschiedliche Kodierungen an, die auch nicht-lateinische Schriftzeichen umfassten.

Unicode – Zeichen für alle

Im Jahr 1991 wurde Unicode 1.0 vorgestellt, das zu nächst europäischen, nahöstlichen und indischen Schriften umfasst. Später kamen zahlreiche weitere Alphabete hinzu. Inzwischen gehören auch viele mathematische und anderen Zeichen dazu, genau wie Währungszeichen und Emojis.
Jedes Zeichen im Unicode hat seine Nummer und diese wird beim Font-Design dem Buchstaben (Glyphe) entsprechend zugewiesen. Es lassen sich theoretisch 1.114.112 verschiedenen Zeichen damit kodieren. Es gibt zwei wichtige UTF-Kodierungsverfahren: UTF-8 und UTF-16. Darunter finden sich auch die Codes europäischer Sonderzeichen.

UTF-8 basiert auf einem 8-Bit-System, in dem die ersten 128 Zeichen mit dem ursprünglichen ASCII identisch sind.

UTF-16 basiert auf einem 16-Bit-System und erlaubt die Darstellung von Zeichen in ein oder zwei 16-Bits. Letzte sind schon notwenig, um die deutschen Umlaute zu kodieren.

U+xxxx So kann jedes Unicode-Zeichen beschrieben werden. Dabei stehen die vier »xxxx« für die Hexadezimalzahlen von »0000« bis »FFFF«. Das kleine »ß« hat die Nummer »U+00DF«. Jenseits von UTF-8 können die Zahlen nach dem »U+« auch sechstellig sein.

Unicode in HTML und HTML-Entitäten

HTML (Hypertext Markup Language) ist die Auszeichnungsprache in der Internet-Seiten programmiert werden. In HTML können die Unicode-Zeichen ebenfalls dargestellt werden. Statt »U+« beginnen die Darstellung mit »&#x« gefolgt von vier hexadezimal Zahlen: »�« bis »«. Daneben gibt es noch die dezimale Schreibweise ohne das »x« und von dezimale Ziffern gefolgt. So ist das »ß« hexadezimal »ß« oder dezimal »ß«. Die HTML-Schreibweise »&#…;«, die mit einem Semikolon endet, wird als numerische HTML-Entität bezeichnet. Jedes Unicode-Zeichen läßt sich mit einer numerischen HTML-Entität beschreiben, so auch die Codes europäischer Sonderzeichen.

Als weitere Schreibweise in HTML gibt es noch die benannten HTML-Entitäten. Sie haben statt einer Nummer eine Abkürzung, die das Zeichen beschreibt. So ist das »ß« als HTML-Entität »ß«. Jedoch nicht jedes Unicode-Zeichen hat so eine HTML-Entität. Das deutsche Lang-S »ſ« Unicode »U+017F« oder HTML »ſ« bzw. »&#x17F« hat keine. – Warum? Fragen Sie das W3C 🙂

Codes europäischer Sonderzeichen in Unicode und als HTML-Entitäten

Die 19 diakritschen Zeichen der europäische Sonderzeichen, die vor allem für das Font-Design benötigt werden, sehen so aus:

NameUnicodedez. HTMLhex. HTMLnamed HTML
̈U+00A8;¨¨¨
¯U+00AF;¯¯¯
́U+00B4;´´´
˘U+02D8;˘˘˘
̧U+00B8;¸¸¸
̒U+031B;̛̛./.
̋U+02DD;˝˝˝
̏U+030F;̏̏&DiacriticalDoubleGrave;
̀U+0060;```
̌U+02C7;ˇˇˇ
̦U+02DB;˛˛˛
̊U+02DA;˚˚˚
·U+00B7;···
̨U+0328;̨̨./.
̣U+0323;̣̣./.
˙U+02D9;˙˙˙
̷U+0337;̷̷./.
̃U+02DC;˜˜˜
ˆU+02C6;ˆˆˆ
Tabelle der 19 europäischen diakritischen Zeichen als Unicode und HTML-Entitäten.

198 Codes europäischer Sonderzeichen

198 Codes europäischer Sonderzeichen in Unicode und HTML-Entitäte sehen so aus:

NameUnicodedez. HTMLhex. HTMLnamed HTML
ÁU+00C1;ÁÁÁ
áU+00E1;ááá
ĂU+0102;ĂĂĂ
ăU+0103;ăăă
ÂU+00C2;ÂÂÂ
âU+00E2;âââ
ÅU+00C5;ÅÅÅ
åU+00E5;ååå
ÄU+00C4;ÄÄÄ
äU+00E4;äää
ǞU+01DE;ǞǞ./.
ǟU+01DF;ǟǟ./.
ÃU+00C3;ÃÃÃ
ãU+00E3;ããã
ĄU+0104;ĄĄĄ
ąU+0105;ąąą
ĀU+0100;ĀĀĀ
āU+0101;āāā
ÆU+00C6;ÆÆÆ
æU+00E6;ææ&aElig;
ĆU+0106;ĆĆĆ
ćU+0107;ććć
ĈU+0108;ĈĈĈ
ĉU+0109;ĉĉĉ
ĊU+010A;ĊĊĊ
ċU+010B;ċċċ
ÇU+00C7;ÇÇÇ
çU+00E7;ççç
ĎU+010E;ĎĎĎ
ďU+010F;ďďď
U+1E10;ḐḐ./.
U+1E11;ḑḑ./.
ĐU+0110;ĐĐĐ
đU+0111;đđđ
ÐU+00D0;ÐÐÐ
ðU+00F0;ððð
ÉU+00C9;ÉÉÉ
éU+00E9;ééé
ÊU+00CA;ÊÊÊ
êU+00EA;êêê
ĚU+011A;ĚĚĚ
ěU+011B;ěěě
ËU+00CB;ËËË
ëU+00EB;ëëë
ĖU+0116;ĖĖĖ
ėU+0117;ėėė
ĘU+0118;ĘĘĘ
ęU+0119;ęęę
ĒU+0112;ĒĒĒ
ēU+0113;ēēē
ĞU+011E;ĞĞĞ
ğU+011F;ğğğ
ĜU+011C;ĜĜĜ
ĝU+011D;ĝĝĝ
ĠU+0120;ĠĠĠ
ġU+0121;ġġġ
ĢU+0122;ĢĢĢ
ģU+0123;ģģ&gcedil;
ĤU+0124;ĤĤĤ
ĥU+0125;ĥĥĥ
ĦU+0126;ĦĦĦ
ħU+0127;ħħħ
İU+0130;İİİ
ıU+0131;ııı
ÍU+00CD;ÍÍÍ
íU+00ED;ííí
ÌU+00CC;ÌÌÌ
ìU+00EC;ììì
ÎU+00CE;ÎÎÎ
îU+00EE;îîî
ÏU+00CF;ÏÏÏ
ïU+00EF;ïïï
ĨU+0128;ĨĨĨ
ĩU+0129;ĩĩĩ
ĮU+012E;ĮĮĮ
įU+012F;įįį
ĪU+012A;ĪĪĪ
īU+012B;īīī
IJU+0132;IJIJIJ
ijU+0133;ijijij
ĴU+0134;ĴĴĴ
ĵU+0135;ĵĵĵ
ĶU+0136;ĶĶĶ
ķU+0137;ķķķ
ĹU+0139;ĹĹĹ
ĺU+013A;ĺĺĺ
ĻU+013B;ĻĻĻ
ļU+013C;ļļļ
ŁU+0141;ŁŁŁ
łU+0142;łłł
ĿU+013F;ĿĿĿ
ŀU+0140;ŀŀŀ
ŃU+0143;ŃŃŃ
ńU+0144;ńńń
ŇU+0147;ŇŇŇ
ňU+0148;ňňň
ÑU+00D1;ÑÑÑ
ñU+00F1;ñññ
ŅU+0145;ŅŅŅ
ņU+0146;ņņņ
ŊU+014A;ŊŊŊ
ŋU+014B;ŋŋŋ
ÓU+00D3;ÓÓÓ
óU+00F3;óóó
ÒU+00D2;ÒÒÒ
òU+00F2;òòò
ÔU+00D4;ÔÔÔ
ôU+00F4;ôôô
ÖU+00D6;ÖÖÖ
öU+00F6;ööö
ȪU+022A;ȪȪ./.
ȫU+022B;ȫȫ./.
ŐU+0150;ŐŐŐ
őU+0151;őőő
ÕU+00D5;ÕÕÕ
õU+00F5;õõõ
ȮU+022E;ȮȮ./.
ȯU+022F;ȯȯ./.
ØU+00D8;ØØØ
øU+00F8;øøø
ǪU+01EA;ǪǪ./.
ǫU+01EB;ǫǫ./.
ŌU+014C;ŌŌŌ
ōU+014D;ōōō
U+1ECC;ỌỌ./.
U+1ECD;ọọ./.
ŒU+0152;ŒŒŒ
œU+0153;œœœ
ĸU+0138;ĸĸĸ
ŘU+0158;ŘŘŘ
řU+0159;řřř
ŔU+0154;ŔŔŔ
ŕU+0155;ŕŕŕ
ŖU+0156;ŖŖŖ
ŗU+0157;ŗŗŗ
ſU+017F;ſſ./.
ŚU+015A;ŚŚŚ
śU+015B;śśś
ŜU+015C;ŜŜŜ
ŝU+015D;ŝŝŝ
ŠU+0160;ŠŠŠ
šU+0161;ššš
ŞU+015E;ŞŞŞ
şU+015F;şşş
U+1E62;ṢṢ./.
U+1E63;ṣṣ./.
ȘU+0218;ȘȘ./.
șU+0219;șș./.
U+1E9E;ẞẞ./.
ßU+00DF;ßßß
ŤU+0164;ŤŤŤ
ťU+0165;ťťť
ŢU+0162;ŢŢŢ
ţU+0163;ţţţ
ȚU+021A;ȚȚ./.
țU+021B;țț./.
ŦU+0166;ŦŦŦ
ŧU+0167;ŧŧŧ
ÚU+00DA;ÚÚÚ
úU+00FA;úúú
ÙU+00D9;ÙÙÙ
ùU+00F9;ùùù
ŬU+016C;ŬŬŬ
ŭU+016D;ŭŭŭ
ÛU+00DB;ÛÛÛ
ûU+00FB;ûûû
ŮU+016E;ŮŮŮ
ůU+016F;ůůů
ÜU+00DC;ÜÜÜ
üU+00FC;üü&Uuuml;
ŰU+0170;ŰŰŰ
űU+0171;űűű
ŨU+0168;ŨŨŨ
ũU+0169;ũũũ
ŲU+0172;ŲŲŲ
ųU+0173;ųųų
ŪU+016A;ŪŪŪ
ūU+016B;ūūū
ŴU+0174;ŴŴŴ
ŵU+0175;ŵŵŵ
ÝU+00DD;ÝÝÝ
ýU+00FD;ýýý
ŶU+0176;ŶŶŶ
ŷU+0177;ŷŷŷ
ŸU+0178;ŸŸŸ
ÿU+00FF;ÿÿÿ
ȲU+0232;ȲȲ./.
ȳU+0233;ȳȳ./.
ŹU+0179;ŹŹŹ
źU+017A;źźź
ŽU+017D;ŽŽŽ
žU+017E;žžž
ŻU+017B;ŻŻŻ
żU+017C;żżż
ÞU+00DE;ÞÞÞ
þU+00FE;þþþ
ªU+00AA;ªªª
ºU+00BA;ººº
Tabelle aller 198 europäischer diakritische Zeichen und Sonderbuchstaben mit Unicode und HTML-Entitäten.

ENDE