ASCII Code

Herkunft / Verwendung: Der American Standard Code for Information Interchange (ASCII) ist eine 7-Bit-Zeichenkodierung; sie entspricht der US-Variante von ISO 646 und dient als Grundlage für spätere, auf mehr Bits basierende Kodierungen für Zeichensätze. Entwickelt hat er sich aus den für Fernschreiber benutzten Baudot und Murray-Codes.

Ursprünglich wurde der ASCII Code im KJuni 1963 von der ASA (American Standards Association, heute American National Standards Institute (ANSI)) als Standard ASA X3.4-1963 genormt. 1967/1986, sowie letztmalig 1986 wurde der Standard als ANSI X3.4-1986 aktualisiert und heute noch so benutzt. In diesem Standard werden 128 Zeichen (0-127), darunter 33 nicht druckbare Zeichen definiert. In den ersten 31 Zeichen sind die nicht druckbaren (Steuerzeichen) untergebracht, an Position 32 folgt das Leerzeichen und dann !"#$%&'()*+,-./0123456789:;<=>? @ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_ `abcdefghijklmnopqrstuvwxyz{|}~ Es sind also nur das lateinische Alphabet in Groß- und Kleinschreibung, die arabischen Ziffern, Satzzeichen und die wichtigsten Sonderzeichen vorhanden. Dies entspricht in etwa dem Zeichenvorrat einer englischsprachigen Schreibmaschine. Deutsche Unmlaute fehlen.

In den ersten 31 Position finden sich Steuerzeichen wie zum Beispiel Zeilenvorschub (line feed (LF), an Pos. 10), Wagenrücklauf (carriage return (CR), an Pos. 13), Rückschritt (Backspace (BS), an Pos. 8) oder Klingel (Bell (BEL), an Pos. 7). Auch dies erinnert sehr an die Funktionen einer Schreibmaschine bzw. eines Fernschreibers.

Während Fernschreiber damals mit 7 Bit arbeiteten, arbeiten heutige Computer mit einer 8-bit-Gruppierung (8 Bit entsprechen einem Byte). Darum sind heutzutage 8-Bit-ASCII-Codes gebräuchlich, wobei die zusätzlichen Plätze (128-255) oft mit landestypischen oder technischen Zeichen belegt sind, im deutschen Zeichensatz sind z. B. die Umlaute vorhanden. Diese besonderen ASCII-Sätze sind als Codepages spezifiziert.

Auch der EBCDIC Code ist eine 7 bzw. 8-Bit (mit Codepages) Zeichenkodierung, die aber mehr auf Großrechnern zum Einsatz kam.

Grundsätzlich sind nur die ersten 128 Zeichen auf allen Systemen gleich. Ein mit einer bestimmten Codepage erstellter ASCII-Text ist auch nur wieder mit dieser Codepage lesbar. Würde ein auf deutscher Codepage geschriebener Text mit deutschen Umlauten geschriebener Text auf einer andere Codepage, etwas für spanisch, geöffnet und gelesen werden, so wäre die deutschen Umlaute durch spanische Sonderzeichen ersetzt und an diesen Stellen "verstümmelt".

Dieser Besonderheit muss selbst auf modernen Kommunikationsmitteln Rechnung getragen werden. So muss z. B. bei einer Webseite immer diese Codepage angegeben werden, etwa mit <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1"> für Deutsch, damit der Webbrowser weiß, welche Zeichen er darstellen muss, wenn Zeichen oberhalb von Pos. 127 in der Webseite vorhanden sind.

Eine weitere Erweiterung der Zeichenkodierung stellt der Unicode dar, der sich zum Ziel gesetzt hat, alle sinnvollen Zeichen aller Schriftkulturen und Zeichensysteme abzubilden. Damit ist dann auch die Darstellung von Schriften mit mehr als als 225 Zeichen möglich wie etwa chinesisch.

Spezifikation des Codes

Der orignale 7-Bit Zeichensatz definiert 128 Zeichen (27=128), wobei die Zeichen 0 bis 31 nicht druckbar sind. Zeichen 32 ist das Leerzeichen, dann folgen die druckbaren Zeichen: +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 0- 15 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI 16- 31 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US 32- 47 SP ! " # $ % & ' ( ) * + , - . / 48- 63 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 64- 79 @ A B C D E F G H I J K L M N O 80- 95 P Q R S T U V W X Y Z [ \ ] ^ _ 96-111 ` a b c d e f g h i j k l m n o 112-127 p q r s t u v w x y z { | } ~ DEL wobei die gebräuchlichsten Abkürzungen sind: BEL = Bell = Klingel, BS = Backspace = letztes Zeichen löschen, LF = Line Feed = Zeilenvorschub, FF = Form Feed = Seitenvorschub, CR = Carriage Return = Wagenrücklauf, SP = Space = Leerzeichen

In Deutschland und dem Betriebssystem Windows ist die Codepage Windows-1252 (Westeuropäisch, Western European) oder für Webseiten ISO 8859-1 (Latin-1, Westeuropäisch) gebräuchlich.

Eine vollständige 8-Bit-ASCII-Tabelle für den westeuropäischen Raum sieht etwas so aus: +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 0- 15 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI 16- 31 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US 32- 47 SP ! " # $ % & ' ( ) * + , - . / 48- 63 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 64- 79 @ A B C D E F G H I J K L M N O 80- 95 P Q R S T U V W X Y Z [ \ ] ^ _ 96-111 ` a b c d e f g h i j k l m n o 112-127 p q r s t u v w x y z { | } ~ DEL 128-143 € ‚ ƒ „ … † ‡ ˆ ‰ Š ‹ Œ Ž  144-159 ‘ ’ “ ” • – — ˜ ™ š › œ ž Ÿ 160-175   ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ® ¯ 176-191 ° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿ 192-207 À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï 208-223 Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß 224-239 à á â ã ä å æ ç è é ê ë ì í î ï 240-255 ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

Beispiel

Klartext:Beispielklartext
Variante:Umwandlung in Werte dezimal
Kodiert:66 101 105 115 112 105 101 108 107 108 97 114 116 101 120 116
B e i s p i e l k l a r t e x t 66 101 105 115 112 105 101 108 107 108 97 114 116 101 120 116

Code / Chiffre online dekodieren / entschlüsseln bzw. kodieren / verschlüsseln (DeCoder / Encoder / Solver-Tool)