Unicode

Unicode, ein Internationales Standard das jedes Zeichensystem und Schriftkultur beinhaltet. Der Unicode wurde eingeführt um Verwendung und inkompatibler Kodierungen in verschiedenen Ländern oder Kulturkreisen zu beseitigen. Der Unicode ist nicht vollständig und wird andauernd durch neue Schriften und Zeichen ergänzt.

UTF-8

UCS (Unicoded Character Set)

Transformation

Format

8 (Weil die zeichen immer in 8 Bit-Blöcken dargestellt sind)

Neat to Know: UFT-8 ist die am weit verbreitete kodierung

Erkennen von 1, 2, 3 und 4 Bit zeichen

1 Bit: erkennt man wenn eine 0 am anfang des Bit-Blocks steht

Beispiel: 0XXXXXXX


2 Bit: erkennt man wenn eine 110 im ersten Bit-Block steht und eine 10 im zweiten Block steht

Beispiel: 110XXXXX 10XXXXXX


3 Bit: erkennt man wenn 1110 im ersten Bit-Block und eine 10 im Zweiten und dritten Block stehen

Beispiel: 1110XXXX 10XXXXXX 10XXXXXX


4 Bit: erkennt man wenn 11110 im ersten Bit-Block und eine 10 im Zweiten, dritten und vierten Block stehen

Beispiel: 1110XXXX 10XXXXXX 10XXXXXX 10XXXXXX


Sonderzeichen

Sonderzeichen unter Linux eingeben kann man mit der Compose-Taste, aber nicht immer ist dies die gleiche Taste, es kommt ganz auf die Destribution/ dem Linux Betriebsystem an.

Bei Ubuntu muss man diese zum bespiel manuell einrichten. Bei anderen Destributionen/Betriebsysteme für Linux ist die Compose-Taste auf der rechten Windows Taste oder Umschalt+AltGr.
Mit dieser Taste kann man unabhängig von Tastaturlayout , diverse Sonderzeichen erzeugen indem man zwei zeichen auf der Tastatur drückt , bsp. „ComposeTaste+Umschalt+7“ macht aus einem „o“ ein „ ø“. Allerdings nicht wie Üblich wie bei Windows werden die Tasten nacheinander gedrückt und nicht gleichzeitig, man drückst also die Compose-Taste , dann die Umschalt Taste und dann als Beispiel die taste 7.