Schritt 3: Was ist UTF-8?
UTF-8 ist ein Mittel, um alle Unicode-Zeichen in der Mitte eine "traditionelle" ASCII (nur Text) Datei zu verschlüsseln.
ASCII-Dateien braucht nur ein Byte pro Zeichen. Es ist perfekt, wenn Sie nur auf Englisch zu schreiben.
Aber möglicherweise müssen Sie ein chinesisches Zeichen oder eine mathematische Formel in der Mitte Ihren Text zu schreiben, und UTF-8 macht es möglich: Wenn der Code eine Unicode-Zeichen in ein einzelnes Byte nicht passt, wird es in 2, 3 oder 4 Bytes kodiert.
Diese Codierung versucht nicht, die alten und traditionellen ASCII-Codierung zu brechen.
Dies bedeutet, dass wenn Sie einen UTF-8 Text mit einem Texteditor lesen UTF-8 ist nicht kompatibel, weder der Editor abstürzen, weder die Formatierung des Textes wird sein alles durcheinander.
Statt eine einheitliche und korrekte Unicode-Zeichen, wird die inkompatible Editor 2, 3 oder 4 erweiterte ASCII-Zeichen anzeigen.
Auf der anderen Seite kann ein fehlerhafter UTF-8-Code zu unerwarteten Problemen führen, wenn die UTF-8 kompatibel Texteditor nicht korrekt kodiert worden.