リンク

2020年2月25日火曜日

UNICODEについて

はじめに

こんにちは、今回は文字コードの5つ目の紹介となるUNICODEを対象としたいと思います。

UNICODE

文字コードの国際的な業界標準の一つで世界中の様々な言語の文字を収録して通し番号を割り当て、同じコード体系のもとで使用できるようにしたものです。
符号化文字集合や文字暗号化方式などを定めたもので文字集合が単一の大規模文字セットであることがUniという名前の由来でもある。

Unicode文字複合化モデル

さて、Unicodeの文字コードは以下の4段階に分けられています。

・抽象文字集合

符号化の対象とする順序のない文字の集合

・符号化文字集合

抽象文字集合を非負整数に対応させたもの。抽象文字は対応後に符号化文字となる。
抽象文字は複数の符号化文字に対応されることもある。

・文字符号化形式

符号化文字集合の非負整数を符号単位列に変換をする方法です。
文字符号化形式はコンピュータ中に実際にデータとして文字を表現することを可能にする。

・文字符号化方式

符号単位列をバイト列に直列化する方法です。
符号単位が8ビットより大きい場合はエンディアンが関係してきます。

0 件のコメント:

コメントを投稿