文字コードの規格であるUnicodeに関する次の記述のうち,最も適切なものはどれか。
① CJK統合漢字(CJK Unified Ideographs)では,中日韓の類似の文字は1文字にまとめられたが,最新のURO(Unified Repertoire and Ordering)では,別の文字に分離されたため,漢字の文字数は2倍以上に増加した。
② UTF-8では,文字は可変長(16バイト)で表現されるため,ASCII文字集合だけのテキストであっても,ASCII文字コードに対して2倍以上にファイルの大きさが増加する。
③ UTF-16では,すべての文字は固定長(2バイト)で表現される。
④ UTF-32では,すべての文字は固定長(4バイト)で表現される。
⑤ 可変長の文字符号化方式では,いわゆる半角・全角同様に,文字の表現に使われるバイト数に応じて文字の横幅が増加するため,3バイトの文字は1バイトの3倍の横幅を占める。
答え
④
解説
XXX
① CJK統合漢字(CJK Unified Ideographs)では,中日韓の類似の文字は1文字にまとめられたが,最新のURO(Unified Repertoire and Ordering)では,別の文字に分離されたため,漢字の文字数は2倍以上に増加した。
XXX
② UTF-8では,文字は可変長(16バイト)で表現されるため,ASCII文字集合だけのテキストであっても,ASCII文字コードに対して2倍以上にファイルの大きさが増加する。
XXX
③ UTF-16では,すべての文字は固定長(2バイト)で表現される。
XXX
④ UTF-32では,すべての文字は固定長(4バイト)で表現される。
XXX
⑤ 可変長の文字符号化方式では,いわゆる半角・全角同様に,文字の表現に使われるバイト数に応じて文字の横幅が増加するため,3バイトの文字は1バイトの3倍の横幅を占める。
XXX