この関数は、文字列
data
を
UTF-8
にエンコードし、エンコードされた文字列を 返します。
UTF-8
は、
wide character
の値をバイトストリームに エンコードするために
Unicode
で使用される 標準的な仕組みです。
UTF-8
は、プレーンな
ASCII
文字を通し、自己同期(これは、バイトストリー ムの開始地点をプログラムが見積もることが可能であることを意味しま
す)します。また、ソートのような標準的な文字列比較関数を使用可能で す。PHP は、
UTF-8
文字を次のように最大4バイト でエンコードします。
表 1UTF-8エンコーディング
バイト | ビット | 表現形式 |
---|---|---|
1 | 7 | 0bbbbbbb |
2 | 11 | 110bbbbb 10bbbbbb |
3 | 16 | 1110bbbb 10bbbbbb 10bbbbbb |
4 | 21 | 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb |