utf8_encode

(PHP 3 = 3.0.6, PHP 4 )

utf8_encode -- ISO-8859-1 文字列を UTF-8 にエンコードする

説明

string utf8_encode ( string data)

この関数は、文字列 data UTF-8 にエンコードし、エンコードされた文字列を 返します。 UTF-8 は、 wide character の値をバイトストリームに エンコードするために Unicode で使用される 標準的な仕組みです。 UTF-8 は、プレーンな ASCII 文字を通し、自己同期(これは、バイトストリー ムの開始地点をプログラムが見積もることが可能であることを意味しま す)します。また、ソートのような標準的な文字列比較関数を使用可能で す。PHP は、 UTF-8 文字を次のように最大4バイト でエンコードします。

表 1UTF-8エンコーディング

バイト ビット 表現形式
1 7 0bbbbbbb
2 11 110bbbbb 10bbbbbb
3 16 1110bbbb 10bbbbbb 10bbbbbb
4 21 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb
b は、文字列データを保存可能なビッ トを示します。