文字列のバイトコードを探ってみる

中国語のはずのテキストがsjisで保存出来た!?ので調べてみる
対象のテキスト:此地名(地址)不存在

<?php
$str = "此地名(地址)不存在";
echo mb_detect_encoding($str, "sjis") . "\n";

$c = mb_strlen($str);
for( $i=0;$i<$c;$i++ ){
	$mb = mb_substr( $str, $i, 1, "sjis" );
	echo mb_convert_encoding( $mb, "utf8", "sjis" ) . ":";
	for( $j=0;$j<strlen($mb);$j++ ){
		echo dechex ( ord( $mb[$j] ) )." ";
	}
	echo "\n";
}

/**
SJIS
此:8d 9f
地:92 6e
名:96 bc
(:28
地:92 6e
址:9a ac
):29
不:95 73
存:91 b6
在:8d dd
*/

シフトJISエリアマップで調べてみると。。。
全部、SJISので定義された日本語でした。

でした。。。