2006年03月20日

検索 Web サービスのバグ その後

 検索 Web サービスのバグに対する修正モジュール (→ <検索 Web サービスのバグ>) を確認してみました。
適用時にはサーバーの再起動が必要になりますが、確かに修正されていました。

元の記事で、UTF-16 と書いていましたが、少し正確じゃありませんでした。
検索 Web サービスのレスポンス結果の XML 内に埋め込まれている、検索結果 XML は確かにヘッダーには以下のように UTF-16 なんですが、
<?xml version="1.0" encoding="utf-16"?>
実際には、UTF-16 にエンコードされている訳ではありませんでした。
例えば、「チームサイト」という2バイト文字は、以下のような文字コードに展開されています。 何じゃこりゃ??
C3 A3 C2 83 C2 81 C3 A3 C2 83 C2 BC C3 A3 C2 83 C2 A0 C3 A3 C2 82 C2 B5 C3 A3 C2 82 C2 A4 C3 A3 C2 83 C2 88
ちなみに、UTF-8 では、本来は以下のような文字コードで表されます。
E3 83 81 E3 83 BC E3 83 A0 E3 82 B5 E3 82 A4 E3 83 88
今回の修正モジュールを適用して、レジストリの値を 1 にすると、XML のヘッダーは相変わらず UTF-16 のままですが、2バイトコードについては本来の UTF-8 になってくれるので、正しく処理することが可能になりました。

posted by kunitaka at 21:26| Comment(0) | TrackBack(0) | レポート
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/485801
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック