どの文字コードでも化ける?
- 題名: どの文字コードでも化ける?
- 著者: blouman
- 日時: 2010/03/13 16:49:43
- ID: 26553
- この記事の返信元:
- この記事への返信:
- ツリーを表示
- 題名: Re[1]: どの文字コードでも化ける?
- 著者: Hongliang
- 日時: 2010/03/13 20:04:27
- ID: 26554
- この記事の返信元:
- この記事への返信:
- ツリーを表示
- 題名: Re[2]: どの文字コードでも化ける?
- 著者: blouman
- 日時: 2010/03/13 22:31:55
- ID: 26555
- この記事の返信元:
- この記事への返信:
- ツリーを表示
- 題名: Re[3]: どの文字コードでも化ける?
- 著者: Hongliang
- 日時: 2010/03/13 23:53:43
- ID: 26556
- この記事の返信元:
- この記事への返信:
- ツリーを表示
- 題名: Re[4]: どの文字コードでも化ける?
- 著者: blouman
- 日時: 2010/03/14 19:03:19
- ID: 26558
- この記事の返信元:
- この記事への返信:
- ツリーを表示
分類:[.NET]
【解決したい問題】
http://dobon.net/vb/dotnet/internet/webclientopenread.html
こちらを参考にHTMLの取得を行っているのですが、とあるサイトのデータを取得し、UTF-8にてエンコードしたところ、「�」という文字列が出てきました。(変な記号)
もしやと思い、Shift_JISやEUC-JPなどでも試してみましたが、同じような結果でした。
http://www.xmleditor.jp/blog/archives/40
こちらを参考に全部試してみたものの、どれもほぼ同じような結果になりました。
そのサイトにIE7.0でアクセスするとちゃんと表示され、文字コードやソースを確認してもUTF-8となっています。
また、WebClientでなく、WebBrowserを使用しアクセスしてもちゃんと表示されます。.Document.Encodingを確認するとutf-8と表示されました。
.Document.Body.OuterHtmlを確認すると<body>〜</body>がちゃんと表示されました。
一ヶ月ほど前はそのサイトはEUCだったようで、化けることなくきちんと取得出来ましたが、今日試してみたらできなくなっていました。
急にできなくなってしまったのでとても不思議です(´・ω・`)