文字コードを判別する
- 題名: 文字コードを判別する
- 著者: 雅階凡
- 日時: 2008/01/20 12:37:24
- ID: 21301
- この記事の返信元:
- この記事への返信:
- ツリーを表示
- 題名: Re[2]: 文字コードを判別する
- 著者: 雅階凡
- 日時: 2008/01/21 13:09:38
- ID: 21306
- この記事の返信元:
- この記事への返信:
- ツリーを表示
- 題名: Re[5]: 文字コードを判別する
- 著者: Hongliang
- 日時: 2008/01/22 9:20:36
- ID: 21316
- この記事の返信元:
- この記事への返信:
- ツリーを表示
分類:[.NET]
まだ、プログラミング初心者の雅階凡と申します。
文字コードの判定について考えていたのですが、
「.NET Tips」→「文字列、暗号化」→「文字列」→「文字コードを判別する」
( http://dobon.net/vb/dotnet/string/detectcode.html )
の記事を読んで大変参考にさせていただきました。感謝いたします。
そこで、質問なんですが、この記事内の、「Jcode.pmを参考にした方法」の C# のソースコード中にある GetCodeメソッド内の
else if (len - 2 > i &&
b1 == 0x8E && (b2 >= 0xA1 && b2 <= 0xFE) &&
(byts[i + 2] >= 0xA1 && byts[i + 2] <= 0xFE))
{
euc += 3;
i += 2;
}
上記のコードの2行目にある b1 == 0x8E は euc-jp の補助漢字を判定するためなら b1 == 0x8F ではないかなと思っているのですがいかがでしょうか?まだプログラミングに自信がもてない私にお教えいただければ幸いです。
ちなみに、まだ一般に知られていない私のサイト内の「C#2008 文字コードの判定」
( http://www.geocities.jp/gakaibon/tips/csharp2008/charset-check.html )
でも参考にさせていただいたものを公開させていただきました。