「文字コードを判別する」へのコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html 「文字コードを判別する」に投稿されたコメントの一覧 ja https://dobon.net/banner/dbs1.gif https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html 「文字コードを判別する」へのコメント 88 31 通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#20

通常の「常識的に用いる範囲内での文字コード判定は、判定する素材がファイルである場合、余程特殊でない限りは、IEで判定させるのが最も簡易で間違いがないと、私見の範囲内では考えています。


ファイルをIEにドロップして「ファイル」→「名前をつけて保存」でダイアログボックスに表示されているエンコード欄に示されているコードが、そのファイルの文字エンコード形式になります。


またWindows用バイナリエディタ等で読み込ませると、自動的に判定しくれます。この時に文字化けをする場合、各種コードを変更してみて文字化けが出ないコードが該当文字コードと判定できます。


C++では未だにテキスト形式も満足に判定できない場面に遭遇します。C++は今年の改訂でも文字エンコードについては対応はされず、22年の改訂でも対応はされません。公表されている議事録を読む限り、文字に対応することについては、大多数の開発責任者は否定的です。残念なことです。


文字コードへの対応ですが、自分から作成してもいいのですが、先ほどのバイナリエディタには、文字コードへの対応辞書が付随していることが多く、また公開されているものもあるので、ググってみることをお勧めします。]]>
Wed, 08 Jan 2020 19:13:58 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#20
通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#19 今回も文字コードを判定する必要があり困っていたのですが、本記事が大変参考になりました。]]> Wed, 10 Jul 2019 14:43:50 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#19 通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#18
•NonSoft - 文字コード判定/変換DLL(VB6/VB.NET/C#.NET)
は、URLが変更になっています。
旧:http://homepage2.nifty.com/nonnon/Download/NonCodeDll/index.html
新:http://nonsoft.la.coocan.jp/Download/NonCodeDll/index.html]]>
Thu, 15 Sep 2016 11:03:15 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#18
通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#17
私が試してもそうなりました。ご報告ありがとうございました。]]>
Mon, 29 Aug 2016 01:14:37 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#17
.NET Frameworkのバージョンによる違い https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#16 Sun, 17 Apr 2016 12:46:24 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#16 通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#15 mlang.dll ですが、最近の Visual Studio(2010 以降?)では、
MultiLanguage.IMultiLanguage2 ml = new MultiLanguage.CMultiLanguageClass();
の所を
(IMultiLanguage2)new CMultiLanguage();
とする必要がありました。
https://blogs.msdn.microsoft.com/mshneer/2009/12/07/vs-2010-compiler-error-interop-type-xxx-cannot-be-embedded-use-the-applicable-interface-instead/]]>
Sun, 17 Apr 2016 12:31:48 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&id=string%2Fdetectcode.html#15
評価の理由 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#14 文字コードの判別で困っていたので大変参考になりました。]]> Thu, 10 Sep 2015 21:01:24 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#14 評価の理由 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#13 大変参考になりました。]]> Thu, 03 Apr 2014 22:18:17 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#13 通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#11 > > ''' <param name="byts">文字コードを調べるデータ</param>
> name="bytes"ではないでしょうか?

ご連絡ありがとうございました。修正しておきます。]]>
Mon, 31 Jan 2011 02:12:44 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#11
通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#10 > ''' <param name="byts">文字コードを調べるデータ</param>
name="bytes"ではないでしょうか?]]>
Sun, 30 Jan 2011 20:22:30 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#10
通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#9
Boolean ascii = true;
for (int i = 0; i < len; i++)
{
b1 = byts[i];
if (!(b1 >= 0x20 && b1 <= 0x7E))
{
ascii = false;
break;
}
}

if (ascii)
{
return System.Text.Encoding.ASCII;
}]]>
Thu, 18 Feb 2010 14:25:04 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#9
通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#8 Mon, 28 Dec 2009 19:39:31 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#8 通常のコメント https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#4 文字コードの判定について考えていたのですが、この記事を読んで大変参考にさせていただきました。
質問もありますが、それについては掲示板にも投稿させていただきます。]]>
Sun, 20 Jan 2008 11:20:23 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#4
.NET Frameworkのバージョンによる違い https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#5
byte[] buf;
sbyte[] sbuf = (sbyte[])(object)buf;

でいけるみたいです。]]>
Tue, 05 Jun 2007 19:58:24 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#5
評価の理由 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#3 Javaで文字コードの判別をするプログラムを作る必要があり、この記事を参考にさせていただきました。しかし、句読点がない文章の判別がうまくいかないようで、改良の必要がありそうです。]]> Mon, 09 Apr 2007 01:22:17 +0900 https://dobon.net/cgi-bin/pc/pc.php?mode=v&amp;id=string%2Fdetectcode.html#3