DOBON.NET DOBON.NETプログラミング掲示板過去ログ

十進の文字の実体参照を文字として表示したい

環境/言語:[XP C#3.5]
分類:[.NET]

十進の文字の実体参照したページのテキストをutf-8で文字として表示したいのですが、どうしたらいいでしょう?
string text = "実体参照の文字列";
text = System.Web.HttpUtility.UrlDecode(text);
じゃだめっぽいんです。
■No26031に返信(勉強してますさんの記事)
> 十進の文字の実体参照した
十進表記の物は、実体参照とは呼ばなかったような…。

  → 数値文字参照(HTML)、文字参照(XML)
 & → 文字実体参照(HTML)、実体参照(XML)


> utf-8で文字として表示
どういう意味でしょうか?
数値文字参照で表記される数は、utf-8 のそれでは無いですし、
string 型に、utf-8 とか utf-16 といった区別は無いですよね。

もしかして、
  "あ" (数値文字参照)
 →"あ"       (元の文字)
 →"E38182"   (UTF-8 エンコードして16進数表記)
 →"14909826" (UTF-8 エンコードして10進数表記)
などの変換を行う、という意味なのでしょうか。


> string text = "実体参照の文字列";
> text = System.Web.HttpUtility.UrlDecode(text);
最初の text の内容にもよりますが、
 string text = "你好";
 text = XElement.Parse("<z>" + text + "</z>").Value;
とか。
# 質問の意図を読み切れていない気がするので、外しているかも。

DOBON.NET | プログラミング道 | プログラミング掲示板