テキストURLの抽出の仕方
- 題名: テキストURLの抽出の仕方
- 著者: 田中
- 日時: 2011/02/08 17:56:33
- ID: 28135
- この記事の返信元:
- この記事への返信:
- ツリーを表示
- 題名: Re[1]: テキストURLの抽出の仕方
- 著者: shu
- 日時: 2011/02/09 0:13:26
- ID: 28137
- この記事の返信元:
- この記事への返信:
- ツリーを表示
- 題名: Re[2]: テキストURLの抽出の仕方
- 著者: 田中
- 日時: 2011/02/09 0:54:22
- ID: 28138
- この記事の返信元:
- この記事への返信:
- ツリーを表示
分類:[.NET]
はじめまして。田中と申します。
どうしてもわからないことがあってこちらに投稿させてもらいました。
HTMLからテキストのURLを抽出し<a>タグに変換するプログラムを作っています。
いろいろなサンプルを参考にしHTMLを抽出するまではできたのですが、余計な箇所まで抽出されて困っています。どなたかご教授ください。
やりたいこと
「ttp:」から始まるURLのみ抽出したいと思っています。
現在のものだと「http:」も抽出されてしまいます。
抽出したいテキストURL
ttp://〜省略〜.jpg
間違って抽出されてしまうもの
http://〜省略〜.jpg
var html = "HTML";
Regex re = new Regex("ttp://(\"|\')?([^<|>|\"|\'|\n]+)\\.(jpg|jpeg|png|gif)?",RegexOptions.IgnoreCase | RegexOptions.Singleline);
var html_temp = re.Replace(html,string.Format("a href=\"$&\" target=\"_blank\">{0}","リンク"));
よろしくお願いします。