DOBON.NETプログラミング道掲示板

No35074 の記事


■35074 / )  正規表現で文字の繰り返しパターン
□投稿者/ ポポ 一般人(1回)-(2022/06/13(Mon) 10:30:35)
  • アイコン環境/言語:[Windows10 64bit VS2019 VB.NET .NET4.8.04084] 
    分類:[.NET] 

    はじめてお世話になります。

    正規表現で文字の置き換えについて教えて下さい。

    文字が繰り返されてしまっているデータを含んだテキストファイルがあります。
    例)”ああああいいいいううううええええおおおお 御中”
    上記例は”あいうえお”の部分5文字が各4回ずつの繰り返してしまっており、
    その後の” 御中”は繰り返していません。
    これを正しい”あいうえお”に置き換えをしたいです。

    文字数も繰り返し回数も不定です。ただし繰返し回数(例では4)は全文字同じ
    回数になります。

    正規表現で"(.)\1"として"$1"で1文字に置き換えはできたのですが、
    当然、2文字連続文字は全て置き換わります。(例えば2001年の00部分)
    (.)\1+(.)\2+", "$1$2"で2回の繰り返しの場合のみ置き換えで対応したのですが、
    3回以上の繰り返しを置き換えるのに、パターンを全て記述することになり困っております。

    同じ文字の繰り返しパターンが2回以上連続する場合に各1文字に置き換える
    表現が可能か、ご教授頂ければと存じます。
    よろしくお願いします。
違反を報告
返信 削除キー/


Mode/  Pass/


- Child Tree -