Aveces pasa en los texto que quedan palabras repetidas como ” texto es es” pocas veces esto tiene un significado así que podemos encontrarlas y si gustamos eliminarlas.
Acá les dejo el código para encontrar dichas palabras:
<!-- wp:paragraph -->
<p><code><br>
/// <summary><br>
/// find number words repet in text<br>
/// </summary><br>
/// <param name="strWord">word to find</param><br>
/// <param name="bolUpperLowerCase"></param><br>
/// <returns>Match property width find or null if not find</returns><br>
public List<Match> FindWordRepetContinue(string strWord, bool bolIgnoreUppercaseLowercase)<br>
{<br>
// Define a regular expression for repeated words.<br>
Regex rx = new Regex(@"\b(?<word>\w+)\s+(\k<word>)\b",<br>
RegexOptions.Compiled | RegexOptions.IgnoreCase);</code></p>
<!-- /wp:paragraph -->
<!-- wp:paragraph -->
<p><code><br>
List<Match> lstmatch = new List<Match>();</code></p>
<!-- /wp:paragraph -->
<!-- wp:paragraph -->
<p><code><br>
// Find matches.<br>
MatchCollection matches = rx.Matches(TextOriginal);</code><br><code><br>
foreach (Match item in matches)<br>
{<br>
if (bolIgnoreUppercaseLowercase)<br>
{<br>
string strTempValue = item.Value.ToLower();<br>
if (strTempValue.ToLower().Contains(strWord.ToLower()))<br>
lstmatch.Add(item);<br>
}<br>
else<br>
{<br>
if (item.Value.ToLower().Contains(strWord.ToLower()))<br>
lstmatch.Add(item);<br>
}</code><br><code><br>
}</code><br><code><br>
return lstmatch;</code></p>
<!-- /wp:paragraph -->
<!-- wp:paragraph -->
<p>}</p>
<!-- /wp:paragraph -->
recuerden que pueden encontrar la librería completa en https://github.com/Mteheran/TextManager