Glavna težava z regularnim izrazom, ki odstranjuje komentarje HTML, je, da lahko za seboj pusti nenamerno vsebino. Če bi na primer iz dokumenta odstranili vse komentarje HTML, bi verjetno dobili dokument, v katerem manjkajo pomembne informacije.
<!--This is a comment--> This is a comment
.
Odstranjevanje komentarjev HTML z Regex
Komentarje HTML z regularnim izrazom lahko odstranite na nekaj načinov. Eden od načinov je uporaba zastavice /g na mehanizmu regularnih izrazov v urejevalniku besedil. To se bo ujemalo s katerim koli znakom razen z novo vrstico, zaradi česar bo komentar odstranjen.
Drug način je uporaba razreda znakov. Z uporabo zastavice [^s] lahko ustvarite razred znakov, ki se bo ujemal s katerim koli znakom, ki ni presledek. Nato lahko uporabite ubežno zaporedje s za ujemanje presledkov in zastavico /g v mehanizmu regularnih izrazov za odstranitev komentarjev.
Orodja za učenje regularnega izraza
Obstaja veliko orodij, ki jih je mogoče uporabiti za učenje regularnega izraza v HTML. Eno priljubljenih orodij je RegexBuddy, ki ga najdete na http://www.regexbuddy.com/. Drugo orodje je RegExr, ki ga najdete na https://regexr.com/.