А можно какую-нибудь хорошую регулярку под сниппеты гугла? Чтоб на выходе текст без дат (в разных форматах), тегов, троеточий, дефисов и т.п.
Сейчас паршу DOM этим (?<=<span\ class="st">)[\w\W]*?(?=</span>), а потом многократно заменяю ненужности на пустое место. Довольно геморно.