- Регистрация
- 11.05.2012
- Сообщения
- 432
- Благодарностей
- 139
- Баллы
- 43
Паршу снипеты поисковиков чтоб использовать в роли текстовки. В спаршенном материале уйма мусора. Как с ним бороться? Регулярки для удаления ip, email, url, и просто доменов уже есть. Как убрать мусор типа ., .. и всяки страшных "закорюк" и иероглифов?
Как убрать из текста английский текст (и наоборот - русский)?
Помогите разобраться.
Как убрать из текста английский текст (и наоборот - русский)?
Помогите разобраться.