- Регистрация
- 05.02.2014
- Сообщения
- 85
- Благодарностей
- 30
- Баллы
- 18
Подскажите по созданию отсева урлов из выдачи.
Шаб такой (по шагам)
1. Парсинг выдачи
2. Сбор всех url в список (Google.txt) и список в проекте
3. Удаление ненужных url по списку (blacklist.txt) - не получается
Пробовал реализовать через "прочитать фаил" и "удалить строки", но как-то не идут дела.
http://s34-temporary-files.radikal.ru/3b0b7dced7f94041b7bae0f77b498fbd/-88693455.png
Находил на форуме тему по блеклисту строк, но там обсуждали с точным совпадением, а мне не с точным, а с "содержащим" текст.
Как вариант можно клепать блоки под каждую фразу, но в перспективе это не целесообразно, т.к. в блеклист могут попасть сотни сайтов.
Шаб такой (по шагам)
1. Парсинг выдачи
2. Сбор всех url в список (Google.txt) и список в проекте
3. Удаление ненужных url по списку (blacklist.txt) - не получается
Пробовал реализовать через "прочитать фаил" и "удалить строки", но как-то не идут дела.
http://s34-temporary-files.radikal.ru/3b0b7dced7f94041b7bae0f77b498fbd/-88693455.png
Находил на форуме тему по блеклисту строк, но там обсуждали с точным совпадением, а мне не с точным, а с "содержащим" текст.
Как вариант можно клепать блоки под каждую фразу, но в перспективе это не целесообразно, т.к. в блеклист могут попасть сотни сайтов.