Автоматическое выполнение заданий на SeoSprint

gentleq

Новичок
Регистрация
28.10.2014
Сообщения
28
Благодарностей
1
Баллы
3
Спустя +-100 шаблонов, мне удалось решить практически все возможные ошибки которые могли проявляться при выполнении заданий. Но вот один вопрос меня по-прежнему беспокоит и хочется сделать все идеально.

Допустим заказчик требует что бы я просмотрел 10 его видео и клацнул на 4 "разные" рекламы в этих видео. (естественно все ссылки в отчет). Вопрос: "Можно ли как-то сделать так, что бы спарсило именно разную рекламу?" То есть реклама от гугл очень часто повторяется и приходится все сортировать. Можно конечно удалить дубли и поставить цикл с получением кол-ва строк и повтором до n-го числа уникальных строк в списке, но таким образом может набраться с одного сайта, допустим, 6 ссылок, а со второго всего одна.

Еще раз для тех кто не понял. Мы зашли на site.ruu и взяли от туда "n-е" кол-во ссылок. Далее переходи на след. видео и вновь случайно попадаем на site.ruu. Мне нужно что бы "он" понимал что попал на сайт второй раз и не брал ссылки с сайта повторно, а переходил к след. рекламе.

Думал-думал, но так и не понял, можно ли это как-то реализовать.
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
в любом случае тут должна быть логика логирования уже использованных данных в один список + фильтрация по этому списку
 

gentleq

Новичок
Регистрация
28.10.2014
Сообщения
28
Благодарностей
1
Баллы
3
в любом случае тут должна быть логика логирования уже использованных данных в один список + фильтрация по этому списку
Это я понимаю, но не знаю как реализовать. Быть может небольшой пример кто-то сможет написать, или это уже достаточно тяжелые действия получаться?
Пример хотя бы на словах)
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
Сохранять в список1 все собранные ссылки за все время
Сохранять собранные ссылки текущего прохода в список 2, в цикле искать содержится ли ссылка из списка2 в списке1 (объединить строки списка1 и через операции с текстом - regex искать в нем строку из списка2)
если найдена - делать то то
если нет - то то
 

smarchenko

Client
Регистрация
18.01.2014
Сообщения
141
Благодарностей
8
Баллы
18
Не совсем понял вариант с дублями, который ты предложил. Я например проверяю использовалась ли картинка или нет следующим образом:
1) Считаем количество строк в списке
2) Добавляем ссылку в список
3) Удаляем дубли в списке
4) Считаем количество строк в списке
5) Если количество "до" равно количеству "после", то берем следующую ссылку. Если не равно, то работаем с этой ссылкой.

Если имелось ввиду именно это, то прошу прощения =)
 

rostonix

Известная личность
Регистрация
23.12.2011
Сообщения
29 067
Благодарностей
5 707
Баллы
113
такой метод в многопотоке не будет работать, а мой будет)
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)