Кто-нибудь делал парсер гугла?

  • Автор темы Автор темы vovasit91
  • Дата начала Дата начала

vovasit91

Client
Регистрация
02.09.2011
Сообщения
18
Реакции
0
Баллы
1
Собственно сабж. Как только не крутил шаблон для парса гугла, ничего не получилось. Если есть у кого-то поделитесь плиз))
 
Что именно надо парсить? Я парсил в гугле выдачу - собирал урлы, парсил ключи в гугл адвордс. Там всё нормально собирается, необходимо толь ко немного поднапрячь мозг.
 
выдачу парсить нужно
 
а что не получается то?
 
я компосировал мозг с выдачей, делал регулярку и даже после регулярки ставил |-all но всеравно, собирал ссылки не все и т.п. и получалось через раз. непонимаю почему. (((
 
Ну, если это то о чем я думаю, то я сделал следующим образом. Там при скажем обычной регулярке (до и после то чего нам нужно) вылазиет или много ненужных сссылок или меньше. В общем, парсишь в два шага:
1) делаешь регулярку чуть шире и результат сохраняешь в файл (с мусором, короче)
2) Берешь из этого файла этот мусор и с помощью "взять строку из файла" ставишь регулярку, которая уже возьмет уже только нужные тебе ссылки.
А чтоб потоки не путались, делаешь имена файлов - рэндомным значением, они будут удалятся во втором шаге.
 
  • Спасибо
Реакции: RealDiGi
nikakoss
сПАСИБО БОЛЬШОЕ. обязательно так попробую. не догадался.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)