- Регистрация
- 31.07.2016
- Сообщения
- 336
- Благодарностей
- 381
- Баллы
- 63
Добрый день,
Будьте добры, есть вопрос который не могу решить сам.
Шаблон берет из переменной {-Variable.SiteLink-} сайт, потом переходит на этот сайт, парсит ссылки этой регуляркой {-Variable.SiteLink-}.*?(?=\ )
Задача была следующей, чтоб парсились ссылки которые не уводят с сайта. По итогу ссылки парсятся, но в основном какой то шлак, одни несуществующие страницы. И в связи с этим весь процесс парсинга становится бессмысленным.
Может я что то не так делаю? Хотя скорее всего так и есть)) Как должна выглядеть регулярка или каким образом можно получить ссылки с сайта, чтоб эти ссылки были нормальными?
Будьте добры, есть вопрос который не могу решить сам.
Шаблон берет из переменной {-Variable.SiteLink-} сайт, потом переходит на этот сайт, парсит ссылки этой регуляркой {-Variable.SiteLink-}.*?(?=\ )
Задача была следующей, чтоб парсились ссылки которые не уводят с сайта. По итогу ссылки парсятся, но в основном какой то шлак, одни несуществующие страницы. И в связи с этим весь процесс парсинга становится бессмысленным.
Может я что то не так делаю? Хотя скорее всего так и есть)) Как должна выглядеть регулярка или каким образом можно получить ссылки с сайта, чтоб эти ссылки были нормальными?