помогите составить regexp

gogagoga

Новичок
Регистрация
23.09.2016
Сообщения
29
Благодарностей
0
Баллы
1
приветствую. суть задачи: мне нужно искать посты с определенным @логин. при этом в посте может быть написанно, что угодно. я потыкал в div'ы. и там можно искать через innerhtml. он выглядит так, как текст. Текст соответственно выглядит рандомно, главное, чтобы там была эта ссылка.
т.е мне нужен запрос, который бы парсил там "рандомный текст или его отсутствие <заданная ссылка> рандомный текст или его отсутствие"
т.е любой див в innerhtml, которого присутствует в рандомном месте нужная ссылка



 

Ribas

Client
Регистрация
31.05.2014
Сообщения
1 440
Благодарностей
503
Баллы
113
Картинки не отображаются, примера текста и что конкретно нужно спарсить нет. Чем помочь-то?
 

gogagoga

Новичок
Регистрация
23.09.2016
Сообщения
29
Благодарностей
0
Баллы
1
не могу понять, что с картинками.
нужно спарсить пост, в котором ест @нужный логин, (именно div, а не саму ссылку). т.е regexp должен быть составлен таким образом, чтобы искать все подходящие атрибуты в которых присутствует @нужный логин. а что там присутствует кроме него (и присутствует ли что-то) - неважно

https://yadi.sk/i/NLTxO87rwR944
https://yadi.sk/i/p-YJvyxhwQoG4
 

Dimionix

Moderator
Регистрация
09.04.2011
Сообщения
3 068
Благодарностей
3 122
Баллы
113
Код:
.*@нужный логин.*
Напр.:
Код:
.*@olololo.*
Со значением Login из переменной:
Код:
.*@{-Variable.Login-}.*
 
  • Спасибо
Реакции: gogagoga

gogagoga

Новичок
Регистрация
23.09.2016
Сообщения
29
Благодарностей
0
Баллы
1
подниму тему.
ищу этот элемент через атрибут innerhtml. как сказал
Код:
.*@нужный логин.*
Напр.:
Код:
.*@olololo.*
Со значением Login из переменной:
Код:
.*@{-Variable.Login-}.*
однако, получается, что парсер переберает все innerhtml, всех divov. это долго происходит (секунд 8, что для спамера долговато. во много потоков же надо). есть ли какой-то поиск по двум атрибутам, например, я знаю, что у нужного мне атрибута class im_message_text. и из всех таких классов мне нужно найти див с нужным Innerhtml?
 

Sapfire65

Client
Регистрация
05.06.2016
Сообщения
103
Благодарностей
22
Баллы
18
Думаю тебе нужно загрузить пример кода в котором нужно найти строку. И патом уже спрашивать как это реализовать.
Загрузи тхт документ на яндекс диск с полным колом страницы. И что из этого тебе нужно спарсить.
 
  • Спасибо
Реакции: konfuciy

konfuciy

Client
Регистрация
07.05.2014
Сообщения
1 402
Благодарностей
131
Баллы
63
подниму тему.
ищу этот элемент через атрибут innerhtml. как сказал

однако, получается, что парсер переберает все innerhtml, всех divov. это долго происходит (секунд 8, что для спамера долговато. во много потоков же надо). есть ли какой-то поиск по двум атрибутам, например, я знаю, что у нужного мне атрибута class im_message_text. и из всех таких классов мне нужно найти див с нужным Innerhtml?
Думаю тебе нужно загрузить пример кода в котором нужно найти строку. И патом уже спрашивать как это реализовать.
Загрузи тхт документ на яндекс диск с полным колом страницы. И что из этого тебе нужно спарсить.
без этого пустая возня будет.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)