Но тогда мне нужно строку из списка положить в переменную, убрать тег и записать в новый список. А можно как то без лишних экшенов, а то скорость мне кажется упадет в разы. Можно ли со списком уже готовым как то операцию провести, или в момент взятия DOM?После парсинга еще раз пройтись по тексту экшеном операции с текстом - замена
и заменить все теги <*.?> на пустоту
Это нужно делать в 2 шага, собирая отдельно каждые данные в свою переменную.Извиняюсь, что-то я не то сделал. Админы, если не трудно сотрите предидущий пост.
А теперь мой вопрос
С помощью регулярных выражений надо вытащить из исходного кода (в h3-контейнере):
<h3 class="r"><a class="pstl" data-what="1" href="http://www.google.de/aclk?sa=l&ai=C-9oQygENVpujKqGXzAOfn... jsaction="spop.c">10 x Leitz Stehsammler 24230095 DIN A476mm Hartpappe RC schwarz</a></h3>
ссылку на продукт, которая стоит после adurl:
http://bueropartner24.de/Ordnen-Registrieren/Schreibtischorg...
и название продукта, которое стоит после jsaction="spop.c">:
10 x Leitz Stehsammler 24230095 DIN A476mm Hartpappe RC schwarz
Эта регулярка вроде должна работать, но не тут-то было:
<h3 class="r">\s*<a class="pstl".+?&adurl=(.+?)(?:&|")[^>]*>(.+?)<\/a>
Это последняя регулярка для того что бы закончить проект! Остальное уже всё сделано! ПОМОГИТЕЕЕЕ кто может!!!
спасибо, но получилось взять только первую цифру 2, остальные 041219 почему-то не спарсились.
это шрифт курсивный в цитатном блоке наклоняет слеш, что он начинает на | быть похожим..не |d+ а \d+
Тут проще не взять все цифры, а удалить всё, что не является цифрой.Подскажите, пожалуйста, как регуляркой взять из строки только цифры, без букв и прочих сиволов? Пример:
То есть, чтобы на выходе получилось 2041219Код:2<span class="num_delim"> </span>041<span class="num_delim"> </span>219 подписч
Я взял именно \d , это форум так в цитате отобразил черту вертикально.не |d+ а \d+ в список => объеденить элементы, разделитель свой, в переменную
если равно всё время меняется в колличестве но значение это последнее, возьми сначала через регулярку .*?(?==) раздели и забери последнее значение, ну а потом с полученной строки возьми 11цифр с концаПодскажите, пожалуйста как должна выглядеть регулярка, которая бы из переменной состоящей из одной строки, брала бы 11 символов находящихся перед последним знаком равно.
Пример:
из этой строки s39d90efh35r3rijv038535=skh349 нужно взять 3rijv038535
При этом знак = в строке может встречаться два раза, а необходимо брать текст перед самым последним. Как в этом примере:
b81husd4-394=s408bdj7mk043sd094=sd0fg нужно взять 7mk043sd094
Изначально неизвестно сколько будет равно, один или два.
Помогите
нужно удалить все кусочки кода где встречаются слова или символы не входящие в этот список
а-я А-Я a-z A-Z 0-9 !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
вот пример:
https://pp.vk.me/c629408/v629408176/2e276/nS2dJduVHKQ.jpg
нужно чтобы получилось так:
https://pp.vk.me/c622927/v622927194/332f2/lBJOtZsP3P8.jpg
[^а-яА-ЯёЁa-zA-Z0-9!"\#\$%&'\(\)\*\+,-\./:;<=>\?@\[\\]\^_`\{\|}~]
Попробовал сейчас - ничего эта регулярка не находит в Вашем пути. Как он её испортил?https://pp.vk.me/c624831/v624831411/4d089/8Q2xuZqjlrM.jpg
он испортил ссылку
C:\Users\123\Desktop\1.6.8\avitobot.exe
https://pp.vk.me/c624831/v624831411/4d07f/QDG945skrhY.jpg
как сделать так чтобы эти данные не испортились?
Разные движки регулярных выражений, есть отличительные особенностино регулярное выражение одинаковое а в редакторе
notepad++
и
ProjectMaker for ZennoPoster v5.9.3.1
работают по разному
Выложите исходный текст для проверки, используемую регулярку, и опишите чего в ней не хватает чтобы всё в одном посте было, так выше вероятность что вам помогутЭто понятно. Но задача стоит отсортировать именно в нотепаде