Бесплатно напишу регулярное выражение. Часть 2.

  • Автор темы Автор темы LightWood
  • Дата начала Дата начала
делаешь замену по регулярке [^\d-] на пустоту
Потом по регулярке \d+ нулевое совпадение в переменную 1. Первое совпадение в переменную 2
Спасибо, потестим.
 
Привет, товарищи.
Требуется небольшая помощь =)
Как в коде реализовать

Задача -
S3w7MsJ.png


Кубик работает только для замены всего, на одном совпадении - не работает.

Сниппет
Код:
Развернуть Свернуть Копировать
project.Variables["Test_after"].Value = System.Text.RegularExpressions.Regex.Replace(project.Variables["Test"].Value, @"(<p>(\W*\b\w+\b\\W*){2}(?=[а-я0-9,]))", "$1 " + project.Variables["anchor"].Value);
Ничего не меняет
 
Не помню точно, но мне почему то кажется я подобный вопрос задавал на форуме и были предложены какие то решения. Точно помню, что сталкивался с надобностью распихивания анкоров по тексту.
 
Всем привет, пожалуйста, подскажите, как составить регулярку.

задача, удалить все лишние строки и оставить только относящиеся к домену/субдомену взятой из переменной URL.
url - в этой переменной домен может быть в формате
Код:
Развернуть Свернуть Копировать
http://site.ru
https://site.ru
http://site.ru/
https://site.ru/
http://www.site.ru
https://www.site.ru
http://www.site.ru/
https://www.site.ru/
www.site.ru
site.ru

примеры строк, которые надо почистить
Код:
Развернуть Свернуть Копировать
https://tut.ex.com/mapfiles/
http://tut.ex.com/
https://ex.com/mapfiles/
//ex.com/mapfiles/
ex.com/mapfiles/
tut.ex.com/
tut.ex.com/mapfiles/
//tut.ex.com/
//mapfiles/
/mapfiles/
http://drugoydomen.ru/
должно остаться
Код:
Развернуть Свернуть Копировать
https://tut.ex.com/mapfiles/
http://tut.ex.com/
https://ex.com/mapfiles/
ex.com/mapfiles/
tut.ex.com/ 
tut.ex.com/mapfiles/
Желательно их иметь в одном формате, чтоб потом по ним можно было пройтись ;-)
 
Последнее редактирование:
Всем привет, пожалуйста, подскажите, как составить регулярку.

задача, удалить все лишние строки и оставить только относящиеся к домену/субдомену взятой из переменной URL.
url - в этой переменной домен может быть в формате
Код:
Развернуть Свернуть Копировать
http://site.ru
https://site.ru
http://site.ru/
https://site.ru/
http://www.site.ru
https://www.site.ru
http://www.site.ru/
https://www.site.ru/
www.site.ru
site.ru

примеры строк, которые надо почистить
Код:
Развернуть Свернуть Копировать
https://tut.ex.com/mapfiles/
http://tut.ex.com/
https://ex.com/mapfiles/
//ex.com/mapfiles/
ex.com/mapfiles/
tut.ex.com/
tut.ex.com/mapfiles/
//tut.ex.com/
//mapfiles/
/mapfiles/
http://drugoydomen.ru/
должно остаться
Код:
Развернуть Свернуть Копировать
https://tut.ex.com/mapfiles/
http://tut.ex.com/
https://ex.com/mapfiles/
ex.com/mapfiles/
tut.ex.com/
tut.ex.com/mapfiles/
Желательно их иметь в одном формате, чтоб потом по ним можно было пройтись ;-)
1. Загнать текст который надо почистить в список зенки
2. Вытянуть из урла, по которому будем искать именно название сайта без приставок, то есть ex.com.
3. Удалить из списка строки, не содержащие название сайта.
 
1. список ссылок и так в списке зенки;)
2. но у меня ведь могут быть и субдомены, не пойму как и их еще вытащить.
3. не пойму как удалить из списка строки не содержащие название сайта.

задача шаблона у меня простая.
1. беру из списка url (главная страница)
2. проверяю на наличие кода в DOM, ЕСЛИ код отсутствует, то вытаскиваю из DOM все ссылки. На этом этапе как раз и проблема - ссылки могут быть в разных форматах. Пример показывал выше.
 
Как в строке _super_man.php
удалить _super_man.php оставив _super_man.php
 
Как в строке _super_man.php
удалить _super_man.php оставив _super_man.php
Код:
Развернуть Свернуть Копировать
string text = project.ExecuteMacro("{-Variable.ПЕРЕМЕННАЯ-}");
project.Variables["ПЕРЕМЕННАЯ"].Value = Macros.TextProcessing.Replace(text, "_", "", "Text", "First");
 
Помогите разобраться с ссылками.
Есть файлик в екселе или блокноте в нем куча ссылок в рандомном порядке с временем и датой твитов

https://twitter.com/1/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время



как их разложить по полочакам чтобы было

https://twitter.com/1/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время

https://twitter.com/2/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время

https://twitter.com/3/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
 
Привет, выручайте хлопцы

option value="132" selected>охранные структуры</option>

- зеленым цветом то что нужно взять.
- красным цветом рандомное значение(могут быть только цифры)
 
Привет, выручайте хлопцы

option value="132" selected>охранные структуры</option>

- зеленым цветом то что нужно взять.
- красным цветом рандомное значение(могут быть только цифры)
(?<=option\ value="\d{2,5}"\ selected>).*?(?=</option>)

{2,5} количество цифр от и до

другой вариант без учета "циферок"
(?<=option\ value=".*?"\ selected>).*?(?=</option>)
 
Последнее редактирование:
  • Спасибо
Реакции: Sanekk
Помогите разобраться с ссылками.
Есть файлик в екселе или блокноте в нем куча ссылок в рандомном порядке с временем и датой твитов

https://twitter.com/1/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время



как их разложить по полочакам чтобы было

https://twitter.com/1/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время

https://twitter.com/2/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время

https://twitter.com/3/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время

Вам скорее всего лучше посмотреть тут https://zennolab.com/discussion/threads/poisk-po-spiskam-i-tablicam-cherez-c-makros.10734/
Работайте с таблицей или списком.
 
Здравствуйте, друзья!
Простейший вопрос, есть список с 5 строками:
name1
name2
name3
name4
name5
Как сделать, чтобы в случае несрабатывания определенного действия, в переменную х записывалось следующее значение за name1? А после name5 опять на name1 перескакивало, каждый раз когда не срабатывает действие, переменная ходит по кругу списка?
 
Здравствуйте, друзья!
Простейший вопрос, есть список с 5 строками:
name1
name2
name3
name4
name5
Как сделать, чтобы в случае несрабатывания определенного действия, в переменную х записывалось следующее значение за name1? А после name5 опять на name1 перескакивало, каждый раз когда не срабатывает действие, переменная ходит по кругу списка?
пиши в раздел вопросы для новичков
 
Здравствуйте, друзья!
Простейший вопрос, есть список с 5 строками:
name1
name2
name3
name4
name5
Как сделать, чтобы в случае несрабатывания определенного действия, в переменную х записывалось следующее значение за name1? А после name5 опять на name1 перескакивало, каждый раз когда не срабатывает действие, переменная ходит по кругу списка?
Это как бы не про регулярки..
Посмотрите в сторону Экшен - Switch
 
Есть урл на картинку. Нужно спарсить расширение файла, тоесть от последней точки до конца строки. Подскажите? Честное пионерское, сяду за изучение регулярок =)
Подскажите плз как без точки спарсить, только расширение?
 
  • Спасибо
Реакции: juder
привет! есть входящие сообщения
1сообщ=1строка

могу дать 1800 уже после 20 увгуста
за 1 700$ заберу через 2-3 дня
дайте вайбер, есть вопросы
1500$
1500 дать могу
За 1800 ?
1700 и забираю
1600$????
1 500
обмен на мой ск.2007г. срочно
обмен на мой ск.2007 год . срочно

как почистить их всех от шлака и оставить только цену (число с 4 цифр, иногда\или 5 цифр)?
посе с текстом без цены оставить пустым или не трогать
заранее спасибо.
 
привет! есть входящие сообщения
1сообщ=1строка

могу дать 1800 уже после 20 увгуста
за 1 700$ заберу через 2-3 дня
дайте вайбер, есть вопросы
1500$
1500 дать могу
За 1800 ?
1700 и забираю
1600$????
1 500
обмен на мой ск.2007г. срочно
обмен на мой ск.2007 год . срочно

как почистить их всех от шлака и оставить только цену (число с 4 цифр, иногда\или 5 цифр)?
посе с текстом без цены оставить пустым или не трогать
заранее спасибо.


в два хода


1. обработка текста/замена регекс
.*обмен.*
на пустоту

2. обработка текста/регекс
(\d{4,5}|\d\s\d{3,4})
 
Регулярное выражение:
(?<=<div\ id="user_photo"\ style="background:url\().*?(?=\)\ no-repeat"></div>)

извлекает ссылку:
userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg

Вопрос: как сделать чтобы регулярное выражение добавляло к ссылке текст "https://domain.com/"?

Т.е. как сделать чтобы получилось
https://domain.com/userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg
 
Регулярное выражение:
(?<=<div\ id="user_photo"\ style="background:url\().*?(?=\)\ no-repeat"></div>)

извлекает ссылку:
userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg

Вопрос: как сделать чтобы регулярное выражение добавляло к ссылке текст "https://domain.com/"?

Т.е. как сделать чтобы получилось
https://domain.com/userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg
Кубик "Обработка текста"
Регулярка не обрабатывает текст. Это просто шаблон для поиска вхождений
 
  • Спасибо
Реакции: zenno60
Кубик "Обработка текста"
Регулярка не обрабатывает текст. Это просто шаблон для поиска вхождений
Т.е.
- Кубик_1 - извлекает "userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg";
- Кубик_2 - выполняет сцепку ""https://domain.com/"+ "userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg"; и возвращает "https://domain.com/userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg".

Я правильно вас понял?
 
  • Спасибо
Реакции: zenno60
Регулярное выражение:
(?<=<div\ id="user_photo"\ style="background:url\().*?(?=\)\ no-repeat"></div>)

извлекает ссылку:
userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg

Вопрос: как сделать чтобы регулярное выражение добавляло к ссылке текст "https://domain.com/"?

Т.е. как сделать чтобы получилось
https://domain.com/userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg


очень просто
1. взять в скобки регулярку поиска текста
2. использовать Замена, а не Регекс
3. в Замене указать заменять на
https://domain.com/$1
 
  • Спасибо
Реакции: zenno60
Помогите с регулярным выражением которое удалит все символы кроме латинских букв и цифр
 
  • Спасибо
Реакции: udder
Привет, решил сделать парсер Авито на гет запросах, столкнулся с такой проблемой что не могу выдернуть ссылки на объявления из кода страницы спарсиным гет запросом. В конструкторе регулярок все норм находит, а при запуске кубика обработка текста пишет (
Выполнение действия TextProcessing Ничего не найдено при поиске текста регулярным выражением) Регулярка которой пытаюсь выдрать ссылки на объявы (?<=itemprop="url"\ href=").*(?="\ title="). Помогите, пожалуйста!



1f75c6701c3fc1.png




c38cf2cfeb1d64.png
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)