Бесплатно напишу регулярное выражение. Часть 2.

n0n3mi1y

Client
Регистрация
08.03.2017
Сообщения
1 237
Благодарностей
573
Баллы
113
делаешь замену по регулярке [^\d-] на пустоту
Потом по регулярке \d+ нулевое совпадение в переменную 1. Первое совпадение в переменную 2
Спасибо, потестим.
 

Nord

Client
Регистрация
22.03.2012
Сообщения
2 406
Благодарностей
1 473
Баллы
113
Привет, товарищи.
Требуется небольшая помощь =)
Как в коде реализовать

Задача -


Кубик работает только для замены всего, на одном совпадении - не работает.

Сниппет
Код:
project.Variables["Test_after"].Value = System.Text.RegularExpressions.Regex.Replace(project.Variables["Test"].Value, @"(<p>(\W*\b\w+\b\\W*){2}(?=[а-я0-9,]))", "$1 " + project.Variables["anchor"].Value);
Ничего не меняет
 

one

Client
Регистрация
22.09.2015
Сообщения
6 833
Благодарностей
1 275
Баллы
113
Не помню точно, но мне почему то кажется я подобный вопрос задавал на форуме и были предложены какие то решения. Точно помню, что сталкивался с надобностью распихивания анкоров по тексту.
 

auva

Client
Регистрация
09.02.2016
Сообщения
34
Благодарностей
4
Баллы
8
Всем привет, пожалуйста, подскажите, как составить регулярку.

задача, удалить все лишние строки и оставить только относящиеся к домену/субдомену взятой из переменной URL.
url - в этой переменной домен может быть в формате
Код:
http://site.ru
https://site.ru
http://site.ru/
https://site.ru/
http://www.site.ru
https://www.site.ru
http://www.site.ru/
https://www.site.ru/
www.site.ru
site.ru
примеры строк, которые надо почистить
Код:
https://tut.ex.com/mapfiles/
http://tut.ex.com/
https://ex.com/mapfiles/
//ex.com/mapfiles/
ex.com/mapfiles/
tut.ex.com/
tut.ex.com/mapfiles/
//tut.ex.com/
//mapfiles/
/mapfiles/
http://drugoydomen.ru/
должно остаться
Код:
https://tut.ex.com/mapfiles/
http://tut.ex.com/
https://ex.com/mapfiles/
ex.com/mapfiles/
tut.ex.com/ 
tut.ex.com/mapfiles/
Желательно их иметь в одном формате, чтоб потом по ним можно было пройтись ;-)
 
Последнее редактирование:

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Всем привет, пожалуйста, подскажите, как составить регулярку.

задача, удалить все лишние строки и оставить только относящиеся к домену/субдомену взятой из переменной URL.
url - в этой переменной домен может быть в формате
Код:
http://site.ru
https://site.ru
http://site.ru/
https://site.ru/
http://www.site.ru
https://www.site.ru
http://www.site.ru/
https://www.site.ru/
www.site.ru
site.ru
примеры строк, которые надо почистить
Код:
https://tut.ex.com/mapfiles/
http://tut.ex.com/
https://ex.com/mapfiles/
//ex.com/mapfiles/
ex.com/mapfiles/
tut.ex.com/
tut.ex.com/mapfiles/
//tut.ex.com/
//mapfiles/
/mapfiles/
http://drugoydomen.ru/
должно остаться
Код:
https://tut.ex.com/mapfiles/
http://tut.ex.com/
https://ex.com/mapfiles/
ex.com/mapfiles/
tut.ex.com/
tut.ex.com/mapfiles/
Желательно их иметь в одном формате, чтоб потом по ним можно было пройтись ;-)
1. Загнать текст который надо почистить в список зенки
2. Вытянуть из урла, по которому будем искать именно название сайта без приставок, то есть ex.com.
3. Удалить из списка строки, не содержащие название сайта.
 

auva

Client
Регистрация
09.02.2016
Сообщения
34
Благодарностей
4
Баллы
8
1. список ссылок и так в списке зенки;-)
2. но у меня ведь могут быть и субдомены, не пойму как и их еще вытащить.
3. не пойму как удалить из списка строки не содержащие название сайта.

задача шаблона у меня простая.
1. беру из списка url (главная страница)
2. проверяю на наличие кода в DOM, ЕСЛИ код отсутствует, то вытаскиваю из DOM все ссылки. На этом этапе как раз и проблема - ссылки могут быть в разных форматах. Пример показывал выше.
 

Шива

Client
Регистрация
05.02.2018
Сообщения
1 088
Благодарностей
341
Баллы
83
Как в строке _super_man.php
удалить _super_man.php оставив _super_man.php
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113

SanchoPancho

Client
Регистрация
09.12.2015
Сообщения
165
Благодарностей
82
Баллы
28
Как в строке _super_man.php
удалить _super_man.php оставив _super_man.php
Код:
string text = project.ExecuteMacro("{-Variable.ПЕРЕМЕННАЯ-}");
project.Variables["ПЕРЕМЕННАЯ"].Value = Macros.TextProcessing.Replace(text, "_", "", "Text", "First");
 

inbizin

Client
Регистрация
09.08.2018
Сообщения
9
Благодарностей
0
Баллы
1
Помогите разобраться с ссылками.
Есть файлик в екселе или блокноте в нем куча ссылок в рандомном порядке с временем и датой твитов

https://twitter.com/1/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время



как их разложить по полочакам чтобы было

https://twitter.com/1/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время

https://twitter.com/2/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время

https://twitter.com/3/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
 

Sanekk

Client
Регистрация
24.06.2016
Сообщения
999
Благодарностей
390
Баллы
63
Привет, выручайте хлопцы

option value="132" selected>охранные структуры</option>

- зеленым цветом то что нужно взять.
- красным цветом рандомное значение(могут быть только цифры)
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Привет, выручайте хлопцы

option value="132" selected>охранные структуры</option>

- зеленым цветом то что нужно взять.
- красным цветом рандомное значение(могут быть только цифры)
(?<=option\ value="\d{2,5}"\ selected>).*?(?=</option>)

{2,5} количество цифр от и до

другой вариант без учета "циферок"
(?<=option\ value=".*?"\ selected>).*?(?=</option>)
 
Последнее редактирование:
  • Спасибо
Реакции: Sanekk
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Помогите разобраться с ссылками.
Есть файлик в екселе или блокноте в нем куча ссылок в рандомном порядке с временем и датой твитов

https://twitter.com/1/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время



как их разложить по полочакам чтобы было

https://twitter.com/1/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время
https://twitter.com/1/status/ххххххх дата время

https://twitter.com/2/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время
https://twitter.com/2/status/ххххххх дата время

https://twitter.com/3/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
https://twitter.com/3/status/ххххххх дата время
Вам скорее всего лучше посмотреть тут https://zennolab.com/discussion/threads/poisk-po-spiskam-i-tablicam-cherez-c-makros.10734/
Работайте с таблицей или списком.
 

mihacb

Новичок
Регистрация
05.10.2018
Сообщения
22
Благодарностей
0
Баллы
1
Здравствуйте, друзья!
Простейший вопрос, есть список с 5 строками:
name1
name2
name3
name4
name5
Как сделать, чтобы в случае несрабатывания определенного действия, в переменную х записывалось следующее значение за name1? А после name5 опять на name1 перескакивало, каждый раз когда не срабатывает действие, переменная ходит по кругу списка?
 

Sanekk

Client
Регистрация
24.06.2016
Сообщения
999
Благодарностей
390
Баллы
63
Здравствуйте, друзья!
Простейший вопрос, есть список с 5 строками:
name1
name2
name3
name4
name5
Как сделать, чтобы в случае несрабатывания определенного действия, в переменную х записывалось следующее значение за name1? А после name5 опять на name1 перескакивало, каждый раз когда не срабатывает действие, переменная ходит по кругу списка?
пиши в раздел вопросы для новичков
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Здравствуйте, друзья!
Простейший вопрос, есть список с 5 строками:
name1
name2
name3
name4
name5
Как сделать, чтобы в случае несрабатывания определенного действия, в переменную х записывалось следующее значение за name1? А после name5 опять на name1 перескакивало, каждый раз когда не срабатывает действие, переменная ходит по кругу списка?
Это как бы не про регулярки..
Посмотрите в сторону Экшен - Switch
 

juder

Client
Регистрация
05.08.2018
Сообщения
62
Благодарностей
21
Баллы
8
Есть урл на картинку. Нужно спарсить расширение файла, тоесть от последней точки до конца строки. Подскажите? Честное пионерское, сяду за изучение регулярок =)
Подскажите плз как без точки спарсить, только расширение?
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
  • Спасибо
Реакции: juder

maryan

Client
Регистрация
04.07.2014
Сообщения
230
Благодарностей
40
Баллы
28
привет! есть входящие сообщения
1сообщ=1строка

могу дать 1800 уже после 20 увгуста
за 1 700$ заберу через 2-3 дня
дайте вайбер, есть вопросы
1500$
1500 дать могу
За 1800 ?
1700 и забираю
1600$????
1 500
обмен на мой ск.2007г. срочно
обмен на мой ск.2007 год . срочно

как почистить их всех от шлака и оставить только цену (число с 4 цифр, иногда\или 5 цифр)?
посе с текстом без цены оставить пустым или не трогать
заранее спасибо.
 

konfuciy

Client
Регистрация
07.05.2014
Сообщения
1 402
Благодарностей
131
Баллы
63
привет! есть входящие сообщения
1сообщ=1строка

могу дать 1800 уже после 20 увгуста
за 1 700$ заберу через 2-3 дня
дайте вайбер, есть вопросы
1500$
1500 дать могу
За 1800 ?
1700 и забираю
1600$????
1 500
обмен на мой ск.2007г. срочно
обмен на мой ск.2007 год . срочно

как почистить их всех от шлака и оставить только цену (число с 4 цифр, иногда\или 5 цифр)?
посе с текстом без цены оставить пустым или не трогать
заранее спасибо.

в два хода


1. обработка текста/замена регекс
.*обмен.*
на пустоту

2. обработка текста/регекс
(\d{4,5}|\d\s\d{3,4})
 

zenno60

Пользователь
Регистрация
09.05.2016
Сообщения
99
Благодарностей
1
Баллы
8
Регулярное выражение:
(?<=<div\ id="user_photo"\ style="background:url\().*?(?=\)\ no-repeat"></div>)

извлекает ссылку:
userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg

Вопрос: как сделать чтобы регулярное выражение добавляло к ссылке текст "https://domain.com/"?

Т.е. как сделать чтобы получилось
https://domain.com/userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
Регулярное выражение:
(?<=<div\ id="user_photo"\ style="background:url\().*?(?=\)\ no-repeat"></div>)

извлекает ссылку:
userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg

Вопрос: как сделать чтобы регулярное выражение добавляло к ссылке текст "https://domain.com/"?

Т.е. как сделать чтобы получилось
https://domain.com/userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg
Кубик "Обработка текста"
Регулярка не обрабатывает текст. Это просто шаблон для поиска вхождений
 
  • Спасибо
Реакции: zenno60

zenno60

Пользователь
Регистрация
09.05.2016
Сообщения
99
Благодарностей
1
Баллы
8
Кубик "Обработка текста"
Регулярка не обрабатывает текст. Это просто шаблон для поиска вхождений
Т.е.
- Кубик_1 - извлекает "userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg";
- Кубик_2 - выполняет сцепку ""https://domain.com/"+ "userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg"; и возвращает "https://domain.com/userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg".

Я правильно вас понял?
 
Регистрация
12.07.2014
Сообщения
916
Благодарностей
373
Баллы
63
  • Спасибо
Реакции: zenno60

konfuciy

Client
Регистрация
07.05.2014
Сообщения
1 402
Благодарностей
131
Баллы
63
Регулярное выражение:
(?<=<div\ id="user_photo"\ style="background:url\().*?(?=\)\ no-repeat"></div>)

извлекает ссылку:
userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg

Вопрос: как сделать чтобы регулярное выражение добавляло к ссылке текст "https://domain.com/"?

Т.е. как сделать чтобы получилось
https://domain.com/userphoto/247495/78241/x.pagespeed.ic.xqwIINi0g7.jpg

очень просто
1. взять в скобки регулярку поиска текста
2. использовать Замена, а не Регекс
3. в Замене указать заменять на
https://domain.com/$1
 
  • Спасибо
Реакции: zenno60

udder

Client
Регистрация
28.03.2017
Сообщения
618
Благодарностей
128
Баллы
43
Помогите с регулярным выражением которое удалит все символы кроме латинских букв и цифр
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113
  • Спасибо
Реакции: udder

udder

Client
Регистрация
28.03.2017
Сообщения
618
Благодарностей
128
Баллы
43
Данная регулярка удаляет как раз таки буквы и цифры, оставляет только сиволы, как наоборот сделать чтобы сохраняла только буквы и цифры?
 

doc

Client
Регистрация
30.03.2012
Сообщения
8 684
Благодарностей
4 641
Баллы
113
  • Спасибо
Реакции: udder

cherus09

Client
Регистрация
10.10.2016
Сообщения
172
Благодарностей
14
Баллы
18
Привет, решил сделать парсер Авито на гет запросах, столкнулся с такой проблемой что не могу выдернуть ссылки на объявления из кода страницы спарсиным гет запросом. В конструкторе регулярок все норм находит, а при запуске кубика обработка текста пишет (
Выполнение действия TextProcessing Ничего не найдено при поиске текста регулярным выражением) Регулярка которой пытаюсь выдрать ссылки на объявы (?<=itemprop="url"\ href=").*(?="\ title="). Помогите, пожалуйста!







 

Кто просматривает тему: (Всего: 3, Пользователи: 0, Гости: 3)