Вопрос по REGEX, данные в двух строках

DevOps

Client
Регистрация
30.11.2020
Сообщения
496
Благодарностей
314
Баллы
63
Добрый день форум. Забуксовал на одном нюансе (хоть убей не могу вспомнить как делается)
Пишу парсер под один сайт, все строки, точнее данные расположены в одну целую строку, но есть блок кода (указан ниже) в котором неменого иначе
Подскажите образец регулярки для таких случаев
HTML:
<div>
<div class="fw-bold mb-1">Дата регистрации</div>
<div>28 октября 2002 года</div>
</div>
    
    
    
<div>
<div class="fw-bold mb-1">Основной вид деятельности</div>
<div><a href="/companies?by=activity&code=85.41">Образование дополнительное детей и взрослых</a></div>
</div>
    
<div>
<div class="fw-bold mb-1">Юридический адрес</div>
<div>649100, республика Алтай, Майминский район, с. Майма, ул. Советская, д. 36
</div>
</div>

<div>
<div class="fw-bold mb-1">Организационно-правовая форма</div>
<div>Муниципальные бюджетные учреждения</div>
</div>
    
<div>
<div class="fw-bold mb-1">Форма собственности</div>
<div>Муниципальная собственность</div>
</div>
Спасибо
 

Alexmd

Client
Регистрация
10.12.2018
Сообщения
1 022
Благодарностей
1 424
Баллы
113
Добрый день форум. Забуксовал на одном нюансе (хоть убей не могу вспомнить как делается)
Пишу парсер под один сайт, все строки, точнее данные расположены в одну целую строку, но есть блок кода (указан ниже) в котором неменого иначе
Подскажите образец регулярки для таких случаев
HTML:
<div>
<div class="fw-bold mb-1">Дата регистрации</div>
<div>28 октября 2002 года</div>
</div>
   
   
   
<div>
<div class="fw-bold mb-1">Основной вид деятельности</div>
<div><a href="/companies?by=activity&code=85.41">Образование дополнительное детей и взрослых</a></div>
</div>
   
<div>
<div class="fw-bold mb-1">Юридический адрес</div>
<div>649100, республика Алтай, Майминский район, с. Майма, ул. Советская, д. 36
</div>
</div>

<div>
<div class="fw-bold mb-1">Организационно-правовая форма</div>
<div>Муниципальные бюджетные учреждения</div>
</div>
   
<div>
<div class="fw-bold mb-1">Форма собственности</div>
<div>Муниципальная собственность</div>
</div>
Спасибо
C#:
var text = Regex.Replace(project.Variables["text"].Value, @"<.*?>", "");
text.Split(new[]{Environment.NewLine+Environment.NewLine},StringSplitOptions.RemoveEmptyEntries)
    .Where(x=>!string.IsNullOrWhiteSpace(x))
    .ToList().ForEach(x=>
    {
        project.SendInfoToLog(string.Join(": ", x.Split(new[]{Environment.NewLine},StringSplitOptions.RemoveEmptyEntries).Select(w=>w.Trim())));
    }
);
1676707146014.png
 
  • Спасибо
Реакции: DevOps

DevOps

Client
Регистрация
30.11.2020
Сообщения
496
Благодарностей
314
Баллы
63
C#:
var text = Regex.Replace(project.Variables["text"].Value, @"<.*?>", "");
text.Split(new[]{Environment.NewLine+Environment.NewLine},StringSplitOptions.RemoveEmptyEntries)
    .Where(x=>!string.IsNullOrWhiteSpace(x))
    .ToList().ForEach(x=>
    {
        project.SendInfoToLog(string.Join(": ", x.Split(new[]{Environment.NewLine},StringSplitOptions.RemoveEmptyEntries).Select(w=>w.Trim())));
    }
);
Посмотреть вложение 103428
Большой спасиб и лайк!
 
  • Спасибо
Реакции: Alexmd

DevOps

Client
Регистрация
30.11.2020
Сообщения
496
Благодарностей
314
Баллы
63
C#:
var text = Regex.Replace(project.Variables["text"].Value, @"<.*?>", "");
text.Split(new[]{Environment.NewLine+Environment.NewLine},StringSplitOptions.RemoveEmptyEntries)
    .Where(x=>!string.IsNullOrWhiteSpace(x))
    .ToList().ForEach(x=>
    {
        project.SendInfoToLog(string.Join(": ", x.Split(new[]{Environment.NewLine},StringSplitOptions.RemoveEmptyEntries).Select(w=>w.Trim())));
    }
);
Посмотреть вложение 103428
Черкани в личку
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)