Бесплатно напишу регулярное выражение. Часть 2.

  • Автор темы Автор темы LightWood
  • Дата начала Дата начала
Когда я РИА парсил, то шел таким путем: 1- Сначала через regex берем всю новость по тегам в отдельную переменную, 2- потом уже из этой переменной регулярками ее разбираем на зоголовок, теги, картинку и текст, 3- и уже в заголовке, тексте и тегах просто убивается весь html и все левые символы просто через замену. Для удаления html регулярка вот: <[\w\W]*?>
 
  • Спасибо
Реакции: Bening
Когда я РИА парсил, то шел таким путем: 1- Сначала через regex берем всю новость по тегам в отдельную переменную, 2- потом уже из этой переменной регулярками ее разбираем на зоголовок, теги, картинку и текст, 3- и уже в заголовке, тексте и тегах просто убивается весь html и все левые символы просто через замену. Для удаления html регулярка вот: <[\w\W]*?>

Спасибо! Буду пробовать.
 
есть вот такие строк, надо брать то что выделено, ну это я их выделил что бы понятней было что надо
Киевская, Киев, р-н. Галицький, Волощака
Киевская, Киев, р-н. Личаківський, Личаківська вулиця
Киевская, Киев, р-н. Лычаковский, Шафарика&nbsp; улица
Киевская, Киев, р-н. Галицький, Балабана Маєра вулиця
 
(?<=([^,\n]+,){2}\s*)[А-Я]\w+(\s+[А-Я]\w+)*
если не затруднит, переделайте/доделайте чутка, просто попадаются и другие строки, вот такого плана,
Киевская, Киев, Дж. Ленона
Киевская, Киев, р-н. Франківський, В.Великого
 
если не затруднит, переделайте/доделайте чутка, просто попадаются и другие строки, вот такого плана,
Киевская, Киев, Дж. Ленона
Киевская, Киев, р-н. Франківський, В.Великого
такое попробуй
(?<=,)[^,&]+?(?=(улица|вулиця|\&|\n))
 
всё как бы нармуль, только последние не ловит Киевская, Киев, р-н. Франківський, В.Великого
а так спасибо
неправда ваша, проверил, ловит все из ваших примеров, кроме как если идет последняя строка в тексте, этот момент я упустил, дополняю
(?<=,)[^,&]+?(?=(улица|вулиця|\&|\n|$))
 
  • Спасибо
Реакции: xuligan
Спасибо, сейчас всё просто шоколадно))))))
 
  • Спасибо
Реакции: konfuciy
Ребят, подскажите пожалуйста, как удалить все после 33 символа в строке?
 
(?<=.{33})\w+
 
это регулярка удаляет все символы до 33, а мне нужно после 33 =)
чет все до меня не дойдет, как это сделать.
дык пользуешь Обработка текста/Регекс и получаешь искомое - строку за вычетом всего после 33го символа. берешь в ту же переменную
 
В нотепад++ работает следующая регулярка:
(?<=^.{33}).+

Спасибо doc
 
а как найти в тексте кей который в кавычках и состоит из 32 символов(цифры и маленькие латинские)?

Спасибо вики)
(?<=")\w{32}(?=")
 
Последнее редактирование:
Хлопцы помогите вытащить этот номер:
{\"hash\":\"f990f9a75fe190bd35\",\"sureBoxText\":false,\"strongCode\":0,\"joinParams\":false,
конструктор рег.выражений не помогает,там получается такая регулярка (?<=hash\\":\\").*?(?=\\) но в с# коде лезут ошибки,требует вставить скобки или ;
Наверное нужно что-то еще экранировать,но не знаю как,пробовал ставить @ перед регуляркой,но тоже не спасает.
 
Хлопцы помогите вытащить этот номер:
{\"hash\":\"f990f9a75fe190bd35\",\"sureBoxText\":false,\"strongCode\":0,\"joinParams\":false,
конструктор рег.выражений не помогает,там получается такая регулярка (?<=hash\\":\\").*?(?=\\) но в с# коде лезут ошибки,требует вставить скобки или ;
Наверное нужно что-то еще экранировать,но не знаю как,пробовал ставить @ перед регуляркой,но тоже не спасает.
если ставишь @ то двойные кавычки нужно даблить
@"(?<=hash\\"":\\"").*?(?=\\)"
 
  • Спасибо
Реакции: Sanekk
Есть урл на картинку. Нужно спарсить расширение файла, тоесть от последней точки до конца строки. Подскажите? Честное пионерское, сяду за изучение регулярок =)
 
уже ответили
либо так .*\.(.*)$
 
  • Спасибо
Реакции: Nord
Подскажите как удалить все после 20 слов в много строчном тексте
 
  • Спасибо
Реакции: sidor800
Подскажите как взять 3 последних слова
 
  • Спасибо
Реакции: sidor800
Подскажите как одним регулярным выражение удалить все теги, но оставить определенные p br img
есть выражение [^\s\d\w-":] удаляет все спецсимволы кроме -": надо что то наподобие но для тегов
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)