попробуйте парсинг через снипет C#:Есть файл на 150мб текста, надо пройти по нему регуляркой и собрать все вхождения в список.
ПК не слабый, но стандартный regex из обработки текста работает слишком долго (минут 20 висел, просто не дождался окончания).
var parse = project.Variables["txt"].Value;
var regex = new Regex(@"регулярка");
var zp_list = project.Lists["Список 1"];
regex.Matches(parse).Cast<Match>().ToList().ForEach(m=>zp_list.Add(m.Value));
Я буквально 2 часа назад делал то же. Файл был на 220 мб. Виполнил: Файл: взять текст в переменную -Обработка текста: реджекс, брать все результаты, положить в список - Список с привязкой к файлу. Все ок, 10 сек и спарсило с сохранением.Есть файл на 150мб текста, надо пройти по нему регуляркой и собрать все вхождения в список.
ПК не слабый, но стандартный regex из обработки текста работает слишком долго (минут 20 висел, просто не дождался окончания).
очень многое может зависеть от регуляркиЯ буквально 2 часа назад делал то же. Файл был на 220 мб. Виполнил: Файл: взять текст в переменную -Обработка текста: реджекс, брать все результаты, положить в список - Список с привязкой к файлу. Все ок, 10 сек и спарсило с сохранением.
Так я про этот метод и пишу, что слишком долгое выполнение.Я буквально 2 часа назад делал то же. Файл был на 220 мб. Виполнил: Файл: взять текст в переменную -Обработка текста: реджекс, брать все результаты, положить в список - Список с привязкой к файлу. Все ок, 10 сек и спарсило с сохранением.
([a-z0-9_-]+\.)*[a-z0-9_-]+@[a-z0-9_-]+(\.[a-z0-9_-]+)*\.[a-z]{2,6}очень многое может зависеть от регулярки
string pattern = "a*";
string input = "abaabb";
foreach (Match m in Regex.Matches(input, pattern))
project.Lists[ "mails"].Add(m.Value);
а конструктор рег выражений в РМ что не спасает ?Привет! Подскажите как выпапсить значение "4210 S Galapago St, Englewood, CO 80110" в таком блоке?
все пробелы 1в1 как на стр.
спасибо за ответыКод:<address> 4210 S Galapago St, Englewood, CO 80110 </address>
не, выдает бред.а конструктор рег выражений в РМ что не спасает ?
вау), работает) спасибо большое)(?<=<address>\n\s+)\w+.*?(?=\n)