Подскажите каким способом можно составить таблицу из данных

doc · 25.11.2021

всё что с новой строки и до двоеточия - это колонка таблицы (адрес, тел., дир. и т.д.)

doc · 26.11.2021

MaxLucky сказал(а):
Немного не понял.

Вот например в списке идёт:

адрес: 404143, Среднеахтубинский р-н,
х. Заярский
Дир.: Струк Владимир Михайлович

адрес относится к 2-м строкам. Как прописать логику, чтобы шаблон понимал, что 2 строки относятся к адресу, и соединял их. И + как определить где кончается одна компания и начинается другая. В этом весь вопрос... Список там большой.

(?m)^([^:\r\n]+):([^:]+)(?=$|\r?\n[^:]+:) Примерно такой регуляркой можно заставить понимать, что 2 строки относятся к 1му пункту. А вот как шаблон научить различать, что строка это фирма, это уже задача куда сложнее. Нужно искать закономерности. Если у каждой есть ООО или ЗАО и тому подобное, то можно найти решение. А вот если там могут быть названия вполне простые, то придётся думать куда более умный алгоритм.

Хотя вид данных сам по себе странный. Если он парсится, неужели при парсинге нельзя сразу получать всё в красивом виде, а не таком месиве?

doc · 26.11.2021

MaxLucky сказал(а):
Информация берётся из PDF документа. В котором всё и идёт в таком порядке (+ в ручную почистил от мусора). Попробую, что-нибудь придумать c помощью вашей регулярки

неужели визуально там всё идёт сплошным текстом? ни дополнительных строк, ни жирного шрифта, ни курсива, ни большего кегля, ни дополнительных разрывов?

doc · 26.11.2021

ну? там чёткое есть разделение. Есть снаружи, есть и внутри

doc · 26.11.2021

MaxLucky сказал(а):
Тогда вопрос, как это спарсить со всеми этими разделениями? Zennoposter особо не дружит с чтением PDF файлов, как я понял

а сейчас как парсишь?

doc · 26.11.2021

попробуй открыть файл в браузере как ссылку. Там может бть разметка, будто это веб страница

Поиск

Подскажите каким способом можно составить таблицу из данных

MaxLucky

Client

Вложения

doc

Client

MaxLucky

Client

doc

Client

MaxLucky

Client

doc

Client

MaxLucky

Client

Вложения

doc

Client

MaxLucky

Client

doc

Client

MaxLucky

Client

doc

Client

MaxLucky

Client

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)