Куплю шаблон\сниппет PDF -> text, html, json, xml

lockerr

Client
Регистрация
20.08.2019
Сообщения
34
Благодарностей
10
Баллы
8
Всем привет!

Нужен шаблон или сниппет, который может конвертить PDF во что-то, с чем можно дальше работать в зенке: text, html, json, xml

предлагайте варианты сразу с ценами, тут или в tg:@rosfax
или если где-то это уже есть - буду благодарен если ткнете носом в ссылку :-)
 
  • Спасибо
Реакции: viktor045

Phoenix78

Client
Read only
Регистрация
06.11.2018
Сообщения
11 790
Благодарностей
5 697
Баллы
113
Кто же пишет OCR программы на зенке ? :bk:
Для этого есть сервисы и спец. программы которые распознают документ и воссоздают его структуру.... ну по крайней мере пытаются что то похожее сделать.
 

lockerr

Client
Регистрация
20.08.2019
Сообщения
34
Благодарностей
10
Баллы
8

lockerr

Client
Регистрация
20.08.2019
Сообщения
34
Благодарностей
10
Баллы
8

lockerr

Client
Регистрация
20.08.2019
Сообщения
34
Благодарностей
10
Баллы
8
Итого: благодаря @Ilshakin научился юзать либу itextsharp. Проблема только в том, что она успешно парсила все PDF кроме нужной мне :(

На помощь пришел форум и Total PDF Converter:

C#:
// using System.Diagnostics;

string source_file_dir = project.Directory;
string source_file_name = "test.pdf";
string source_file_path = source_file_dir + "\\" + source_file_name;
string result_file_path = source_file_path.Replace(".pdf", ".xml");

System.Diagnostics.Process p = new System.Diagnostics.Process();
p.StartInfo.UseShellExecute = false;
p.StartInfo.CreateNoWindow = true;
p.StartInfo.WindowStyle = System.Diagnostics.ProcessWindowStyle.Hidden;

p.StartInfo.FileName =@"C:\Program Files\CoolUtils\Total PDF Converter\PDFConverter64.exe"; // Путь к программе
p.StartInfo.Arguments = source_file_path + " " + result_file_path + @" -c XML";
project.Variables["args"].Value = p.StartInfo.Arguments;
p.Start();
p.WaitForExit(99999);
Все работает!

Для идеала бы еще понять, как сделать совсем фоновым этот процесс - а то вылазит окошко с конвертом - бесит :-)
 
  • Спасибо
Реакции: Ilshakin

viktor045

Client
Регистрация
02.09.2018
Сообщения
68
Благодарностей
17
Баллы
8
Удалось ли у вас переводить скан ПДФ в текстовой файл?
 

lockerr

Client
Регистрация
20.08.2019
Сообщения
34
Благодарностей
10
Баллы
8

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)