Помогите с ПДФ файлом

russya

Client
Регистрация
08.07.2014
Сообщения
743
Благодарностей
78
Баллы
28
Всем привет! Помогите с пдф. Есть вот такая страница http://joxi.ru/Vm67jWnt4yw1o2
Мне нужно с нее взять Вин номер. Не пойму как это сделать. Думал скачать файл и преобразовать в текст. Но не выходит. Может кто-то подкинет идею
 

Phoenix78

Client
Read only
Регистрация
06.11.2018
Сообщения
11 790
Благодарностей
5 720
Баллы
113
PDF очень часто это обычные скриншоты. конечно есть и в виде текста... по разному в общем.
если там текст, то на форуме выкладывали способы чтения таких PDF
 
  • Спасибо
Реакции: russya

Zedx

Client
Регистрация
12.06.2018
Сообщения
1 346
Благодарностей
910
Баллы
113
Всем привет! Помогите с пдф. Есть вот такая страница http://joxi.ru/Vm67jWnt4yw1o2
Мне нужно с нее взять Вин номер. Не пойму как это сделать. Думал скачать файл и преобразовать в текст. Но не выходит. Может кто-то подкинет идею
Только использовать сторонние библиотеки. Я делал реализацию с помощью библиотеки iText
 

viol2021

Client
Регистрация
12.01.2021
Сообщения
482
Благодарностей
180
Баллы
43
Всем привет! Помогите с пдф. Есть вот такая страница http://joxi.ru/Vm67jWnt4yw1o2
Мне нужно с нее взять Вин номер. Не пойму как это сделать. Думал скачать файл и преобразовать в текст. Но не выходит. Может кто-то подкинет идею
Это картинка
 

backoff

Client
Регистрация
20.04.2015
Сообщения
6 052
Благодарностей
6 481
Баллы
113

Ilshakin

Client
Регистрация
14.02.2017
Сообщения
639
Благодарностей
581
Баллы
93
если картинка - то скринить и использовать imageToTex
если НЕ картинка - самое банальное решение - выделить нужный участок текста и просто скопировать его....
небольшой набросок, с координатами для выделения нужного текста:

C#:
instance.SetWindowSize(800, 600);
Tab tab = instance.ActiveTab;

tab.Navigate("https://www.reestr-zalogov.ru/assets/data/sig_manual_public.pdf", "");
tab.WaitDownloading();
Thread.Sleep(5000);

// Выдергиваем из буфера
lock (CommonCode.buffer)
{
    try {
            // Выделяем мышью по координатам
            tab.FullEmulationMouseMove(380, 315);
            tab.FullEmulationMouseClick("left", "down");
            tab.FullEmulationMouseMove(638, 385);
          
            // Копируем
            instance.ActiveTab.KeyEvent("c", "press", "ctrl");
      
            object a = System.Windows.Forms.Clipboard.GetText();
      
            if ( string.IsNullOrEmpty(a.ToString()) )
                throw new Exception("Не удалось скопировать текст с pdf страницы !");
          
            project.Variables["res"].Value = a.ToString();
        }
  
    finally { System.Windows.Forms.Clipboard.Clear(); }  
}
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)