1 место Универсальный экстрактор™ контента (основной статьи страницы)

Lord_Alfred

Client
Регистрация
09.10.2015
Сообщения
3 916
Благодарностей
3 867
Баллы
113
  • Спасибо
Реакции: GromUA

GromUA

Client
Регистрация
11.04.2011
Сообщения
14
Благодарностей
1
Баллы
3

btr

Client
Регистрация
21.09.2015
Сообщения
71
Благодарностей
15
Баллы
8
подскажите что за ошибка? это при выполнении в зенке, если в консоли запускаю, сьедает всю память и ни чего не парсит (((
 

Вложения

Последнее редактирование:

btr

Client
Регистрация
21.09.2015
Сообщения
71
Благодарностей
15
Баллы
8
в общем с этими версиями запустилось
 

Rampage

Client
Регистрация
14.11.2013
Сообщения
36
Благодарностей
8
Баллы
8
Странно не получается скомпилить, в чем может быть трабл?

 

Lord_Alfred

Client
Регистрация
09.10.2015
Сообщения
3 916
Благодарностей
3 867
Баллы
113

Yablokoed

Client
Регистрация
08.03.2015
Сообщения
134
Благодарностей
2
Баллы
18
Библиотеку обновили, надо править скрипт. Там теперь url.URL используется: https://github.com/go-shiori/go-readability/commit/632cb1e1368c3272dacaf8cfcb96135c7a2826fb
Я не в теме. Подскажите, пожалуйста, если правки по этой ссылке сделать, будет исправно работать экстрактор сейчас?
 

alex_mgn

Client
Регистрация
30.01.2021
Сообщения
48
Благодарностей
18
Баллы
8

alex_mgn

Client
Регистрация
30.01.2021
Сообщения
48
Благодарностей
18
Баллы
8

alex_tal

Client
Регистрация
30.11.2017
Сообщения
47
Благодарностей
5
Баллы
8
В каком месте скрипт править? Я так понимаю в этом файле править нужно readability_cli.go?
И у меня тот же вопрос))
По ссылке там правки во всех файлах, кроме readability_cli.go (
 
Последнее редактирование:

Remart

Client
Регистрация
06.10.2016
Сообщения
52
Благодарностей
10
Баллы
8
У меня ругается на отсутствие exe файла.
 

Вложения

hago73

Client
Регистрация
07.09.2012
Сообщения
59
Благодарностей
21
Баллы
8

sternburg

Client
Регистрация
02.08.2010
Сообщения
58
Благодарностей
1
Баллы
8
Есть кто возьмётся реализовать шаблон с использованием этого экстрактора контента? ПМ плиз
 

radv

Client
Регистрация
11.05.2015
Сообщения
3 788
Благодарностей
1 952
Баллы
113
Есть кто возьмётся реализовать шаблон с использованием этого экстрактора контента? ПМ плиз
Это лучше в рекламном разделе, где поиск исполнителей создать тему. Шансов больше будет получить отклик.
 
  • Спасибо
Реакции: Lord_Alfred

Lord_Alfred

Client
Регистрация
09.10.2015
Сообщения
3 916
Благодарностей
3 867
Баллы
113
Есть кто возьмётся реализовать шаблон с использованием этого экстрактора контента? ПМ плиз
А чем шаблон из стартпоста не устраивает?

Там бага с компилированием самой либы есть, это не шаблоном править надо. У меня руки пока не доходят допилить и выложить исправление.
 
  • Спасибо
Реакции: udder

temass

Client
Регистрация
06.06.2015
Сообщения
98
Благодарностей
3
Баллы
8
Альфред можете сказать, что поправить надо?
 

Lord_Alfred

Client
Регистрация
09.10.2015
Сообщения
3 916
Благодарностей
3 867
Баллы
113

kolobrod

Client
Регистрация
26.11.2014
Сообщения
77
Благодарностей
14
Баллы
8
Кто правил скрипт? Поделитесь для чайников ;-)
 
  • Спасибо
Реакции: dima8121

rewrite008

Client
Регистрация
09.07.2021
Сообщения
54
Благодарностей
29
Баллы
18
Тоже интересно было бы увидеть исправленную версию))
 

dert12

Client
Регистрация
24.11.2017
Сообщения
25
Благодарностей
8
Баллы
8
За пол года так и не пофиксили :(
 

Phoenix78

Client
Read only
Регистрация
06.11.2018
Сообщения
11 790
Благодарностей
5 720
Баллы
113
За пол года так и не пофиксили :(
и не говори....
Скажи же странно, что автор в завершенном конкурсе, открытый шаблон, за бесплатно, не поддерживает и не правит шаблон ? и чем он там вообще занят ? ;-)
 

dert12

Client
Регистрация
24.11.2017
Сообщения
25
Благодарностей
8
Баллы
8
и не говори....
Скажи же странно, что автор в завершенном конкурсе, открытый шаблон, за бесплатно, не поддерживает и не правит шаблон ? и чем он там вообще занят ? ;-)
А где вы там увидели притензии к автору? Ему большое спасибо.
1 место, столько народу - слабо вериться, что никто не смог починить и поделиться.
 

K R

Client
Регистрация
14.01.2017
Сообщения
127
Благодарностей
127
Баллы
43
У меня на днях получилось, но ещё толком не тестировал. И я в Go не понимаю вообще ничего, всё делаете на свой страх и риск )
Попробуйте заменить ваш файл readability_cli.go на этот.
 

Вложения

dert12

Client
Регистрация
24.11.2017
Сообщения
25
Благодарностей
8
Баллы
8
У меня на днях получилось, но ещё толком не тестировал. И я в Go не понимаю вообще ничего, всё делаете на свой страх и риск )
Попробуйте заменить ваш файл readability_cli.go на этот.
Огромное спасибо! Красавчик! :ay: :ay: :ay:
 
  • Спасибо
Реакции: K R

K R

Client
Регистрация
14.01.2017
Сообщения
127
Благодарностей
127
Баллы
43
Огромное спасибо! Красавчик! :ay: :ay: :ay:
Да не за что. Если разберешься с шаблоном, отпишись пожалуйста, можно ли вытянуть статью с html-тегами. Можно без подробностей, просто: есть такая возможность или нет.
 

dert12

Client
Регистрация
24.11.2017
Сообщения
25
Благодарностей
8
Баллы
8
Да не за что. Если разберешься с шаблоном, отпишись пожалуйста, можно ли вытянуть статью с html-тегами. Можно без подробностей, просто: есть такая возможность или нет.
Да, есть.
1) Установить значание 0 в переменую remove_links (удалять ссылки пометка)

2) Нужно в твоем файле заменить строку:
dstTxtFile.WriteString(article.TextContent)
на
dstTxtFile.WriteString(article.Content)
и заново его скомпилировать.

3) В парсере в кубике: fix content закоментировать следующие строки:
content = Regex.Replace(content, @"\s+([!%\),\.:;\?\]\}]+)", "$1");
content = Regex.Replace(content, @"([\.!,\?])([^\s\.!,\?]+)", "$1 $2");


Вроде всё, если что в ветке есть в обсуждениях.
 
  • Спасибо
Реакции: K R
Регистрация
09.02.2022
Сообщения
27
Благодарностей
10
Баллы
3
Какой golang поставили? 1.16?
Здравствуйте, напишите, пожалуйста, мне в ЛС. Есть очень интересное предложение к Вам по разработке шаблона на хороших условиях. Заранее благодарю!
 

Lord_Alfred

Client
Регистрация
09.10.2015
Сообщения
3 916
Благодарностей
3 867
Баллы
113
Здравствуйте, напишите, пожалуйста, мне в ЛС. Есть очень интересное предложение к Вам по разработке шаблона на хороших условиях. Заранее благодарю!
Спасибо, уже устал всем везде отвечать что я никогда ничего не разрабатывал на заказ и не буду этим заниматься :-)
 
  • Спасибо
Реакции: udder
Регистрация
09.02.2022
Сообщения
27
Благодарностей
10
Баллы
3
Понял, благоадрю)
 

udder

Client
Регистрация
28.03.2017
Сообщения
618
Благодарностей
128
Баллы
43
У меня на днях получилось, но ещё толком не тестировал. И я в Go не понимаю вообще ничего, всё делаете на свой страх и риск )
Попробуйте заменить ваш файл readability_cli.go на этот.
Благодарю, заработало..
у меня в папку cache записывался пустой файл, посмотрел экшен и не было ковычек, с ковычками записывает
90643
 
Последнее редактирование:
  • Спасибо
Реакции: K R

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)