- Регистрация
- 09.10.2015
- Сообщения
- 3 916
- Благодарностей
- 3 867
- Баллы
- 113
Запоздалое, но спасибо за исправление У меня и вправду не было времени вникать и исправлять этот код, т.к. я тоже в golang не особо разбираюсь)У меня на днях получилось, но ещё толком не тестировал. И я в Go не понимаю вообще ничего, всё делаете на свой страх и риск )
Попробуйте заменить ваш файл readability_cli.go на этот.
Такая возможность заложена в самой библиотеке, в шаблоне, конечно, потом тоже нужно отключить удаление ссылок и всё остальное связанное, но для получения именно нужного HTML – достаточно в readability_cli.go найти:Да не за что. Если разберешься с шаблоном, отпишись пожалуйста, можно ли вытянуть статью с html-тегами. Можно без подробностей, просто: есть такая возможность или нет.
C#:
dstTxtFile.WriteString(article.TextContent)
C#:
dstTxtFile.WriteString(article.Content)
UPD (Очень важно): cтоит учесть, что в исправленном коде вы 2 раза делаете запрос для получения контента. Вначале в зенке парсится контент, а потом в readability_cli.go делается запрос ещё раз. Скорее всего правильнее использовать
readability.FromReader
. Кому это критично - лучше исправьте у себя