A-Parser - продвинутый парсер поисковых систем, WordStat, YouTube, Suggest, PR, etc

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
1.2.292 - новый парсер Яндекс ИКС, улучшения в работе с кодировками, оптимизации встроенных парсеров

Улучшения
  • Добавлен парсер
    SE::Yandex::SQI - парсер Индекса качества сайта (Яндекс ИКС)
  • Оптимизирована работа Очереди заданий
  • Добавлена поддержка множества экзотических кодировок китайского языка
  • Добавлена опция Save as UTF-8 with BOM, которая решает проблему определения кодировки при открытии сформированного CSV в Excel
  • SE::Youtube полностью переписан с использованием современного юзерагента
  • SE::AOL::Suggest оптимизирован и переписан на JavaScript
  • Улучшена работа
    SE::Google,
    SE::Google::Modern,
    Rank::MajesticSEO,
    SE::Bing,
    Shop::Amazon
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена работа
    Net::Whois для некоторых доменных зон
  • Исправлена ошибка, при которой не импортировался пресет, если не установлены модули, используемые в нем
  • Исправлена кодировка при использовании fs.readdirSync в JS парсерах
 

unterwerde

Client
Регистрация
17.07.2014
Сообщения
3
Благодарностей
2
Баллы
3
Ох, спасибо, что a-parser есть.
Раньше было лучшее решение на рынке по парсингу, теперь еще и очень достойный сервис.
Мне для срочного обновления планов очередного финансового года потребовались данные, а парсер лёг как назло. Обратился в платный support и ребята там выручили, собрали данные (их реально не много требовалось).
Респектую. Пользуемся дальше :-)
 

chazzzzz

Client
Регистрация
08.07.2017
Сообщения
63
Благодарностей
9
Баллы
8
Брал в первую очередь для парсинга поисковиков. Нужно было спарсить сниппетов с 3 поисковиков для 700к ключей, сначала писал шаблон на зенке, потом понял что при таких объемах собирать буду долго, поэтому взял а-парсер. За пару дней все было готово и это далеко не предел.
Далее уже дорабатываю зенкой.
Особенно хочу отметить возможность вывода результатов почти в любом виде, в чем он сильно опережает своего западного конкурента. Рекомендую!
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Сборник статей #5: собственный канал в Telegram и массовое добавление товаров в OpenCart
В 5-м сборнике статей на реальном примере будет показано, как создать свой канал в Телеграме и полностью автоматизировать его наполнение контентом. Также мы продолжаем цикл статей по работе с OpenCart и во 2-й части будет рассмотрен вопрос массового добавления товаров. Как обычно, в каждой статье приложены готовые JS парсеры, используя которые, можно на реальных примерах изучить описанные методы и поэксперементировать с ними. Поехали!

Полноценный Telegram канал на базе A-Parser
В этой статье будет описан способ создания полноценного канала в Telegram c автоматизированным сбором контента и постингом сообщений через заданные интервалы. И конечно, все это на базе A-Parser. Все подробности, а также готовые пресеты - по ссылке выше.


Работаем с OpenCart. Часть 2. Массовое добавление товаров
Мы продолжаем цикл статей о заливке товаров в интернет-магазин на базе OpenCart. Во второй части будет рассмотрено массовое добавление товара. Подробности, а также пример готового парсера - по ссылке выше.


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :-) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей
 

creck

Client
Регистрация
05.08.2014
Сообщения
94
Благодарностей
9
Баллы
8
Работаю с А парсером уже очень долго, в основном для баз. То что базы лупит как дурной, тут нечего и писать. Честно, я в восторге от такой скорости и качества ))). Еще хочу сказать огромное спасибо, за то что на форуме, ввели платные услуги от официальной поддержки. Кто еще не знает что это такое, объясню. В php, js я не разбираюсь. Вчера мне нужно было решить один момент, с парсером, авторизации на одном сайте. Тут без js не обойтись. Сначала искал кодеров, и написал в поддержку, не делаю ли они парсеры под заказ. К удивлению, да, делают и цена этого всего 5-10 баксов. Понятно что многое зависит от сложности, ног ребята, какой кодер хочет писать за такие деньги! Если бы я знал что такая услуга есть на форуме официально, через поддержку, а не других кодеров, уже бы давно, и быстрей решил бы многие вопросы. В общем огромное спасибо, действительно за шикарный продукт, и хорошую поддержку.

PS: Администрация zennolab.com сделайте такую услугу и тут на форуме! Реально, очень нужное решение с официальным, платным написание шаблонов, кодов и тд
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Видео урок: Массовое добавление товаров в OpenCart
Данный парсер является примером для разработки парсера работающего с OpenCart. Решение демонстрирует возможность сбора данных о товарах из стороннего сайта и заливку их на собственный сайт на базе OpenCart через API.

В этом уроке рассмотрены:
  • парсинг товаров из интернет-магазина
  • авторизация в OpenCart
  • работа с API OpenCart для публикации товаров

Статья и готовый пресет опубликованы в нашем Каталоге: https://a-parser.com/resources/302/

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
1.2.319 - новый парсер подсказок Youtube, поддержка модуля MySQL2, множество улучшений и оптимизаций

Улучшения
  • Добавлен новый парсер
    SE::Youtube::Suggest
  • Добавлена совместимость с модулем mysql2 в JavaScript парсерах
  • В
    Util::ReCaptcha2 добавлена поддержка сервиса R.I.P.captcha
  • В
    SE::Bing::Suggest добавлена возможность выбора страны
  • Уменьшено потребление оперативной памяти, а также оптимизирована начальная загрузка, интерфейс теперь открывается быстрее
  • База регионов в
    SE::Yandex обновлена и значительно увеличена
  • Для всех стандартных парсеров, кроме тех, которые работают на основе
    Net::HTTP, из настроек убраны Max body size и Use gzip
  • Улучшен
    Shop::Amazon
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена работа с прокси при получении каптчи в
    SE::Yandex::Register
  • В очень редких случаях в
    SE::Yandex могла возникать ошибка Content mismatch
  • Исправлен
    Net::Whois при работе с .eu доменами
 

extruder

Client
Регистрация
10.12.2015
Сообщения
54
Благодарностей
3
Баллы
8
Отличный инструмент для повседневной работы вебмастера! Много парсеров, много разных задач можно решить. Обычно разработчики софта не обновляют свои продукты годами, а в A-parser постоянно добавляются и добавляются новые модули. Очень серьезный и надежный продукт.
У меня много софта было куплено и положено на полку. )) Но в случае с A-parser это не так. Постоянно возникают новые задачи, которые пытаешься решить своими силами, но, заглянув в обновления а-парсера, часто обнаруживаешь, что уже все готово, бери и пользуйся!
Более того, благодаря регулярным обновлениям а-парсера, расширяется список профессий, которые могут его использовать. Если раньше это были в основном вебмастера и дорвейщики, то теперь это и веб-аналитики, и арбитражники, и копирайтеры. Более того, знакомый журналист собирает материал для своих публикаций именно при помощи а-парсера. )) Говорит, что с утра, прийдя на работу, за десять минут, пока пьешь кофе, можно собрать больше информации, чем за полдня мониторинга рунета.
Так держать, и не прекращать работы над новыми модулями. Кстати, у вас есть канал в телеграме, чтобы выкладывали информацию о новых модулях?
 
  • Спасибо
Реакции: Forbidden

Forbidden

Новичок
Регистрация
21.01.2013
Сообщения
20
Благодарностей
10
Баллы
3
  • Спасибо
Реакции: Andrew Shell

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Видео урок: Полноценный Telegram канал на базе A-Parser
Это видео демонстрирует возможность создания полноценного Telegram канала на базе A-Parser. Парсер периодически и без вмешательства пользователя будет собирать контент и публиковать его на канале.
В уроке рассмотрены:
  • Регистрация и настройка канала в Телеграм.
  • Последовательное выполнение нескольких заданий.
  • Сохранение промежуточных данных в базу SQLite с последующим чтением.
  • Настройка пресета для постинга сообщений в Telegram-канал.
Статья с подробным описанием процесса создания: https://a-parser.com/resources/300/
Ссылки на готовые пресеты:
https://a-parser.com/resources/38/
https://a-parser.com/resources/298/
https://a-parser.com/resources/299/
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 
  • Спасибо
Реакции: Andrew Shell

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Сборник рецептов #26: мобильные версии сайтов, список регионов Яндекса и упоминания домена в индексе
26-й сборник рецептов. В нем будут показаны: проверка наличия мобильной версии сайта через Bing, парсинг полного списка регионов Яндекса и способ поиска упоминаний домена в индексе поисковой системы. Также показан пример работы с Node.js модулем mysql2, который позволяет работать с MySQL базами данных. Поехали!

Проверка наличия мобильной версии через Bing
На сегодняшний день наличие мобильной версии является одним из важнейших критериев качества сайта. По данным различных организаций доля мобильного трафика уже давно превышает десктопный. Именно поэтому мобильная версия сайта позволяет увеличить посещаемость сайта, ведь большинство крупных поисковиков отдают предпочтение в выдаче сайтам, имеющим полноценную мобильную версию. Проверить наличие и соответствие стандартам можно с помощью небольшого пресета по ссылке выше.


Получение полного списка регионов Яндекса
Яндекс не публикует в открытом виде полного списка всех регионов, используемых в поиске. И как оказалось, найти полную и актуальную базу в интернете практически невозможно. Поэтому мы исправляем это и по ссылке выше публикуем JavaScript парсер, который позволяет собрать свежую и максимально полную базу регионов Яндекса.


Проверка упоминаний домена в индексе Гугла
Иногда возникает задача по поиску упоминаний домена в индексе поисковой системы. Именно с такой задачей к нам обратился один из пользователей A-Parser. Поэтому по ссылке выше мы публикуем пресет, решающий данную задачу.


Кроме этого:
Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
1.2.335 - новые парсеры картинок, оптимизации в JS парсерах, общие улучшения работы

Улучшения
  • Добавлено 2 новых парсера:
  • Полностью переписаны 2 парсера:
    • SE::Google::Images - добавлены региональные настройки, поддержка рекаптчи, возможность задавать различные фильтры поиска и сбор анкоров, ссылок на страницу, ссылок на превью, а также типов изображений
    • SE::Yandex::Images - добавлен сбор ссылок на превью
  • Улучшена работа
    SE::AOL, а также увеличено максимальное количество страниц в настройках
  • Улучшена работа
    SE::Ask, а также добавлена возможность парсить связанные ключевые слова
  • JS парсеры: оптимизирован вызов конструктора и init()
  • JS парсеры: добавлена поддержка async init()
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена утечка памяти при большом количестве попыток
  • Исправлена ошибка, при которой в Тестовом парсинге при работе с некоторыми ссылками не завершался запрос
  • Исправлен парсинг различных параметров в
    Net::Whois
  • Исправлено отображение русского языка (проблема появилась в предыдущей версии)
  • Исправлено зависание при работе
    SE::Yandex::Images с антигейтом
  • JS парсеры: исправлена работа check_content
  • JS парсеры: исправлена работа с сессиями (проблема появилась в одной из предыдущих версий)
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Видео урок: Массовое добавление товаров в OpenCart, часть 2

Это вторая часть из цикла видео уроков о парсинге товаров из стороннего сайта и заливке их на собственный сайт на базе OpenCart через API.


В этом уроке показано:
  • краткое содержание предыдущей части
  • запуск созданного пресета
  • демонстрация результатов работы
Первая часть: https://a-parser.com/threads/4798/
Статья и готовый пресет опубликованы в нашем Каталоге: https://a-parser.com/resources/302/
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Видео урок: Разбираем методы для работы с API используя Postman
В данном видео будет сделан краткий обзор некоторых методов API.
В этом уроке рассмотрены:
  • обзор методов
  • составление JSON для методов ping,info и oneRequest
  • работа с API используя Postman
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
1.2.360 - поддержка https/tls в Node.js модулях, парсинг мобильной выдачи Яндекса, 2 новых парсера

уходящем году одним из приоритетных направлений стало развитие JavaScript парсеров и функционала по работе с Node.js. Одним из финальных этапов стал данный релиз, в котором была реализована долгожданная поддержка https/tls в Node.js модулях. Также усилия были сосредоточены на повышении стабильности и производительности. В результате этого было сделано множество наработок, которые уже в первой половине 2019 года планируется выпустить в виде нового A-Parser 2.0, где будет много новых и крутых возможностей.
Команда A-Parser поздравляет всех с Новым годом и Рождеством! Мы желаем вам успехов в делах, прибыльных проектов и ярких идей. Пускай Новый 2019 год будет годом новых возможностей, все задуманное сбывается, а работа приносит удовольствие!
Спасибо что Вы с нами!!!
В новогоднем релизе, кроме снеговика:-), было сделано следующее:
Улучшения

  • Добавлена поддержка https/tls в Node.js модулях, что позволяет использовать все модули, которые работают с API по https, а также по TLSSocket (smtp и т.п.)
  • Полностью переписан и обновлен
    SE::Yandex, добавлена возможность парсить мобильную выдачу, а также значительно увеличена производительность
  • Добавлен парсер позиций в Bing:
    SE::Bing::Position
  • Добавлен парсер
    Util::YandexRecognize, позволяющий разгадывать каптчи без использования сторонних сервисов
  • Улучшен сбор почт в
    HTML::EmailExtractor
  • Улучшена работа опции Dynamic threads limit
  • В
    SE::Yandex использование прокси для загрузки картинки каптчи теперь определяется параметром Use proxy парсера Яндекса
  • В связи с неактуальностью удалены
    SE::Bing::AddURL,
    Rank::OpenSiteExplorer и
    Rank::OpenSiteExplorer::Extended
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлен Safe search в
    SE:: DuckDuckGo::Images
  • Исправлены падения при работе с
    SE:: DuckDuckGo::Images
  • Исправлена ошибка при работе с модулем mysql2 версии более 1.5.3
  • Исправлен парсинг количества результатов в
    SE::Yandex
 

Greenya

Client
Регистрация
01.04.2018
Сообщения
11
Благодарностей
5
Баллы
3
Доброго времени суток, подскажите пожалуйста, по расходникам, что нужно при работе с Вашим парсером?
 

Шива

Client
Регистрация
05.02.2018
Сообщения
1 088
Благодарностей
341
Баллы
83

Greenya

Client
Регистрация
01.04.2018
Сообщения
11
Благодарностей
5
Баллы
3

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Сборник статей #6: работа с API, сохранение в YML и мануал по подключению Node.js модулей
Это 6-й сборник статей, и в нем мы разберемся, как подключать к парсеру Node.js модули, научимся сохранять собранные данные в формате YML, а также изучим работу с API на реальном примере с созданием простого приложения. Поехали!
Работаем с API, часть 1
В этой статье на реальном примере будет показана работа с A-Parser через API. В результате будет создано простое приложение, которое будет получать позицию сайта по ключу в Гугл или Яндекс. Все подробности - по ссылке выше.


Выгрузка товаров для Я.Маркета в формате YML
YML (Yandex Market Language) - это стандарт представления данных, который используется для загрузки/выгрузки информации о товарах в Яндекс.Маркете. Используя А-Парсер, можно спарсить товары с различных сайтов и сохранить их в данном формате для дальнейшего импорта в Маркет. О том, как это сделать, можно почитать в статье по ссылке выше.


Подключение пакетов Node.js в A-Parser
Как известно, в A-Parser можно использовать Node.js модули для более эффективного парсинга. Поэтому, по ссылке выше мы опубликовали небольшой мануал по их установке и использованию.


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :-) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей
 

extruder

Client
Регистрация
10.12.2015
Сообщения
54
Благодарностей
3
Баллы
8
Неделю назад парсил один источник, и вдруг он стал отдавать 403. Сперва подумал - прокси забанились. Но через те же прокси в броузере нормально захожу. Обратился в суппорт, два дня разбирались, а на третий день выпустили новый релиз с исправлением этого бага. )) Редкий случай с некоторыми прокси и некоторыми источниками парсинга, и вот так быстро исправили, респект. Команда работает быстро и качественно, софт у них просто выше всяких похвал.
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Сборник рецептов #28: скидки в Google Play, автоматизация парсинга WordStat и типы Яндекс подсказок
28-й сборник рецептов. В нем будет показан способ автоматизации парсинга данных из Wordstat, пример парсинга информации о приложениях со скидками в Google Play, а также готовое решение для сбора подсказок из Яндекс вместе с их типами. Поехали!

Парсинг приложений со скидками в Google Play
Периодически в Google Play разработчики предлагают скидки на приложения, иногда на короткий срок платные становятся полностью бесплатными. С помощью A-Parser можно искать подобные предложения. Кроме этого, в этом парсере собирается множество дополнительных данных и используется сохранение в sqlite базу данных, поэтому его можно рассматривать как еще один пример работы с базами данных в А-Парсере. Готовое решение доступно в каталоге по ссылке выше.


Парсер поисковых подсказок Яндекс
В A-Parser есть стандартный парсер Яндекс подсказок, который по заданным ключевым словам собирает подсказки. Но Яндекс классифицирует подсказки по различным типам, которые в свою очередь позволяют использовать их более рационально, применяя соответствующие фильтры. Стандартный парсер подсказок не возвращает типы, поэтому по ссылке выше опубликован JS парсер для сбора подсказок вместе с их типами.


Автоматизация парсинга Wordstat
В этом парсере реализован автоматический сбор данных из WordStat. При этом, парсер проверяет наличие необходимых для данной задачи аккаунтов, и если требуется - то автоматически регистрирует их. Такое решение может быть полезно для организации периодического парсинга WordStat в автоматическом режиме. Готовое решение - по ссылке выше.


Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
1.2.387 - улучшенный Просмотр логов, новый парсер Яндекс SafeBrowsing, улучшения в JS парсерах

Улучшения
  • Улучшение Просмотра логов:
    • Фильтр по неудачным/выполняющимся задачам
    • Сортировка по времени выполнения
    • Поддержка пагинации и поиска по логам
    • Отображение парсера и запроса
  • Добавлен новый инструмент tools.memory - key/value хранилище в памяти
  • Добавлен новый парсер
    SE::Yandex::SafeBrowsing, который позволяет проверить сайт в блэклисте Яндекса
  • В
    SE::Google::Trends реализована возможность сравнивать данные по ключевым словам
  • Улучшения в логике
    Shop::Amazon
  • Улучшена стабильность JavaScript парсеров (движка v8-)
  • JS парсеры: добавлен метод .addElement, который позволяет заполнять массивы в results более удобным способом
  • JS парсеры: добавлена опция resultArraysWithObjects для this.parser.request, которая позволяет возвращать массив объектов в результатах при вызове другого парсера
  • JS парсеры: добавлено кэширование DNS ответов

Исправления в связи с изменениями в выдаче

Исправления
  • Исправлена обработка пустых запросов в JavaScript парсерах
  • Исправлен вывод картинок в лог, проблема появилась в одной из предыдущих версий
  • Исправлена работа с некоторыми видами прокси
  • Исправлена работа опции Stop when found в
    SE::Yandex::Position
  • В
    SE::Yandex при получении ошибки от антигейта не менялись прокси
  • Исправлен парсинг ссылок на потенциально опасные сайты в
    SE::Yandex
  • JS парсеры: исправлена работа check_content с регулярными выражениями, в которых содержится кириллица
  • JS парсеры: исправлено зависание потоков при использование tls
  • JS парсеры: множественные исправления в работе сокетов
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Сборник рецептов #29: язык ключевых слов, нормализация запросов и сбор тайтлов в глубину
29-й сборник рецептов, в котором опубликован JS парсер для определения языка ключевых слов, предложен вариант решения для нормализации запросов, а также показано, как парсить карту сайту и одновременно собирать тайтлы страниц. Поехали!

Определение языка ключевого слова через Яндекс Переводчик
В A-Parser есть несколько встроенных парсеров для определения языка страницы. Но иногда возникают задачи отфильтровать список ключевых слов по одному или нескольким языкам. Определять язык текстовой строки довольно неплохо умеют различные переводчики, поэтому для решения задачи был выбран Яндекс Переводчик, и по ссылке выше доступен JavaScript парсер, реализующий определение языка ключевого слова.


Нормализатор запросов
При сборе семантического ядра часто возникает вопрос - какая форма запроса является наиболее частотной, например: "купить диван" или "диван купить". Если запрос 3-х или 4-хсловный, то вариантов становится еще больше. Решение такой задачи на базе парсера WordStat доступно в нашем Каталоге по ссылке выше.


Карта сайта и заголовки
Сбор карты сайта - это довольно простая задача для А-Парсера, которая решается встроенным парсером ссылок. Но иногда, кроме простого сбора ссылок, нужно еще и собрать тайтлы. И это можно делать параллельно с проходом по ссылкам в глубину. Готовый пресет доступен по ссылке выше.


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Видео урок: Создание JS парсеров. Использование Node.js модулей
Продолжение цикла уроков по созданию JavaScript парсеров. В этом уроке показано как использовать Node.js модули при написании собственных парсеров.
В уроке рассмотрено:
  • Работа с Node.js и Node package manager (npm)
  • Первый запуск npm, установка модулей (пакетов)
  • Использование модулей при создании JS парсера
  • Ресурсы для работы с npm
Ссылки:
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Сборник рецептов #30: оценка страниц, форматирование дат и парсинг дропов
30-й сборник рецептов, в котором опубликован пресет для оценки сайтов с помощью open source инструмента Lighthouse, рассмотрен способ форматирования дат в парсере SE::Google::Trends SE::Google::Trends, а также показан способ поиска удаленных доменов. Поехали!

Оценка страниц с использованием Lighthouse
Еще один сервис по оценке сайтов, на этот раз от Google. С его помощью можно оценить веб-страницу по 4-м критериям: Performance, Accessibility, Best Practices и SEO. Пресет доступен в нашем Каталоге по ссылке выше.


Форматирование даты в парсере SE::Google::Trends
В A-Parser есть парсер, который позволяет собирать данные из Google Trends. Но даты в этом парсере возвращаются в формате Unixtime, что немного усложняет анализ получаемых данных. По ссылке выше показан простой способ преобразования дат к более удобному виду.


Парсер expired domains
Пресет для поиска и сбора дропов, а также их характеристик с сайта expireddomains.net. В качестве запросов нужно указывать ключевые слова, которые должны быть в доменном имени.


Еще больше различных рецептов в нашем Каталоге!
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
1.2.434 - множество улучшений и новых возможностей в парсерах, оптимизация работы, поддержка SOCKS4

Улучшения
  • В
    SE::Yandex добавлен парсинг значков
  • В
    SE::Google::Modern добавлена опция Disable autocorrect, которая позволяет отключить автоисправление Гугла и парсить выдачу именно по указанному запросу
  • В
    SE::Yahoo добавлен выбор страны, языка и Safe Search, обновлен список доменов
  • В
    Net:: DNS добавлена возможность выводить записи любого типа
  • В
    Rank::MajesticSEO добавлена проверка контента и поддержка сессий
  • Значительно улучшен
    SE::Google::Suggest, добавлены новые возможности
  • В
    SE::IxQuickдобавлен параметр Family filter, позволяет выбрать уровень фильтрации
  • В
    Shop::Amazon добавлена возможность парсить количество продавцов для каждого товара
  • Теперь в SE::Yandex при получении 404 кода ответа парсер будет повторять попытку, также улучшена проверка контента
  • Теперь в Rank::SEMrush при получении 403 кода ответа прокси будет баниться
  • Добавлена поддержка SOCKS4 прокси
  • Оптимизирована загрузка и сохранение конфига и файлов заданий
  • Улучшена скорость загрузки JS парсеров
  • Уменьшено использование памяти в JS парсерах
  • Улучшение производительности при использовании сокетов в JS парсерах
Исправления в связи с изменениями в выдаче
Исправления
  • В
    SE::Google::Modern исправлена проблема, при которой запрос считается неудачным при использовании Parse not found
  • Исправлена обработка пустой выдачи в
    SE::Yandex
  • Исправлена проблема, когда
    SE:: DuckDuckGo не парсил запросы в которых больше 1 слова
  • JS парсеры: исправлена работа setTimeout на Windows
  • Исправлен ряд ошибок, которые появились в процессе оптимизации парсера
 

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Сборник статей #7: сохранение в xlsx, работа с API и обзор методов автоматизации
7-й сборник статей. В нем мы научимся сохранять результаты в виде Excel файлов, продолжим изучение работы через API, а также ознакомимся с 5-ю способами автоматизации последовательного выполнения нескольких заданий. Поехали!

Сохранение результатов в формате Excel (.xlsx)
Вывод результатов в виде xlsx файлов (стандартный формат Excel) - это очень популярный вопрос среди пользователей A-Parser. Ранее такой возможности не было, но с добавлением поддержки Node.js модулей это стало возможным. Поэтому мы публикуем статью, в которой показан реальный пример парсинга с сохранением в Excel. Ознакомиться со всеми подробностями можно по ссылке выше.


Работаем с API, часть 2
Это вторая часть из цикла статей по работе с A-Parser через API. В ней на примере парсинга e-mail будет рассмотрен метод addTask. Все детали - по ссылке выше.


Обзор вариантов последовательного выполнения нескольких заданий
Очень часто возникают задачи, решение которых требует использования возможностей сразу нескольких разных парсеров и при этом результаты работы одного нужно передавать в следующий. А-Парсер - это очень гибкий инструмент, поэтому существует сразу несколько способов, как автоматизировать последовательное выполнение нескольких заданий, при этом максимально автоматизируя работу и повышая производительность. Описание всех возможных методов читайте в обзоре по ссылке выше.

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :-) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 
  • Спасибо
Реакции: Juniorcpa

Juniorcpa

Client
Регистрация
27.05.2014
Сообщения
2 031
Благодарностей
1 286
Баллы
113
Потестировал встроенные парсеры - работает довольно шустро. Полноценно к работе и изучению еще не приступал, но то что есть "из коробки" - уже впечатляет.
Демка доступна прям у них на сайте, если что, прикольно сделано :-)
 
  • Спасибо
Реакции: A-Parser Support

A-Parser Support

Активный пользователь
Регистрация
03.06.2013
Сообщения
314
Благодарностей
30
Баллы
28
Видео урок: Работа с API, часть 2
Вторая часть из цикла уроков о работе с API A-Parser. В видео на реальных примерах показана работа с методами addTask, getTaskState, getTaskConf и getTaskResultsFile.


В этом уроке рассмотрены:
  • методы API для постановки длительных задач, а также для просмотра информации о задании
  • составление JSON для используемых API запросов
  • функция Получить API запрос
  • демонстрация работы с API, используя Postman
Документация по API: https://a-parser.com/wiki/user-api/

Также рекомендуем статью с несколькими интересными кейсами использования A-Parser от руководителя оптимизаторов в «Ашманов и партнёры» Никиты Тарасова: https://vc.ru/seo/61162-pravilno-sobrat-semanticheskoe-yadro-dlya-prodvizheniya-sayta

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)