Продам A-Parser 1.1 - продвинутый парсер поисковых систем, Suggest, PR, DMOZ, Whois, etc

Сборник рецептов #26: мобильные версии сайтов, список регионов Яндекса и упоминания домена в индексе
26-й сборник рецептов. В нем будут показаны: проверка наличия мобильной версии сайта через Bing, парсинг полного списка регионов Яндекса и способ поиска упоминаний домена в индексе поисковой системы. Также показан пример работы с Node.js модулем mysql2, который позволяет работать с MySQL базами данных. Поехали!

Проверка наличия мобильной версии через Bing
На сегодняшний день наличие мобильной версии является одним из важнейших критериев качества сайта. По данным различных организаций доля мобильного трафика уже давно превышает десктопный. Именно поэтому мобильная версия сайта позволяет увеличить посещаемость сайта, ведь большинство крупных поисковиков отдают предпочтение в выдаче сайтам, имеющим полноценную мобильную версию. Проверить наличие и соответствие стандартам можно с помощью небольшого пресета по ссылке выше.
4bqcm_181023235947.png


Получение полного списка регионов Яндекса
Яндекс не публикует в открытом виде полного списка всех регионов, используемых в поиске. И как оказалось, найти полную и актуальную базу в интернете практически невозможно. Поэтому мы исправляем это и по ссылке выше публикуем JavaScript парсер, который позволяет собрать свежую и максимально полную базу регионов Яндекса.
2of3y_181024152530.png


Проверка упоминаний домена в индексе Гугла
Иногда возникает задача по поиску упоминаний домена в индексе поисковой системы. Именно с такой задачей к нам обратился один из пользователей A-Parser. Поэтому по ссылке выше мы публикуем пресет, решающий данную задачу.
gwr92_181018190314.png


Кроме этого:
Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

1.2.335 - новые парсеры картинок, оптимизации в JS парсерах, общие улучшения работы
1.2.335.png

Улучшения
  • Добавлено 2 новых парсера:
  • Полностью переписаны 2 парсера:
    • se-google-images.png
      SE::Google::Images - добавлены региональные настройки, поддержка рекаптчи, возможность задавать различные фильтры поиска и сбор анкоров, ссылок на страницу, ссылок на превью, а также типов изображений
    • se-yandex-images.png
      SE::Yandex::Images - добавлен сбор ссылок на превью
  • Улучшена работа
    se-aol.png
    SE::AOL, а также увеличено максимальное количество страниц в настройках
  • Улучшена работа
    se-ask.png
    SE::Ask, а также добавлена возможность парсить связанные ключевые слова
  • JS парсеры: оптимизирован вызов конструктора и init()
  • JS парсеры: добавлена поддержка async init()
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена утечка памяти при большом количестве попыток
  • Исправлена ошибка, при которой в Тестовом парсинге при работе с некоторыми ссылками не завершался запрос
  • Исправлен парсинг различных параметров в
    net-whois.png
    Net::Whois
  • Исправлено отображение русского языка (проблема появилась в предыдущей версии)
  • Исправлено зависание при работе
    se-yandex-images.png
    SE::Yandex::Images с антигейтом
  • JS парсеры: исправлена работа check_content
  • JS парсеры: исправлена работа с сессиями (проблема появилась в одной из предыдущих версий)
 

Видео урок: Массовое добавление товаров в OpenCart, часть 2

Это вторая часть из цикла видео уроков о парсинге товаров из стороннего сайта и заливке их на собственный сайт на базе OpenCart через API.
В этом уроке показано:
  • краткое содержание предыдущей части
  • запуск созданного пресета
  • демонстрация результатов работы
Первая часть: Видео урок: Массовое добавление товаров в OpenCart, часть 1
Статья и готовый пресет опубликованы в нашем Каталоге: Работаем с OpenCart. Часть 2. Массовое добавление товаров
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

Сборник статей #6: работа с API, сохранение в YML и мануал по подключению Node.js модулей
Это 6-й сборник статей, и в нем мы разберемся, как подключать к парсеру Node.js модули, научимся сохранять собранные данные в формате YML, а также изучим работу с API на реальном примере с созданием простого приложения. Поехали!
Работаем с API, часть 1
В этой статье на реальном примере будет показана работа с A-Parser через API. В результате будет создано простое приложение, которое будет получать позицию сайта по ключу в Гугл или Яндекс. Все подробности - по ссылке выше.
vnsiw_181209015926.png


Выгрузка товаров для Я.Маркета в формате YML
YML (Yandex Market Language) - это стандарт представления данных, который используется для загрузки/выгрузки информации о товарах в Яндекс.Маркете. Используя А-Парсер, можно спарсить товары с различных сайтов и сохранить их в данном формате для дальнейшего импорта в Маркет. О том, как это сделать, можно почитать в статье по ссылке выше.
A-Parser__screen.jpg


Подключение пакетов Node.js в A-Parser
Как известно, в A-Parser можно использовать Node.js модули для более эффективного парсинга. Поэтому, по ссылке выше мы опубликовали небольшой мануал по их установке и использованию.
rlazs_181224010614.png


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей
 

1.2.387 - улучшенный Просмотр логов, новый парсер Яндекс SafeBrowsing, улучшения в JS парсерах
1.2.387.png

Улучшения
  • Улучшение Просмотра логов:
    • Фильтр по неудачным/выполняющимся задачам
    • Сортировка по времени выполнения
    • Поддержка пагинации и поиска по логам
    • Отображение парсера и запроса
  • Добавлен новый инструмент tools.memory - key/value хранилище в памяти
  • Добавлен новый парсер
    se-yandex-safebrowsing.png
    SE::Yandex::SafeBrowsing, который позволяет проверить сайт в блэклисте Яндекса
  • В
    se-google-trends.png
    SE::Google::Trends реализована возможность сравнивать данные по ключевым словам
  • Улучшения в логике
    shop-amazon.png
    Shop::Amazon
  • Улучшена стабильность JavaScript парсеров (движка v8)
  • JS парсеры: добавлен метод .addElement, который позволяет заполнять массивы в results более удобным способом
  • JS парсеры: добавлена опция resultArraysWithObjects для this.parser.request, которая позволяет возвращать массив объектов в результатах при вызове другого парсера
  • JS парсеры: добавлено кэширование DNS ответов

Исправления в связи с изменениями в выдаче

Исправления
  • Исправлена обработка пустых запросов в JavaScript парсерах
  • Исправлен вывод картинок в лог, проблема появилась в одной из предыдущих версий
  • Исправлена работа с некоторыми видами прокси
  • Исправлена работа опции Stop when found в
    se-yandex-position.png
    SE::Yandex::position
  • В
    se-yandex.png
    SE::Yandex при получении ошибки от антигейта не менялись прокси
  • Исправлен парсинг ссылок на потенциально опасные сайты в
    se-yandex.png
    SE::Yandex
  • JS парсеры: исправлена работа check_content с регулярными выражениями, в которых содержится кириллица
  • JS парсеры: исправлено зависание потоков при использование tls
  • JS парсеры: множественные исправления в работе сокетов
 

Сборник рецептов #29: язык ключевых слов, нормализация запросов и сбор тайтлов в глубину
29-й сборник рецептов, в котором опубликован JS парсер для определения языка ключевых слов, предложен вариант решения для нормализации запросов, а также показано, как парсить карту сайту и одновременно собирать тайтлы страниц. Поехали!

Определение языка ключевого слова через Яндекс Переводчик
В A-Parser есть несколько встроенных парсеров для определения языка страницы. Но иногда возникают задачи отфильтровать список ключевых слов по одному или нескольким языкам. Определять язык текстовой строки довольно неплохо умеют различные переводчики, поэтому для решения задачи был выбран Яндекс Переводчик, и по ссылке выше доступен JavaScript парсер, реализующий определение языка ключевого слова.
fh617_190204133517.png


Нормализатор запросов
При сборе семантического ядра часто возникает вопрос - какая форма запроса является наиболее частотной, например: "купить диван" или "диван купить". Если запрос 3-х или 4-хсловный, то вариантов становится еще больше. Решение такой задачи на базе парсера WordStat доступно в нашем Каталоге по ссылке выше.
hf3qn_190204135540.png


Карта сайта и заголовки
Сбор карты сайта - это довольно простая задача для А-Парсера, которая решается встроенным парсером ссылок. Но иногда, кроме простого сбора ссылок, нужно еще и собрать тайтлы. И это можно делать параллельно с проходом по ссылкам в глубину. Готовый пресет доступен по ссылке выше.
8z4mj_190204140109.png


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

Видео урок: Создание JS парсеров. Использование Node.js модулей
Продолжение цикла уроков по созданию JavaScript парсеров. В этом уроке показано как использовать Node.js модули при написании собственных парсеров.

В уроке рассмотрено:
  • Работа с Node.js и Node package manager (npm)
  • Первый запуск npm, установка модулей (пакетов)
  • Использование модулей при создании JS парсера
  • Ресурсы для работы с npm
Ссылки:
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

Сборник рецептов #30: оценка страниц, форматирование дат и парсинг дропов
30-й сборник рецептов, в котором опубликован пресет для оценки сайтов с помощью open source инструмента Lighthouse, рассмотрен способ форматирования дат в парсере SE::Google::Trends SE::Google::Trends, а также показан способ поиска удаленных доменов. Поехали!

Оценка страниц с использованием Lighthouse
Еще один сервис по оценке сайтов, на этот раз от Google. С его помощью можно оценить веб-страницу по 4-м критериям: Performance, Accessibility, Best Practices и SEO. Пресет доступен в нашем Каталоге по ссылке выше.
gteue_190224203242.png


Форматирование даты в парсере SE::Google::Trends
В A-Parser есть парсер, который позволяет собирать данные из Google Trends. Но даты в этом парсере возвращаются в формате Unixtime, что немного усложняет анализ получаемых данных. По ссылке выше показан простой способ преобразования дат к более удобному виду.
5wsu8_190224205023.png


Парсер expired domains
Пресет для поиска и сбора дропов, а также их характеристик с сайта expireddomains.net. В качестве запросов нужно указывать ключевые слова, которые должны быть в доменном имени.
yplsa_190224210745.png


Еще больше различных рецептов в нашем Каталоге!
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

1.2.434 - множество улучшений и новых возможностей в парсерах, оптимизация работы, поддержка SOCKS4
1.2.434.png

Улучшения
  • В
    se-yandex.png
    SE::Yandex добавлен парсинг значков
  • В
    se-google.png
    SE::Google::Modern добавлена опция Disable autocorrect, которая позволяет отключить автоисправление Гугла и парсить выдачу именно по указанному запросу
  • В
    se-yahoo.png
    SE::Yahoo добавлен выбор страны, языка и Safe Search, обновлен список доменов
  • В
    net-dns.png
    Net:: DNS добавлена возможность выводить записи любого типа
  • В
    rank-majesticseo.png
    Rank::MajesticSEO добавлена проверка контента и поддержка сессий
  • Значительно улучшен
    se-google-suggest.png
    SE::Google::Suggest, добавлены новые возможности
  • В
    se-ixquick.png
    SE::IxQuickдобавлен параметр Family filter, позволяет выбрать уровень фильтрации
  • В
    shop-amazon.png
    Shop::Amazon добавлена возможность парсить количество продавцов для каждого товара
  • Теперь в
    se-yandex.png
    SE::Yandex при получении 404 кода ответа парсер будет повторять попытку, также улучшена проверка контента
  • Теперь в
    rank-semrush.png
    Rank::SEMrush при получении 403 кода ответа прокси будет баниться
  • Добавлена поддержка SOCKS4 прокси
  • Оптимизирована загрузка и сохранение конфига и файлов заданий
  • Улучшена скорость загрузки JS парсеров
  • Уменьшено использование памяти в JS парсерах
  • Улучшение производительности при использовании сокетов в JS парсерах
Исправления в связи с изменениями в выдаче
Исправления
  • В
    se-google.png
    SE::Google::Modern исправлена проблема, при которой запрос считается неудачным при использовании Parse not found
  • Исправлена обработка пустой выдачи в SE::Yandex
  • Исправлена проблема, когда SE:: DuckDuckGo не парсил запросы в которых больше 1 слова
  • JS парсеры: исправлена работа setTimeout на Windows
  • Исправлен ряд ошибок, которые появились в процессе оптимизации парсера
 

Сборник статей #7: сохранение в xlsx, работа с API и обзор методов автоматизации
7-й сборник статей. В нем мы научимся сохранять результаты в виде Excel файлов, продолжим изучение работы через API, а также ознакомимся с 5-ю способами автоматизации последовательного выполнения нескольких заданий. Поехали!

Сохранение результатов в формате Excel (.xlsx)
Вывод результатов в виде xlsx файлов (стандартный формат Excel) - это очень популярный вопрос среди пользователей A-Parser. Ранее такой возможности не было, но с добавлением поддержки Node.js модулей это стало возможным. Поэтому мы публикуем статью, в которой показан реальный пример парсинга с сохранением в Excel. Ознакомиться со всеми подробностями можно по ссылке выше.
nm16w_190317135228.png


Работаем с API, часть 2
Это вторая часть из цикла статей по работе с A-Parser через API. В ней на примере парсинга e-mail будет рассмотрен метод addTask. Все детали - по ссылке выше.
m1jau_190317211446.png


Обзор вариантов последовательного выполнения нескольких заданий
Очень часто возникают задачи, решение которых требует использования возможностей сразу нескольких разных парсеров и при этом результаты работы одного нужно передавать в следующий. А-Парсер - это очень гибкий инструмент, поэтому существует сразу несколько способов, как автоматизировать последовательное выполнение нескольких заданий, при этом максимально автоматизируя работу и повышая производительность. Описание всех возможных методов читайте в обзоре по ссылке выше.

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

Видео урок: Работа с API, часть 2
Вторая часть из цикла уроков о работе с API A-Parser. В видео на реальных примерах показана работа с методами addTask, getTaskState, getTaskConf и getTaskResultsFile.


В этом уроке рассмотрены:
  • методы API для постановки длительных задач, а также для просмотра информации о задании
  • составление JSON для используемых API запросов
  • функция Получить API запрос
  • демонстрация работы с API, используя Postman
Документация по API: User API, взаимодействие с другими программами и скриптами | A-Parser - парсер для профессионалов SEO

Также рекомендуем статью с несколькими интересными кейсами использования A-Parser от руководителя оптимизаторов в «Ашманов и партнёры» Никиты Тарасова: Правильно собрать семантическое ядро для продвижения сайта — SEO на vc.ru

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

1.2.455 - поддержка puppeteer, все методы в Net::HTTP, обновление Bypass Cloudflare
ap+puppeteer.png

Начиная с версии 1.2.455 мы начинаем официальную поддержку Node.JS модуля puppeteer - средства автоматизации работы с браузером Chrome(Chromium), благодаря чему возможен полноценный рендеринг DOM с поддержкой JS. В качестве примера мы выкладываем парсер, который делает скриншоты сайтов в формате PNG, доступен выбор размера скриншота. Chromium может быть запущен как на Windows, так и на Linux серверах без GUI.
Улучшения
  • se-bing-images.png
    SE::Bing::Images полностью переписан, добавлен сбор дополнительных данных, а также в настройках добавлен выбор региона и языка интерфейса
  • В
    net-http.png
    Net::HTTP добавлены все методы в настройки, а также реализована возможность переопределения через заголовок Method
  • Добавлена возможность форматирования всех цифр в интерфейсе
  • JS парсеры: в this.parser.request для override добавлена опция needData, которая определяет передавать или нет в ответе data/pages[], может использоваться для оптимизации
  • JS парсеры: добавлена поддержка модулей url и ws

Исправления в связи с изменениями в выдаче

Исправления
  • Исправлена работа функции Bypass Cloudflare в
    net-http.png
    Net::HTTP
  • Исправлена ошибка, из-за которой при определенных настройках не писался Начальный текст
  • Исправлена работа некоторых socks4 прокси
  • Исправлена ошибка в $tools.base64.encode() при работе с кириллическими символами
  • В
    shop-amazon.png
    Shop::Amazon исправлена ошибка, при которой игнорировался домен
  • JS парсеры: исправлена редкая ошибка в работе сокетов в Node.js
 

Сборник рецептов #31: скидка -50% на XEvil, скриншоты страниц, подсказки Я.Маркета и правописание
31-й сборник рецептов. В нем будет показан способ создания скриншотов веб-страниц, парсинг подсказок Яндекс Маркета, а также проверка правописания в Google. Кроме этого, только до конца апреля доступна возможность купить XEvil со скидкой. Далее обо всем по порядку.

Скидка -50% на покупку XEvil для существующих и новых пользователей A-Parser
Для всех существующих и новых пользователей A-Parser действует скидка на покупку XEvil -50%!
XEvil - это простая, быстрая и удобная программа для полностью автоматического распознавания и обхода подавляющего числа капч и рекапч, без необходимости подключения каких-либо сторонних сервисов. Использование XEvil в связке с A-Parser позволяет значительно удешевить парсинг ресурсов, где необходимо разгадывать капчи/рекапчи, при этом практически не теряя в скорости.
Акция действует до конца апреля. Количество промокодов ограничено, поэтому не упустите возможность воспользоваться скидкой!
Для получения промокода на покупку XEvil пишите в тикеты.
ap+xevil-50.png


JS::Chrome::ScreenshotsMaker
Возможность загружать страницы с полной обработкой всех скриптов, аналогично браузеру - это один из самых популярных фичреквестов для A-Parser. Поэтому буквально недавно была добавлена поддержка Node.js модуля puppeteer, с помощью которого теперь можно получать полностью отрендеренные страницы. И мы публикуем первый пример по работе с ним - парсер для создания скриншотов веб-страниц. Больше информации, пример работы и готовый парсер - все это доступно по ссылке выше.
screenshot_2019-04-08_12.42.06.png


Парсер подсказок Яндекс.Маркет
Еще один парсер подсказок, на этот раз из Яндекс Маркета. Собираются подсказки, их популярность (частота), тип, а также, опционально, категория (включая полный путь родительских категорий). Готовый парсер, как обычно, доступен в нашем Каталоге по ссылке выше.
8kskt_190418110350.png


Проверка правописания в Google
Данный парсер позволяет проверить ключевые слова через поиск Google на предмет опечаток и получить исправленные варианты. Готовый пресет доступен по ссылке выше.
aaih3_190418111655.png


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

Видео урок: Работа с MySQL
Видеоурок по работе с MySQL в A-Parser. В нем на реальном примере показано как работать с базами данных MySQL, используя Node.js модуль mysql2.


В этом уроке рассмотрены:
  • Установка и подключение модулей
  • Некоторые основы языка запросов SQL
  • Создание базы данных MySQL
  • Получение и запись данных в БД, используя JS-парсеры

Полезные ссылки:

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
 

Сборник рецептов #32: Yahoo Answers, контакты фрилансеров и оценка ключевых слов

32-й сборник рецептов, в котором подобраны 3 JS парсера для парсинга Yahoo Answers, оценки ключевых слов и сбора контактных данных фрилансеров.

Парсер Yahoo Answers
Полноценный парсер сервиса Yahoo Answers, который по ключевым словам позволяет собирать непосредственно вопросы, ответы, а также их категории, дату создания и ссылки на страницы обсуждений.
5xq9g_190506181553.png


Парсинг контактов фрилансеров
Парсер, который ищет по ключевым словам фрилансеров и собирает их контакты. Данные собираются с сервиса fl.ru.
f261w_190508215538.png


Анализ ключевых слов
Парсер для сервиса seranking.com. Кейворды оцениваются по 4-м показателям: частотность, стоимость клика (CPC), стоимость трафика и KEI. Также есть возможность собирать похожие, релевантные и подсказки к начальному запросу вместе с их показателями.
3znul_190508144508.png


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
 

1.2.484 - 4 новых парсера, улучшение работы и исправление существующих
1.2.484.png

Улучшения
  • Новые парсеры:
    • maps-google.png
      Maps::Google - по ключевым словам собирает различные данные об организациях в заданных координатах
    • maps-yandex.png
      Maps::Yandex - по ключевым словам собирает различные данные об организациях в заданных координатах
    • rank-bukvarix-domain.png
      Rank::Bukvarix:: Domain - сбор ключевых слов по домену
    • rank-bukvarix-domain.png
      Rank::Bukvarix::Keyword - сбор ключевых слов по домену
  • Удалены 4 неактуальных парсера: Rank::SEMrush::Keyword, SE::QIP, SE::QIP::position, Rank::MegaIndex
  • Улучшена работа
    se-aol.png
    SE::AOL
  • JS парсеры: для this.request добавлена опция data_as_buffer, которая определяет возвращать data как строку(String) или объект Buffer

Исправления в связи с изменениями в выдаче
  • В
    se-google.png
    SE::Google::Modern исправлена работа с рекаптчами, исправлен парсинг сниппетов, а также исправлен парсинг мобильной выдачи
  • rank-semrush.png
    Rank::SEMrush полностью переписан, также полностью изменился список собираемых данных, парсер возвращает только те данные, которые доступны без авторизации
  • Полностью переписан
    rank-alexa.png
    Rank::Alexa
  • Исправлена работа
    rank-majesticseo.png
    Rank::MajesticSEO, теперь обязательно требуется установка Node.js и модуля brotli
  • В
    rank-social-signal.png
    Rank::Social::Signal удалена переменная $facebook_share в связи с прекращением поддержки со стороны FB
  • se-ixquick.png
    SE::IxQuick,
    shop-aliexpress.png
    Shop::AliExpress,
    se-duckduckgo-images.png
    SE:: DuckDuckGo::Images ,
    shop-amazon.png
    Shop::Amazon,
    check-roskomnadzor.png
    Check::RosKomNadzor

Исправления
  • Исправлена работа с запросами, содержащими пробел в
    se-duckduckgo.png
    SE:: DuckDuckGo
  • Исправлена проблема с декомпресией данных на некоторых сайтах
  • JS парсеры: исправлена работа setImmediate
 

Видео урок: Получение уведомлений в Telegram об окончании срока регистрации доменов
В этом видеоуроке будет показано, как настроить периодическую проверку окончания срока регистрации доменов, и получать уведомления в телеграм, если он меньше заданного количества дней.
В уроке рассмотрено:
  • использование tools.js для написания собственных функций
  • работа с шаблонизатором Template Toolkit
  • проверка доменов через WHOIS
  • цепочки заданий
  • отправка сообщений в Telegram с помощью бота
Полезные ссылки:
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

 

1.2.503 - обновление JavaScript движка и множество улучшений
1.2.503.png

Улучшения
  • Движок v8 обновлен до версии 7.5, помимо увеличения скорости есть множество улучшений в поддержке новых возможностей языка JavaScript
  • В
    se-yandex.png
    SE::Yandex в массив $ads добавлена переменная $visiblelink, в которой содержится видимая ссылка
  • В
    rank-bukvarix-domain.png
    Rank::Bukvarix:: Domain добавлена переменная $totalcount которая содержит количество результатов
  • В
    se-yahoo.png
    SE::Yahoo добавлена опция Not found is error, указывающая, считать ли отсутствие результатов ошибкой

Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена редкая проблема с ошибками в JS парсерах на Windows
  • В
    se-baidu.png
    SE::Baidu исправлена работа функции Get full links для результатов без ссылок
  • Исправлена проблема с Decode JSON error в парсерах WordStat
  • Исправлен баг с перезагрузкой кода JS парсера при редактировании в сторонних приложениях, проблема возникла в одной из предыдущих версий
 

Сборник рецептов #33: парсинг Google карт, сбор вопросов из поиска, перевод текстов целиком
33-й сборник рецептов, в котором мы будем собирать данные из Google maps в указанной местности, спарсим блок вопросов и ответов в поиске Гугла и научимся использовать файлы целиком в качестве запросов. Поехали!

Сбор всех организаций в определенной местности
Начиная с версии 1.2.482 в A-Parser появились парсеры карт Google и Яндекс. Принцип работы обоих одинаков - в настройках указываются координаты точки и зум, парсер собирает результаты поиска по ключевым словам в этой точке и области вокруг нее, ограниченной зумом. Но если стоит задача собрать данные, например, со всего города, то для ее решения нужно указывать диапазон координат и "заставить" парсер пройтись по ним. Как это сделать, а также пример пресета - все это показано по ссылке выше.
b8o1c_190619122130.png


Парсер собирающий вопросы и ответы из выдачи Google
Google по некоторым запросам показывает в поисковой выдаче блок вопросов и ответов People also ask (Похожие запросы). Наши пользователи периодически интересуются, как можно парсить этот блок, получая отдельно вопросы и ответы на них. Поэтому мы публикуем в нашем каталоге пример такого парсера, а забрать его можно по ссылке выше.
o5ugn_190620111544.png


Использование файлов целиком в качестве запросов
Общеизвестно, что в А-Парсере каждая строка в исходном файле - это отдельный запрос. Но существуют задачи, когда необходимо использовать все содержимое файла как один запрос, игнорируя разбивку на строки. Благодаря JavaScript парсерам такая возможность есть и по ссылке выше опубликован пример парсера, который получает все содержимое файла, переводит его на заданный язык и сохраняет в новый файл.
9wqxu_190619152424.png


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

 

Назад
Сверху