Парсинг позиций Google с помощью xmlriver

    TimWeber 06 МАЯ 2019 Г., 16:21 #ОШИБКА

    Добрый день!

    Встретился с постоянной проблемой парсинга выдачи Google через сервис xmlriver.

    Текст ошибки "Ошибка парсина"

    При этом даже с помощью хромиум невозможно проверить позицию вручную. Программа долго думает (минуты 2-3) а потом пишет "Невозможно отобразить контент т.к. он имеет другой формат. Это сообщение не является ошибкой!".

    Версия программы 3.9.4

    При этом запросы всегда разные и с разной частотностью от 1 до 200 запросов в месяц.

    И вообще хромиум в версии 3 очень тормозной!!!

    Прямо беда.

    • how_to_reg
    paveldvlip 06 МАЯ 2019 Г., 20:04

    Хромиум здесь совершенно не при чем. Он запускается только после того как страница будет получена.

    Остановите все проверки. Включите режим отладки при помощи Ctrl+Shift+D, затем сделайте двойной клик в ячейке таблицы, где возникает проблема. Должно открыться окно с кодом. Сохраните код и пришлите мне на почту. Не забудьте отключить режим отладки на Ctrl+Shift+D.

      TimWeber 06 МАЯ 2019 Г., 21:40
      • Ответ для «paveldvlip»
        на сообщение от 06 МАЯ 2019 Г., 20:04

        Хромиум здесь совершенно не при чем. Он запускается только после того как страница будет получена.

        Остановите все проверки. Включите режим отладки при помощи Ctrl+Shift+D, затем сделайте двойной клик в ячейке таблицы, где возникает проблема. Должно открыться окно с кодом. Сохраните код и пришлите мне на почту. Не забудьте отключить режим отладки на Ctrl+Shift+D.

      Сделал всё как вы сказали, но окно не появилось. Но зато ошибка парсинга опять заняла ячейку! В других ячейках, когда результат загружается и обрабатывается нормально окно появилось, а вот на ячейках с ошибками - нет!

      И ещё вопрос - а почему всё-таки хромиум не работает на версии 3? Даже на ячейках, которые загрузились и успешно обработались, хромиум всё равно показывает одно и то же сообщение "Невозможно отобразить контент т.к."...

      Заранее спасибо за ответ!

      • how_to_reg
      paveldvlip 06 МАЯ 2019 Г., 22:19
      • Ответ для «TimWeber»
        на сообщение от 06 МАЯ 2019 Г., 21:40

        Сделал всё как вы сказали, но окно не появилось. Но зато ошибка парсинга опять заняла ячейку! В других ячейках, когда результат загружается и обрабатывается нормально окно появилось, а вот на ячейках с ошибками - нет!

        И ещё вопрос - а почему всё-таки хромиум не работает на версии 3? Даже на ячейках, которые загрузились и успешно обработались, хромиум всё равно показывает одно и то же сообщение "Невозможно отобразить контент т.к."...

        Заранее спасибо за ответ!

      Хромиум прекрасно работает. Из XMLRiver приходит ответ в формате XML. Хромиум не может его отобразить. Поэтому там и поставлена эта заглушка. Вам же написали, что это сообщение не является ошибкой.
      • how_to_reg
      paveldvlip 06 МАЯ 2019 Г., 22:32
      Ошибка парсинга всегда выпадает после 3-х минутного ожидания или может сразу появиться после появления трёх точек в ячейке?
        TimWeber 06 МАЯ 2019 Г., 23:19
        • Ответ для «paveldvlip»
          на сообщение от 06 МАЯ 2019 Г., 22:32

          Ошибка парсинга всегда выпадает после 3-х минутного ожидания или может сразу появиться после появления трёх точек в ячейке?
        Насколько я заметил - только после ожидания!
        • how_to_reg
        paveldvlip 06 МАЯ 2019 Г., 23:48
        • Ответ для «TimWeber»
          на сообщение от 06 МАЯ 2019 Г., 23:19

          Насколько я заметил - только после ожидания!

        Только что поддержка XMLRiver ответила на мой запрос:


        Только что проверили. Нашли одну ситуацию, когда WAIT мог возращаться дольше 300 секунд. Устранили.


        Проверьте как будет теперь.
          TimWeber 07 МАЯ 2019 Г., 9:20
          • Ответ для «paveldvlip»
            на сообщение от 06 МАЯ 2019 Г., 23:48

            Только что поддержка XMLRiver ответила на мой запрос:


            Только что проверили. Нашли одну ситуацию, когда WAIT мог возращаться дольше 300 секунд. Устранили.


            Проверьте как будет теперь.
          Спасибо! Помогло)