Comments (11)
Раньше до 9 тыс компаний парсил. а сейчас до 200 еле набирает((((
from parser-2gis.
+++ хорошая программа)
from parser-2gis.
хотя бы чтобы вручную можно было капчу вводить и он продолжал с места остановки
from parser-2gis.
хотя обычно можно было капчу вводить и он продолжал с места остановки
согласен))
from parser-2gis.
Очень ждем!
from parser-2gis.
Если можно, то хотя бы сделать продолжение с места остановки, пожалуйста. Капчу можно и пощелкать при желании.
from parser-2gis.
парсинг мертв
from parser-2gis.
Да, ждем обновлений, спасибо!
from parser-2gis.
Ждем обновления, спасибо! Согласен что капчу можно и руками ввести. Главное чтобы парсер не падал после нее
from parser-2gis.
Капча была введена 2gis экспериментально -- сейчас её уже нет, поэтому этот issue закрыт.
from parser-2gis.
Опять капча появляется, конечно не сразу, но со страницы 200-300 стабильно. Большие задержки между кликами не помогают, рандомное увеличение задержки тоже. Когда капча появляется, парсер работу не прекращает, а продолжает перебирать страницы, но через некоторое хромиум сообщает "Aw, Snap!" и Error code: SIGTRAP
.
Прохождение капчи в ручном режими очень неудобно, когда программа запускается в консольном режиме, а подключение сторонних сервисов для разгадывания капчи может быть сложно. В качестве промежуточного решения было бы здорово, если бы при появлении требования капчи консольная версия завершала работу и возвращала номер последней успешной страницы, чтобы после можно было перезапустить и продолжить со следующей страницы.
UPD: Иногда вылетает с такой ошибкой:
17/02/2024 18:13:27.043 | INFO | Парсинг ссылки завершён.
17/02/2024 18:13:27.679 | ERROR | Ошибка во время работы парсера.
Traceback (most recent call last):
File "/mnt/TOSHIBA-2TB/Sources/github_parser-2gis/parser_2gis/runner/cli.py", line 29, in start
parser.parse(writer)
File "/mnt/TOSHIBA-2TB/Sources/github_parser-2gis/parser_2gis/parser/parsers/main.py", line 209, in parse
self._chrome_remote.perform_click(link)
File "/mnt/TOSHIBA-2TB/Sources/github_parser-2gis/parser_2gis/chrome/remote.py", line 359, in perform_click
resolved_node = self._chrome_tab.DOM.resolveNode(backendNodeId=dom_node.backend_id, _timeout=timeout)
File "/mnt/TOSHIBA-2TB/Sources/venv/lib/python3.10/site-packages/pychrome/tab.py", line 177, in call_method
raise CallMethodException("calling method: %s error: %s" % (_method, result['error']['message']))
pychrome.exceptions.CallMethodException: calling method: DOM.resolveNode error: Node with given id does not belong to the document
17/02/2024 18:13:27.684 | INFO | Парсинг завершён.
from parser-2gis.
Related Issues (20)
- города (населенные пункты) точечные выгрузки HOT 2
- Не загружает все найденные контакты HOT 1
- Pydantic version HOT 2
- Возможен парсинг ссылок типа "https://2gis.ru/firm/70000001036976412" ? HOT 2
- Крашится парсинг HOT 4
- максимальное количество записей HOT 1
- Не работает HOT 1
- Можно ли запустить хром с расширениями? HOT 1
- Не получается установить на макОС HOT 2
- Была бы возможность выбирать какие данные собирать, например только emailы и чтобы в логах видно было сколько собрано HOT 1
- Вопрос по Google Maps и Яндекс Картам HOT 2
- не собирает контакты HOT 1
- error HOT 1
- exception in decoder HOT 1
- Дополнителнить географическими объектами HOT 2
- Парсинг автобусных остановок из 2ГИС HOT 1
- Парсер парковок HOT 1
- Парсер не запускается HOT 2
- Не работает на макос 14.3 HOT 5
- Не открывается на Мак ОС 12.7.4
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from parser-2gis.