Todd Wilson

Президент screen-scraper
Screen-scraper logo

Компания screen-scraper занимается сбором веб-данных с 2002 года. Так что мы в этой сфере далеко не новички. За это время мы поработали практически во всех отраслях, которые только можно представить: от туризма до электронной коммерции. Кроме того, мы много работаем с официальными государственными данными.

Мы относительно небольшая компания, у нас в основном работают разработчики и инженеры. Я и сам много занимаюсь инженерным делом. У нас есть собственные продукты, обеспечивающие извлечение данных. Как правило, веб-данные мы используем в первую очередь для своего решения screen-scraper.

Мы в основном работаем с официальными документами. Огромную ценность имеют судебные документы. Это, к примеру, могут быть документы местных органов юстиции. Или даже открытая информация, которая может использоваться в маркетинговых целях или, например, для проверки сведений о том или ином лице.

При сборе общедоступных веб-данных ключевую роль играет опыт и знание принципов и закономерностей работы различных веб-сайтов. Думаю, что наше основное преимущество с точки зрения клиентов заключается в огромном опыте. Мы работаем в этой сфере лучше и дольше, чем практически любая другая компания.

Мы — опытные специалисты, хорошо владеющие своими инструментами. Доступ к данным и их загрузка с веб-сайтов — своего рода искусство, а не наука. Если вы никогда не занимались этим раньше, вам будет трудно просто взять и начать эффективно работать в этом направлении.

Собирать веб-данные и готовить их к анализу собственными силами нелегко. Мы делаем все от нас зависящее, ведя сбор и структурирование данных для наших клиентов, но иногда веб-сайты принимают контрмеры, стараясь защитить себя от DDoS-атак.

В ответ на эти действия администрации сайтов мы вынуждены должным образом настраивать параметры на нашей стороне, что предполагает написание миллионов строк кода параллельно со структурированием получаемых данных и решением других проблем, которые могут возникать в процессе сбора данных. Все это происходит снова и снова.

Именно здесь на помощь приходит Bright Data. Если сайт принимает меры, препятствующие нашему доступу, для получения нужных нам общедоступных веб-данных наиболее эффективным, надежным и гибким способом мы используем платформу Bright Data — на базе резидентных, серверных и мобильных сетей, а также посредством Web Unlocker. Это позволяет нам исследовать, отслеживать и анализировать данные, а затем передавать ценную информацию нашим клиентам.

Bright Data предоставляет услуги премиум-класса в сфере сбора и оптимизации веб-данных. Фактически нам достаточно просто нажать на кнопку. Это решение экономит нам массу времени. Нам не нужно что-либо изучать, настраивать и устранять неполадки, мы просто получаем нужные данные. Это попросту лучшее решение из возможных — особенно если принять во внимание масштаб сети компании, особенности самой платформы с технической точки зрения, API, высочайшую гибкость и великолепное обслуживание клиентов. Это все, что нам может понадобиться.

Я очень удивлюсь, если в 2022 году объемы сбора данных не продолжат расти — особенно с учетом того, что внедрению стратегий big data сегодня уделяется все большее внимание. Текущая среда позволяет компаниям анализировать данные, выявлять тенденции и оказывать положительное влияние на итоговый результат.

More testimonials

David Amézquita
Product Manager at Container xChange
xChange logo
В рамках нашего продуктового направления, сосредоточенного на цепочке поставок, нам нужны все надежные общедоступные веб-данные, которые только можно получить, чтобы мы могли предоставлять ценные сведения нашим клиентам в режиме реального времени.
Sarah Melville
Data Science Specialist
Именно сбор общедоступных веб-данных позволяет нам определять охват того или иного бренда и его присутствие в различных информационных пространствах. Без поддержки Bright Data мы попросту не смогли бы продолжать развиваться с текущей скоростью.
Danny Issroff
Product Lead at CRED Investments
Bright Data is an indispensable part of our data universe - with the breadth and freshness of the web data, the different relevant datasets available, and the reasonable price.

Веб-парсер IDE – Свяжитесь с нами

Dataset Sample Request

Заказать звонок