Todd Wilson

Президент screen-scraper
Screen-scraper logo

Компания screen-scraper занимается сбором веб-данных с 2002 года. Так что мы в этой сфере далеко не новички. За это время мы поработали практически во всех отраслях, которые только можно представить: от туризма до электронной коммерции. Кроме того, мы много работаем с официальными государственными данными.

Мы относительно небольшая компания, у нас в основном работают разработчики и инженеры. Я и сам много занимаюсь инженерным делом. У нас есть собственные продукты, обеспечивающие извлечение данных. Как правило, веб-данные мы используем в первую очередь для своего решения screen-scraper.

Мы в основном работаем с официальными документами. Огромную ценность имеют судебные документы. Это, к примеру, могут быть документы местных органов юстиции. Или даже открытая информация, которая может использоваться в маркетинговых целях или, например, для проверки сведений о том или ином лице.

При сборе общедоступных веб-данных ключевую роль играет опыт и знание принципов и закономерностей работы различных веб-сайтов. Думаю, что наше основное преимущество с точки зрения клиентов заключается в огромном опыте. Мы работаем в этой сфере лучше и дольше, чем практически любая другая компания.

Мы — опытные специалисты, хорошо владеющие своими инструментами. Доступ к данным и их загрузка с веб-сайтов — своего рода искусство, а не наука. Если вы никогда не занимались этим раньше, вам будет трудно просто взять и начать эффективно работать в этом направлении.

Собирать веб-данные и готовить их к анализу собственными силами нелегко. Мы делаем все от нас зависящее, ведя сбор и структурирование данных для наших клиентов, но иногда веб-сайты принимают контрмеры, стараясь защитить себя от DDoS-атак.

В ответ на эти действия администрации сайтов мы вынуждены должным образом настраивать параметры на нашей стороне, что предполагает написание миллионов строк кода параллельно со структурированием получаемых данных и решением других проблем, которые могут возникать в процессе сбора данных. Все это происходит снова и снова.

Именно здесь на помощь приходит Bright Data. Если сайт принимает меры, препятствующие нашему доступу, для получения нужных нам общедоступных веб-данных наиболее эффективным, надежным и гибким способом мы используем платформу Bright Data — на базе резидентных, серверных и мобильных сетей, а также посредством Web Unlocker. Это позволяет нам исследовать, отслеживать и анализировать данные, а затем передавать ценную информацию нашим клиентам.

Bright Data предоставляет услуги премиум-класса в сфере сбора и оптимизации веб-данных. Фактически нам достаточно просто нажать на кнопку. Это решение экономит нам массу времени. Нам не нужно что-либо изучать, настраивать и устранять неполадки, мы просто получаем нужные данные. Это попросту лучшее решение из возможных — особенно если принять во внимание масштаб сети компании, особенности самой платформы с технической точки зрения, API, высочайшую гибкость и великолепное обслуживание клиентов. Это все, что нам может понадобиться.

Я очень удивлюсь, если в 2022 году объемы сбора данных не продолжат расти — особенно с учетом того, что внедрению стратегий big data сегодня уделяется все большее внимание. Текущая среда позволяет компаниям анализировать данные, выявлять тенденции и оказывать положительное влияние на итоговый результат.

More testimonials

Victor Bolu
CEO of Webautomation
As a market leader and with an award-winning infrastructure, the partnership with Bright Data allows us to extract public web data from millions of web pages a day without many challenges.
Shameel Abdulla
Co-founder and CEO of Clootrack
Bright Data’s infrastructure is as reliable as it gets. By relying on Bright Data for collecting and structuring public data for us, our customers get the best value for investing in our services.
Alejandro Lechuga
Co-founder and COO at DocFarma
Bright Data seems to be the perfect partner according to its adaptability and efficiency in collecting large volumes of data. And for us, it was very important to get day-to-day data in a short time and with the best quality data.

Веб-парсер IDE – Свяжитесь с нами