Будущее ИИ связано не только с большими моделями или более быстрыми чипами, но и с лучшими данными. В отчете “Данные для ИИ 2025“, подготовленном по заказу Bright Data и проведенном независимо друг от друга, содержится информация, полученная от 500 руководителей высшего звена, чьи организации используют публичные веб-данные для обучения, тонкой настройки и питания своих систем ИИ. Отчет предлагает всесторонний взгляд на роль стратегий использования веб-данных в стартапах, малом и среднем бизнесе и на предприятиях.
Вот некоторые из наиболее интересных выводов из отчета – и что они означают для будущего ИИ.
Веб-данные – основной актив искусственного интеллекта
Один из самых поразительных выводов заключается в том, что 65 % организаций используют публичные веб-данные в качестве основного источника для обучения ИИ. Это знаменует собой значительный переход от традиционных статичных наборов данных к динамичным потокам данных в реальном времени, которые постоянно обновляются и настраиваются.
Публичные веб-данные больше не просто дополнение – это основа. Они поддерживают весь жизненный цикл ИИ, от предварительного обучения и тонкой настройки до выводов и принятия решений в реальном времени. Это особенно важно для таких приложений, как генеративный ИИ, ИИ-агенты и аналитика в реальном времени, где контекст и свежесть данных имеют решающее значение.
Стартапы лидируют в области инноваций
Стартапы, известные своей динамичностью и инновационностью, делают смелые шаги в области ИИ, и веб-данные являются ключевой частью их стратегии.
- 69 % стартапов используют публичные веб-данные в качестве основного источника для сбора подключенных данных в режиме реального времени
- 52 % уже отмечают положительную рентабельность инвестиций в инфраструктуру веб-данных
Стартапы, ориентированные на скорость и гибкость, нуждаются в масштабируемой и надежной инфраструктуре данных. Надежный партнер по сбору данных может упростить сбор и обеспечить соблюдение требований.
Предприятия масштабируются с высокой точностью
В то время как стартапы развиваются быстро, предприятия масштабируются в больших масштабах и уделяют особое внимание качеству и соблюдению требований.
- 69 % предприятий полагаются на общедоступные веб-данные для ИИ в реальном времени
- 54 % сообщают о положительном финансовом эффекте от веб-скреппинга
Предприятия используют веб-данные для повышения точности, релевантности моделей ИИ и принятия решений в режиме реального времени. При масштабировании усложняются такие задачи, как соблюдение нормативных требований и интеграция данных.
Данные в реальном времени помогают агентам искусственного интеллекта
Основной тенденцией, отмеченной в отчете, является рост использования данных в режиме реального времени для выводов. 96 % организаций собирают веб-данные в режиме реального времени для выводов, что позволяет агентам ИИ взаимодействовать с Интернетом, обосновывать свои ответы и рассуждать более эффективно.
Такие сценарии использования, как поиск, навигация и извлечение информации, требуют актуальных, богатых контекстом данных. Неблокируемая инфраструктура Bright Data предназначена для поддержки этих потребностей в масштабе, обеспечивая агентам ИИ возможность работать с самой актуальной и релевантной информацией.
Качество данных – новое конкурентное преимущество
По мере внедрения ИИ организации осознают, что качество данных, а не только их количество, является ключом к производительности. 71 % респондентов утверждают, что в ближайшие два года качество данных станет главным конкурентным преимуществом в области ИИ. Качественные, разнообразные и хорошо размеченные данные приводят к более точным прогнозам, уменьшению количества ошибок и повышению надежности систем ИИ.
Экономика данных процветает
Отчет также показывает, что спрос на публичные веб-данные быстро растет.
- 38 % компаний уже потребляют более 1 петабайта публичных веб-данных в год
- Ожидается, что в следующем году потребности в данных вырастут на 33 %.
- Бюджеты на приобретение данных, согласно прогнозам, увеличатся на 85%.
Этот всплеск отражает растущую важность данных в стратегиях искусственного интеллекта и потребность в масштабируемых, экономически эффективных решениях для удовлетворения этого спроса.
Преодоление трудностей с помощью правильного партнера
Несмотря на энтузиазм, 98 % организаций сталкиваются с проблемами при масштабировании сбора данных. Дорога к высококачественным данным ИИ не всегда бывает гладкой – от нормативных препятствий до интеграции.
Именно здесь на помощь приходят партнеры по работе с данными, которые обеспечивают скорость сбора данных, экономическую эффективность и полноту данных.
В отчете “Данные для ИИ 2025” ясно сказано одно: успех ИИ зависит от успеха данных. Загрузите полный текст отчета, чтобы ознакомиться со всеми фактами и узнать, как ваша организация может быть впереди в гонке ИИ.