Статьи по теме data-engineering

Публикации по теме 'data-engineering'

Масштабное развертывание машинного обучения с помощью Kedro и Cortex

Развертывание модели машинного обучения в производстве по-прежнему является областью, в которой отсутствует соответствие, номенклатура и шаблоны. Если не считать нескольких технологических компаний, которые рано начали этот путь, для поздних последователей методов машинного обучения это в значительной степени дикий запад, когда дело доходит до стандартов развертывания моделей. Некоторые другие проблемы включают культуру групп по науке о данных внутри организации, производство процесса..

Validio сотрудничает с Google Cloud

Validio сотрудничает с Google Cloud Мы рады сообщить, что Validio присоединилась к программе Google Cloud Partner Advantage в качестве партнера по сборке! Платформа Validio для проверки и мониторинга качества данных следующего поколения позволит совместным клиентам Validio и Google Cloud добиться большего доверия к своим данным и конвейерам данных, активно отслеживать состояние данных, а также выявлять и устранять проблемы с качеством данных по мере их возникновения. Validio..

Генезис науки о данных - что он открывает для специалистов по данным будущего?

Принципы с самого начала: создавать элегантные модели Наука о данных - не новая область. Это как раз означает применение науки к данным. Наука применяется к данным так же, как и в любой другой области исследований. Исторически сложилось так, что исследования в любой области, а именно в физике, медицине, давали много данных из экспериментов и наблюдений. Таким образом, наука о данных может рассматриваться как неотъемлемая часть каждой области исследований от нескольких..

ДЕЙСТВИТЕЛЬНО ЛИ МОДЕЛИ ГЛУБОКОГО ОБУЧЕНИЯ ЛУЧШИЕ?

ДЕЙСТВИТЕЛЬНО ЛИ МОДЕЛИ ГЛУБОКОГО ОБУЧЕНИЯ ЛУЧШИЕ? В заключительной части нашей серии мы проанализируем производительность нашего набора данных, внедрив модель глубокого обучения. Статья ниже прольет свет на то, можем ли мы добиться лучших результатов при таком подходе. В предыдущих частях нашей серии мы заметили, что модель случайного леса превзошла другую модель. Теперь нам интересно выяснить, даст ли модель глубокого обучения лучшие результаты. В этой модели мы фокусируемся на..

Предоставление AI Hero новых сверхспособностей с помощью Kubernetes

AI Hero всегда был полностью контейнерным приложением. Однако он был развернут в основном поверх инстансов EC2. С нашим переходом на Kubernetes AI Hero стал намного мощнее — мы повысили скорость наших сервисов, наша платформа стала сверхмасштабируемой, у нас более быстрый цикл выпуска, и она стала готовой для предприятий, поскольку ее легко развертываемый локально. Обновление: декларативные MLOps — оптимизация обслуживания моделей в Kubernetes: вот запись моего выступления, в которой..

6 лучших вакансий в сфере больших данных

Обзор наиболее востребованных вакансий в области больших данных с описанием должностей, навыков и заработной платы. Уже некоторое время компании собирают данные в больших масштабах и целенаправленно анализируют их для получения конкурентных преимуществ. Однако многие не знают, сколько работы и рабочих мест необходимо для создания и обслуживания такой инфраструктуры. Именно поэтому существует…

Что дальше в генеративном ИИ?

Чтение чайных листьев, чтобы попытаться предсказать будущее генеративного ИИ Введение От скромного начала в 1960-х годах с ELIZA, чат-ботом, имитирующим терапевта, до появления генеративно-состязательных сетей (GAN) в 2014 году, а теперь и мощных преобразователей и больших языковых моделей (LLM), которые используются в приложениях искусственного интеллекта, таких как ChatGPT и Microsoft Bing. , прогресс был не чем иным, как захватывающим дух 1 . Но какое будущее ждет генеративный..