Публикации по теме 'xgboost'


Преобразование временных рядов (и возврат) стало проще
Изучение преобразований для временных рядов и способов их отмены с помощью масштабирования в Python При прогнозировании данных временных рядов важным фактором является стационарность. Некоторые модели — ARIMA, Holt-Winters, Exponential Smoothing и другие — специализированы для временных рядов и не обязательно требуют стационарных данных. Стационарность ряда относится к его тенденции возвращаться к своему среднему значению с течением времени. Нестационарный ряд вводит тренд в набор..

Методы повышения
Теория бустинга Ускорение — это концепция , а не алгоритм машинного обучения. Вместо этого рассмотрите это как метод, применяемый к существующему алгоритму машинного обучения. Однако наиболее широко он применяется к дереву решений, потому что именно там он дает наилучшие результаты. Это итеративный метод построения сильной модели, который учитывает недостатки слабых алгоритмов, разработанных в том же наборе данных. Он объединяет результаты слабых учеников для создания сильного..

Интерпретация сложных моделей со значениями SHAP
Примечание. Изначально этот пост был опубликован на веб-сайте Canopy Labs и описывает работу, которую мне посчастливилось делать там как специалисту по данным. Важный вопрос в области машинного обучения - почему алгоритм принял определенное решение. Это важно по разным причинам. Как конечный пользователь, я с большей вероятностью поверю рекомендации, если пойму, почему она была мне предоставлена. Как организация, понимание того, что клиенты совершили покупку, потому что эта кампания..

Прогнозирование функциональности водяных насосов с помощью XGBoost
Комплексный проект машинного обучения, вдохновленный конкурсом Data Mining the Water Table. Оглавление ∘ Введение ∘ Цель ∘ Инструменты/фреймворки ∘ Исследовательский анализ данных ∘ Разработка функций ∘ Создание обучающих и Тестирование сплитов ∘ Определение метрики оценки ∘ Создание базовых моделей ∘ Подход к моделированию данных ∘ Подход к настройке гиперпараметров ∘ Модель XGBoost ∘ Модель CatBoost ∘ Модель LightGBM ∘ Выбор лучшей модели ∘..

Категорически: не взрывайтесь  — кодируйте!
Прочитайте эту статью, прежде чем приступать к предварительной обработке данных для древовидных моделей! Кроме того, ознакомьтесь со связанным блокнотом для получения кода для загрузки и предварительной обработки наборов данных и повторения экспериментов. Предварительная обработка данных — важная часть построения модели машинного обучения. Данные в необработанном виде часто не могут быть загружены непосредственно в алгоритм. Предварительная обработка позволяет алгоритмам..

Дерево решений, случайный лес и XGBoost: исследование сути машинного обучения
В эпоху цифровых технологий данные превратились в важнейшую валюту, стимулирующую рост и инновации в самых разных секторах. Машинное обучение, подмножество искусственного интеллекта, выдвинулось на передний план как преобразующая технология, которая позволяет нам превращать эти обширные данные в практические знания. От персонализации онлайн-покупок до прогнозирования вспышек заболеваний или даже управления беспилотными автомобилями — машинное обучение нашло множество применений, отмечая..

Прогнозирование музыкальных жанров с помощью ML и Optuna
Музыка повсюду вокруг нас. Воздействие музыки на человека невозможно выразить словами. На протяжении своего вечного путешествия лицо музыки видело много разнообразия и изменений в своей форме. Окружающий нас мир неоднороден и существует огромное разнообразие в образе жизни людей, их мышлении и их культуре. С этим разнообразием очевидно, что музыка тоже будет другой и будет иметь разнообразие, соответствующее интересам разных людей. Помня об этом разнообразии, у компаний, занимающихся..