Публикации по теме 'data-cleaning'


5 вещей, которые нужно изучить при построении модели машинного обучения.
Интересно, почему модель машинного обучения иногда дает сбой? Введение Было бы легкой прогулкой, если бы мы ссылались на реальный проект, обсуждая важные вещи во время построения модели машинного обучения. Мы благодарны Udacity за предоставление нам проекта Starbucks, который представляет собой Capstone Challenge для специалиста по данным Udacity Nanodegree в сотрудничестве со Starbucks, где нам были предоставлены смоделированные данные, имитирующие поведение клиентов в мобильном..

Типы категориальных признаков (никогда не забывайте о цикличности!)
Повысьте уровень разработки своих функций, обращаясь с переменными так, как они того заслуживают. Также называемые качественными, категориальные признаки содержат значения, отсортированные по определенным группам. Помимо этого общего определения, есть несколько подмножеств, которые должны обрабатываться по-разному в процессе разработки функций. Номинальный Классика, это тип категориальной характеристики, о которой люди думают в первую очередь. Это подмножество не имеет внутреннего..

Модели машинного обучения не говорят о категориях
Осмысление категориальных данных с помощью кодирования Как специалисты по данным, мы несем ответственность за оптимизацию выходных данных наших моделей. Независимо от вопроса или проблемы, которую мы пытаемся решить, наши модели не могут быть успешными без правильных исходных данных. Математические модели требуют числовых входных данных для правильного функционирования. Точно так же, как обучение профессионального спортсмена, хорошо настроенная модель будет нуждаться в постоянной диете..