Публикации по теме 'titanic-dataset'


ML 101 — Улучшение титанического балла с 0,7 до 1
Осторожно, спойлер: Мой ответ на 1 глупый Шаг 1: Понимание постановки задачи В этом посте я собираюсь объяснить, как мне удалось улучшить оценку с 0,72 до 0,83 (топ-3% на момент отправки), а затем с 0,83 до 1 Титаникское машинное обучение после катастрофы . Хорошо, что проблема Титаника — это бесконечный конкурс. Итак, если вы хотите понять, где вы стоите как специалист по данным, эта задача будет очень полезна. Шаг 2: понимание данных Всегда помните эту цитату Если вы..

Групповой выбор функций
Предварительные требования: исчерпывающий/последовательный выбор функций Feature Selection означает «выбор функций» :) Хорошо, это было легко! Однако я хочу поговорить о выполнении (последовательном или исчерпывающем) отборе функций, рассматривая некоторые функции вместе как одну группу. Допустим, у вас есть данные со многими категориальными функциями, вы выполняете их горячее кодирование, и теперь вы получаете СЛИШКОМ много столбцов. Один из подходов к выбору функций — запустить..

Логистическая регрессия
Логистическая регрессия является широко используемой моделью классификации. В этой модели зависимая переменная или целевое значение представляет собой дискретное двоичное значение, т. е. 1 или 0, предполагающее успешное или неудачное выполнение, выигрыш или проигрыш, истинное или ложное. Хотя это классификационная модель, термин «регрессия» в ее названии предполагает, что эта модель работает аналогично модели регрессии, которая является прогностическим моделированием. Вместо подгонки..