Публикации по теме 'resampling'


Несбалансированные данные: 10 проверенных стратегий обработки искаженных данных
Сжатое руководство по обработке дисбаланса классов в данных Вы когда-нибудь пытались предсказать мошенничество с кредитными картами? Это классическая проблема в банковской сфере — предсказать, является ли определенная транзакция по кредитной карте мошеннической или нет. Допустим, у вас есть прошлые записи транзакций по кредитным картам, вы можете построить хорошую классификационную модель, используя эти данные, но когда придет время для правды, вполне возможно, что ваша модель не..

Передискретизация бутстрапа
Просто, понятно, удобно. Нет, не Twitter Bootstrap - этот бутстрапинг - это способ выборки данных, и он является одним из самых важных для рассмотрения того, что лежит в основе вариации чисел, вариации распределений, что лежит в основе распределений. С этой целью начальная загрузка работает очень, очень хорошо. Для специалистов по анализу данных, инженеров по машинному обучению и статистиков жизненно важно понимать методы повторной выборки. Но зачем использовать ресемплинг? Мы..