Публикации по теме 'missing-values'
Как работать с отсутствующими значениями в наборе данных?
Реальные наборы данных состоят из пропущенных значений, и специалист по анализу данных тратит много времени на подготовку данных, включая очистку данных. Отсутствие значения может быть результатом незарегистрированных наблюдений или повреждения данных.
Типы отсутствующих данных
Случайно пропущенные (MAR) - это означает, что существует связь между пропорцией пропущенных значений и наблюдаемыми данными. Например, на приведенном ниже графике мы видим, что доля пропущенных значений в..
Проект машинного обучения
В этой статье я попытаюсь выполнить ряд анализов общедоступного набора данных и попытаться построить соответствующую модель, чтобы предсказать, должен ли пользователь, подавший заявку на получение кредитной карты в онлайн-банке, быть одобрен или нет. Мы решим это, так как мы работаем в компании, и отчет должен быть представлен.
#### reading the data set ####
data = pd.read_csv('case_study_data.csv')
data.head()
#### checking null values in any of the columns ####..