Публикации по теме 'k-nearest-neighbours'


Руководство для начинающих по алгоритму ближайшего соседа (KNN) с кодом
Сегодня давайте обсудим один из простейших алгоритмов машинного обучения: алгоритм ближайшего соседа K (KNN). В этой статье я объясню основную концепцию алгоритма KNN и как реализовать модель машинного обучения с использованием KNN в Python. Алгоритмы машинного обучения можно условно разделить на два: 1. Обучение с учителем 2. Обучение без учителя В контролируемом обучении мы обучаем наши модели на помеченном наборе данных и просим его предсказать метку для немаркированной точки...

От теории к практике: реализация многоклассовой классификации с помощью KNN SKLearn
Недавно я столкнулся с очень распространенной проблемой в управлении данными — нормализацией. Большинство аналитиков предпочли бы найти и заменить в Excel. В моем списке желаний было попытаться решить проблему с большими наборами данных, которые превышают возможности Excel. Я использовал OpenRefine, инструмент, который предоставляет графический интерфейс и возможность выбирать различные уровни строгости для создания кластеров сходства, а затем присваивать значение класса этим кластерам...

Основы машинного обучения: реализация Python для метода K-ближайших соседей
Алгоритм k-ближайших соседей (KNN) - это простой, простой в реализации, но мощный алгоритм контролируемого машинного обучения, который можно использовать для решения задач классификации и расширить до задач регрессии. Как KNN работает под капотом? Алгоритм K-ближайших соседей (KNN) использует «сходство признаков» для прогнозирования значений новых точек данных, что означает, что новой точке данных будет присвоено значение в зависимости от того, насколько близко она совпадает с точками в..

Лучше, чем KNN: приблизительный ближайший сосед (введение)
Цель Я предполагаю, что вы слышали об алгоритме k-ближайших соседей для задачи классификации (см. Учебник: модель K-ближайших соседей ). Это один из самых простых алгоритмов классификации Не требует времени на обучение Это очень медленно во время прогнозирования Он плохо масштабируется для большого размера обучения, потому что каждый прогноз требует сканирования всего набора данных. Существуют очень продвинутые алгоритмы поиска ближайшего соседа, такие как ScaNN от Google и..