Публикации по теме 'clustering'


Что такое алгоритм К-средних?
Введение Прежде всего, нам нужно понять, какое место K-Means занимает в сфере машинного обучения. В сфере машинного обучения у нас есть много разных типов алгоритмов. и множество различных вариантов использования (например, классификация, оптимизация, регрессия и многое другое..) K-Means решает задачу кластеризации : разделяет набор данных на наборы (так называемые кластеры) с похожими объектами. «Сходство» может быть субъективной темой, но алгоритмы кластеризации пытаются (и..

Ожидание-Максимизация
Алгоритм максимизации ожидания (EM) — это мощный итерационный метод оценки параметров статистических моделей в тех случаях, когда их уравнения не могут быть решены напрямую. Как правило, эти модели содержат латентные (скрытые) переменные в дополнение к неизвестным параметрам вероятностных распределений. Алгоритм EM используется в различных приложениях машинного обучения, таких как распознавание речи, классификация изображений и NLP (обработка естественного языка). Эта статья немного..

Раскрытие возможностей НЛП и кластеризации как профессионал: ищите лучшие курсы и экономьте свое время…
Этот проект предоставлен IBM skills network . Откройте для себя мир безграничных возможностей обучения! В этом проекте вы погрузитесь в захватывающую сферу обработки естественного языка (NLP) и машинного обучения (ML), чтобы найти похожие курсы, как никогда раньше. От предварительной обработки текста до его векторизации с помощью передовых моделей НЛП, таких как BERT, вы овладеете искусством подготовки текста для анализа. Получите практический опыт работы с алгоритмами кластеризации..

A47: Кластеризация — Сложный мультикластерный набор данных
K-средние, агломерация, коэффициент силуэта, оценка силуэта, обучение без учителя, кластеризация на основе плотности, DBSCAN, OPTICS Эта статья является частью серии Наука о данных с нуля — Могу ли я, чтобы я смог , серии книг с конспектами лекций (часть 3). ( Нажмите здесь, чтобы получить копию части 1 и части 2 сегодня ) Нажмите здесь, чтобы просмотреть предыдущую статью/лекцию «A46: Оценка алгоритма кластеризации — машинное обучение без учителя . » 💐Нажмите здесь,..

KMeans менее чем за 5 минут
(Подход снизу вверх) Предположим, вы специалист по обработке данных в компании по производству одежды, и у вас есть набор данных с характеристиками роста и веса, и вы хотите найти кластеры (т. е. группы малых, средних и крупных примерок одежды), чтобы ваша компания могла производить одежду. соответственно, и доставьте своим клиентам удовлетворение от великолепного оснащения вашего бренда, а TBH вы можете получить за это прибавку 😛 KMeans - это алгоритм обучения без учителя...

Выбор правильной метрики расстояния для вашей задачи машинного обучения: подробное руководство с…
Введение Думайте о расстоянии как о пространстве между двумя вещами. Точно так же, как мы измеряем расстояние между двумя точками на карте, мы можем измерить расстояние между двумя объектами в компьютерной программе. В машинном обучении мы используем расстояние, чтобы понять, насколько вещи похожи или отличаются друг от друга. Это важно, когда мы пытаемся делать прогнозы или классифицировать вещи. То, как вы измеряете расстояние, повлияет на то, как вы сгруппируете вещи. Точно так же,..

5 лучших типов алгоритмов кластеризации, которые должен знать каждый специалист по данным!
Кластеризация  – это метод в науке о данных, с помощью которого похожие объекты или объекты группируются в один кластер таким образом, чтобы дисперсия объектов внутри одной группы была минимальной. и это по группам является высоким. Модуль действия для этого состоит в том, чтобы найти список факторов или характеристик, которые являются общими в этих точках данных населения, а затем сгруппировать точки данных на основе их сходства с выявленными факторами или характеристиками...