Статьи по теме clustering

Публикации по теме 'clustering'

Раскрытие возможностей кластеризации K-средних

Введение Неконтролируемое машинное обучение включает в себя обучение компьютера работе с немаркированными и неклассифицированными данными, что позволяет алгоритму работать с этими данными без контроля. В отличие от обучения с учителем, данные о предварительном обучении недоступны, поэтому задача машины — упорядочить несортированные данные на основе сходств, шаблонов и вариаций. Кластеризация — это неконтролируемый метод машинного обучения, целью которого является определение подгрупп..

Кластеризация и ее типы: обсуждение K-средних и DBSCAN.

Кластеризация и ее типы: обсуждение K-средних и DBSCAN. Введение: Кластеризация — это процесс группировки объектов таким образом, чтобы их можно было идентифицировать как похожие. В этой статье мы рассмотрим различные типы алгоритмов кластеризации и то, как они могут помочь вам решить проблемы интеллектуального анализа данных. Объяснение кластеризации с точки зрения непрофессионала. Кластеризация – это группа похожих объектов. Кластеризация используется для поиска шаблонов..

Кластеризация

Кластеризация — это метод группировки элементов данных в группы, похожие друг на друга. Это способ осмысления данных, которые могут быть трудны для понимания сами по себе. Например, при попытке определить, какую пищу ел каждый из соседей человека в течение одного года, может быть полезнее посмотреть, какие продукты потребляет большинство людей по соседству, а не анализировать каждую из них. индивидуальное питание человека. Группирование похожих точек данных можно использовать для поиска..

Как я создал свою первую модель сегментации, используя улучшенный алгоритм RFM ?

Создавайте и ориентируйтесь на сегменты клиентов с помощью улучшенного алгоритма RFM. Несколько лет назад, когда я начал свою первую работу в качестве Data Scientist, ко мне подошел UX-менеджер электронной коммерции и попросил построить сегментацию, чтобы лучше понять поведение клиентов на наших веб-сайтах. Я был очень взволнован, но не знал, как начать. Я допустил ошибки, это заняло у меня некоторое время, но мне удалось создать эту сегментацию, используя базовые методы машинного..

Прогноз факторов убыли сотрудников

Проект UTMIST Малихи Лоди, Афнана Рахмана, Кевина Ку, Омера Раза Хана, Йинаня Чжао и Мэтью Чжу. Обзор проекта Организация хороша ровно настолько, насколько хороши ее сотрудники, поскольку они обеспечивают компании ее конкурентное преимущество. В результате крайне важно, чтобы компании понимали, как сохранить свои лучшие таланты. Используя машинное обучение и анализ данных, этот проект направлен на выявление областей улучшения во всех отделах компании путем определения факторов, которые..

Autoencoder & K-Means - кластеризация игроков EPL по статистике их карьеры

Автоэнкодер был не тем, с которого я начал свой опыт работы с искусственными нейронными сетями; однако это было первое, что меня смутило. «Зачем людям пытаться обучать сеть с одними и теми же входами и выходами?» Я почти уверен, что некоторые люди могли думать так же, как и я, только до тех пор, пока они не узнали, насколько креативен и полезен автоэнкодер. Автоэнкодер пытается скопировать свои входные данные для генерации выходных данных, которые максимально похожи на входные..

Кластеризация K-средних

В моем предыдущем блоге мы познакомились с некоторыми основами кластеризации. Теперь давайте попробуем получить более полную картину алгоритма кластеризации k-средних. Заявление о кластеризации K-средних K-means пытается разделить x точек данных на набор из k кластеров, где каждая точка данных назначается ближайшему кластеру. Этот метод определяется целевой функцией, которая пытается минимизировать сумму всех квадратов расстояний в кластере для всех кластеров. Целевая функция..