Публикации по теме 'dimensionality-reduction'


Серия «Обучение без учителя» : обзор №1 по уменьшению размерности
Снижение размерности бывает 2 видов: Линейная проекция: 1.1 Анализ основных компонентов: Проецирование точек данных из многомерного пространства в низкоразмерное, чтобы сохранить только самые важные функции, то есть те, которые объясняют различия между экземплярами, что помогает лучше понять структуру набора данных. 1.2 Разложение по сингулярным числам (SVD): Другой тип линейной проекции, в котором ранг исходной матрицы уменьшается, чтобы сформировать меньшую матрицу,..

Линейный дискриминантный анализ Фишера
Сложно преобразовать данные с более высокой размерностью в данные с более низкой размерностью или визуализировать данные с помощью сотен атрибутов или даже больше. Слишком много атрибутов приводит к переобучению данных, что приводит к плохому прогнозированию. Уменьшение размерности - лучший подход к работе с такими данными. Большое количество атрибутов в отведениях набора данных может привести к переобучению наборов данных. Есть несколько методов уменьшения размерности. Три популярных..

Анализ основных компонентов с нуля с помощью Python
0. Введение Скажем, у вас есть куча точек данных, и вы хотите найти в них закономерности. Анализ главных компонентов — это инструмент, который может помочь вам в этом. Он находит наиболее важные функции в ваших данных и уменьшает размерность данных. Это означает, что он берет много точек данных и превращает их в меньшее количество точек данных, с которыми легче работать. В статистике анализ основных компонентов (PCA) — это метод, используемый для уменьшения размерности данных. Это..

PCA — Интуиция, стоящая за этим
Все, что нам нужно, это набор интеллектуальных базисных векторов . Возможно, вы уже знаете, что на самом деле делает PCA абстрактно, и также использовали это в своем проекте. но вы можете не знать, как это уменьшает размеры или интуицию, стоящую за этим. Тогда эта статья для вас. Проще говоря, PCA уменьшает размерность данных. Предположим, у нас есть матрица данных X размерности M * N где M = количество образцов, N = количество признаков (размеров) Поэтому очевидно, что для..

PCA (анализ основных компонентов) в деталях
В этой статье мы изучим один из основных и простейших методов уменьшения размерности, называемый PCA (анализ главных компонентов). В этом блоге мы рассмотрим следующие темы: Что такое ПСА? Зачем изучать PCA? Геометрическая интерпретация PCA. Математическая интерпретация PCA. Альтернативная формулировка минимизации расстояния PCA Решение задачи оптимизации и важность собственных значений и собственных векторов в PCA Визуализируйте набор данных MNIST и пример кода PCA Ограничения..

Уменьшение размерности и преимущества нелинейных воспроизводимых методов, таких как UMAP.
В постоянно расширяющемся мире науки о данных одной из фундаментальных проблем, с которыми мы сталкиваемся, является проклятие размерности. Это проклятие возникает, когда наборы данных содержат большое количество функций или переменных, что затрудняет эффективную работу с ними и часто приводит к снижению производительности модели. На помощь приходят методы уменьшения размерности, предлагающие способы преобразования многомерных данных в более управляемое и информативное представление...

Мудрость короля Жюльена, размеры и классификация
О любимых телешоу и почему многомерность данных имеет значение Я люблю Пингвинов Мадагаскара, особенно сериал. Хотя шоу было предназначено для детей, оно изображает ярких личностей с выдающимися характеристиками и содержит множество анекдотических моментов для взрослой аудитории. В одной из серий король Жюльен решает вечный вопрос о приоритете: что первично, курица или яйцо? Разговор между ним и его миньоном Морисом выглядит примерно так: - Это загадка, что съедается первым?..