Пожалуйста, обратитесь к блокноту — краткая демонстрация сжатия данных с использованием библиотек Python. Здесь я использую SVD для сжатия изображения.
Можно использовать одни и те же коды для сжатия любого формата данных/всего, что может быть представлено в виде числовой матрицы.
Это связано с PCA — поскольку сжатие — это не что иное, как проецирование исходных данных на главные компоненты. Основные компоненты - это не что иное, как ортогональный набор векторов, которые объясняют наибольший разброс данных в базовом n-мерном векторном пространстве. Компоненты — это те выдающиеся направления, где вариация максимальна. Таким образом, можно выбрать первые несколько направлений с наивысшей вариацией путем подмножества собственных векторов диагональной матрицы на основе вариации (полученной в диагональной матрице).
Новички, пожалуйста, внимательно прочитайте эти источники
- Краткое введение — StatQuest: https://www.youtube.com/watch?v=FgakZw6K1QQ
- Подробно: Массачусетский технологический институт (проф. Стрэнг): https://www.youtube.com/watch?v=rYz83XPxiZo
Главная страница