Векторы — перспектива машинного обучения

Векторы обычно используются в машинном обучении, поскольку они предоставляют удобный способ организации данных. Практически нет моделей машинного обучения, в которых векторы не используются на каком-то этапе жизненного цикла проекта. Часто одним из самых первых шагов в создании модели машинного обучения является векторизация данных.

Что такое Вектор?

Физическая перспектива. Векторы представляют собой стрелки, указывающие в пространстве. То, что определяет вектор, — это длина и направление, на которое он указывает. Векторы на плоскости являются двумерными, а векторы в широком пространстве — трехмерными.

Перспектива информатики. Векторы представляют собой упорядоченный список чисел. Если длина списка равна 2, то вектор является двумерным.

Математическая перспектива. Векторы — это объекты, которые имеют как величину, так и направление. Величина определяет размер вектора. Он представлен линией со стрелкой, где длина линии является величиной вектора, а стрелка указывает направление. Он также известен как евклидов вектор, геометрический вектор, пространственный вектор или просто вектор.

Особенности векторной алгебры

Именно Вектор – это структура данных, состоящая как минимум из двух компонентов, в отличие от скаляра. Скаляры — это просто числа. Мы можем думать о них как о любом обычном значении, которое мы используем.

Координаты вектора – это пара чисел, которые, по сути, дают инструкции о том, как перейти от хвоста этого вектора в начале координат к его вершине. В векторе каждая координата является скаляром.

Сложение векторов и масштабирование

Линейная комбинация означает сложение векторов вместе. Промежуток векторов – это set всех линейных комбинаций векторов.

Линейная комбинация V, W, U равнаaV+bW+cU

Размах этих векторов — это множество всех возможных линейных комбинаций

Три свободно меняющихся скаляра приведут к доступу к полному трехмерному пространству.

Один из векторов может быть выражен как линейная комбинация другого, тогда он будет линейно зависимым.

u=aV+bW

Если каждый вектор добавляет еще одно измерение к диапазону, то они являются линейно независимыми.

W!= aV (для всех значений a)

Основа векторного пространства – это набор линейно независимых векторов, охватывающих все пространство.

Скалярное произведение векторов

Скалярное произведение двух векторов A и B проецирует w на прямую, проходящую через начало координат и вершину вектора A.

A · B= |A| × |B| × потому что (θ)

Скалярный продукт = (длина проекции A) * (длина проекции B)

  • 2 вектора указывают в одном направлении, скалярное произведение положительно
  • 2 вектора перпендикулярны, то скалярное произведение равно нулю
  • 2 вектора направлены в разные стороны, то скалярное произведение отрицательно

Скалярный продукт дает скаляр в качестве вывода. Порядок векторов в скалярных произведениях не имеет значения.

Перекрестное произведение векторов

Перекрестное произведение двух векторов — это третий вектор, перпендикулярный двум исходным векторам. Его величина определяется площадью параллелограмма между ними, а его направление можно определить по правилу большого пальца правой руки. Перекрестное произведение двух векторов также известно как векторное произведение, поскольку результирующая перекрестного произведения векторов является векторной величиной. Перекрестное произведение равно нулю, когда векторы a и b указывают в одном или противоположном направлении, и достигает максимальной длины, когда векторы a и b находятся под прямым углом

А х В= |А| |Б| грех θ

Перекрестное произведение дает вектор в качестве вывода

Косинус сходства

Подобие косинуса измеряет косинус угла между двумя ненулевыми векторами пространства внутреннего произведения. Это измерение сходства особенно касается ориентации, а не величины. 2 вектора косинуса, выровненные в одной и той же ориентации, будут иметь меру подобия 1, тогда как два вектора, выровненные перпендикулярно, будут иметь сходство 0. Если два вектора диаметрально противоположны, то есть они ориентированы в точно противоположных направлениях, то измерение подобия равно -1.

Нормализация вектора

Векторы имеют величины, и разные векторы могут иметь разные размеры. Иногда нас не волнует размер вектора, а интересует только направление. Если нас вообще не волнует величина, мы можем просто сделать каждый вектор одинакового размера. Мы делаем это, деля каждый вектор на его величину, таким образом делая каждый вектор величиной 1, или преобразовывая их в единичный вектор.

Векторная алгебра в машинном обучении

  1. Машины не могут читать текст или смотреть на изображения, как это делаем мы. Им нужен ввод для преобразования или кодирования в числа. Векторы и матрицы представляют входные данные, такие как текст и изображения, в виде чисел, чтобы мы могли обучать и развертывать наши модели.
  2. Целью большинства проектов машинного обучения является создание модели, выполняющей какую-либо функцию. В моделях глубокого обучения это достигается с помощью нейронной сети, где слои нейронной сети используют линейную алгебру (например, умножение матриц и векторов) для настройки ваших параметров. Именно здесь математическое определение векторов актуально для ML. Это включает в себя понимание векторных пространств и того, почему они важны для машинного обучения.
  3. Результатом модели ML может быть ряд различных сущностей в зависимости от нашей цели, а также может быть вектор. Например, модели НЛП принимают текст, а затем выводят вектор (называемый встраиванием), представляющий предложение. Затем вы можете использовать этот вектор для выполнения ряда операций или в качестве входных данных для другой модели. Среди операций, которые вы можете выполнять, — кластеризация похожих предложений вместе в векторном пространстве или поиск сходства между разными предложениями с помощью таких операций, как косинусное сходство.
  4. Уменьшение размерности — это преобразование данных высокой размерности в данные меньшей размерности при сохранении большей части информации в данных. Это позволяет нам работать с большими наборами данных и определять наиболее важные функции данных.

Математическое определение вектора является ключом к тому, что происходит под капотом наших алгоритмов машинного обучения.

Рекомендации