ПРОИЗВОДНЫЕ РАСЧЕТА
Значение производной
Процесс поиска критических ценностей
После публикаций по теории производных мы начнем знакомиться с некоторыми приложениями, которые делают этот метод одним из самых важных в математике и, следовательно, в машинном обучении.
Максимум и минимум функции
Теорема о локальном максимуме, которую мы уже ввели, может быть экстраполирована на всю функциональную область.
Пусть f будет функцией, а A - набором чисел, содержащихся в домене f. Точка x в A является максимальной точкой для f на A, если f (x) ≥f (y) для каждого y в A. Само число f (x) называется максимальным значением для f на A .
Обратите внимание, что для одной и той же функции может быть несколько точек максимума при различных значениях x. Определение точки минимума получается путем инвертирования предыдущего определения, соответственно заменяя f (x) ≥f (y) на f (x) ≤f (y).
Деривативы в точках максимума и минимума
Как и следовало ожидать, точки максимума и минимума всегда будут изменением производной функции, что позволяет нам продемонстрировать, что:
Пусть f - любая функция, определенная на (a, b). Если f является максимальной или минимальной точкой для f на (a, b), а f является дифференцируемым при x, тогда f '(x) = 0.
Локальные максимумы и минимумы
Пусть f будет функцией, а A - набором чисел, содержащимся в домене f. Точка x в A - это локальный максимум [minumum] для f на A из есть некоторое δ ›0 такое, что x является максимумом [minumum] точка для f на A ⋂ (x-δ, x + δ).
Критические точки
Не все x, из которых f ’(x) = 0, будут максимальными или минимальными, это типы критических точек:
критическая точка функции f - это число x такое, что f '(x) = 0. Число f (x) называется критическим значением f.
Чтобы найти максимальное и минимальное значение f, мы должны проверить следующие значения:
- Критические точки f в [a, b].
- Конечные точки a и b.
- Точки x в [a, b] такие, что f не дифференцируется в.
Некоторые важные теоремы для обнаружения критических точек
Теорема Ролля
Если f непрерывен на [a, b] и дифференцируем на (a, b) и f (a) = f (b), тогда в (a, b) есть число x такое, что f '(x) = 0 .
Это может привести к постоянной функции или к функции, которая изменяет градиент между обоими значениями, поэтому f ’(x) = 0.
Теорема о среднем значении
Теорема Ролля позволяет продемонстрировать следующее:
Если f непрерывен на [a, b] и дифференцируем на (a, b), то существует число x в (a, b) так, что
Классификация критических точек
Возрастающие и убывающие функции
Функция f увеличивается на интервале, если f (a) ‹f (b), когда a и be - два числа в интервале с a‹ b . Функция f убывает на интервале, если f (a) ›f (b) для всех a и b в интервале с a‹ b .
Вторые производные для классификации критических точек
Теперь мы знаем, как найти критическую точку с помощью первой производной и проверить их тип, используя значения левой и правой производной, мы можем использовать вторую производную, чтобы пропустить вычисления бокового предела.
Предположим, f ’(a) = 0. Если f ’’ (a) ›0, тогда f имеет локальный минимум в a; если f ’’ (a) ‹0, nf имеет локальный максимум в a.
Две сильные теоремы упрощения
Теорема Коши о среднем значении
Если f и g непрерывны на [a, b] и различаются на (a, b), то существует такое число x, что [f (b) -f (a)] g '(x) = [g (b) -g (a)] f' (x) .
Если g (b) ≠ g (a) и g ’(x) ≠ 0, это можно записать как:
Правило L’Hôpital
Заключение
В этом посте мы рассказали, как использовать производные для поиска локальных максимумов и минимумов, они позволяют нам находить возможные решения для оптимизации нашей функции затрат. Это позволит нам легче определить градиент.
Это двадцать седьмой пост из моего конкретного # 100daysofML, я буду публиковать достижения в этой задаче на GitHub, Twitter и Medium (Adrià Serra).