ПРОИЗВОДНЫЕ РАСЧЕТА

Значение производной

Процесс поиска критических ценностей

После публикаций по теории производных мы начнем знакомиться с некоторыми приложениями, которые делают этот метод одним из самых важных в математике и, следовательно, в машинном обучении.

Максимум и минимум функции

Теорема о локальном максимуме, которую мы уже ввели, может быть экстраполирована на всю функциональную область.

Пусть f будет функцией, а A - набором чисел, содержащихся в домене f. Точка x в A является максимальной точкой для f на A, если f (x) ≥f (y) для каждого y в A. Само число f (x) называется максимальным значением для f на A .

Обратите внимание, что для одной и той же функции может быть несколько точек максимума при различных значениях x. Определение точки минимума получается путем инвертирования предыдущего определения, соответственно заменяя f (x) ≥f (y) на f (x) ≤f (y).

Деривативы в точках максимума и минимума

Как и следовало ожидать, точки максимума и минимума всегда будут изменением производной функции, что позволяет нам продемонстрировать, что:

Пусть f - любая функция, определенная на (a, b). Если f является максимальной или минимальной точкой для f на (a, b), а f является дифференцируемым при x, тогда f '(x) = 0.

Локальные максимумы и минимумы

Пусть f будет функцией, а A - набором чисел, содержащимся в домене f. Точка x в A - это локальный максимум [minumum] для f на A из есть некоторое δ ›0 такое, что x является максимумом [minumum] точка для f на A ⋂ (x-δ, x + δ).

Критические точки

Не все x, из которых f ’(x) = 0, будут максимальными или минимальными, это типы критических точек:

критическая точка функции f - это число x такое, что f '(x) = 0. Число f (x) называется критическим значением f.

Чтобы найти максимальное и минимальное значение f, мы должны проверить следующие значения:

  • Критические точки f в [a, b].
  • Конечные точки a и b.
  • Точки x в [a, b] такие, что f не дифференцируется в.

Некоторые важные теоремы для обнаружения критических точек

Теорема Ролля

Если f непрерывен на [a, b] и дифференцируем на (a, b) и f (a) = f (b), тогда в (a, b) есть число x такое, что f '(x) = 0 .

Это может привести к постоянной функции или к функции, которая изменяет градиент между обоими значениями, поэтому f ’(x) = 0.

Теорема о среднем значении

Теорема Ролля позволяет продемонстрировать следующее:

Если f непрерывен на [a, b] и дифференцируем на (a, b), то существует число x в (a, b) так, что

Классификация критических точек

Возрастающие и убывающие функции

Функция f увеличивается на интервале, если f (a) ‹f (b), когда a и be - два числа в интервале с a‹ b . Функция f убывает на интервале, если f (a) ›f (b) для всех a и b в интервале с a‹ b .

Вторые производные для классификации критических точек

Теперь мы знаем, как найти критическую точку с помощью первой производной и проверить их тип, используя значения левой и правой производной, мы можем использовать вторую производную, чтобы пропустить вычисления бокового предела.

Предположим, f ’(a) = 0. Если f ’’ (a) ›0, тогда f имеет локальный минимум в a; если f ’’ (a) ‹0, nf имеет локальный максимум в a.

Две сильные теоремы упрощения

Теорема Коши о среднем значении

Если f и g непрерывны на [a, b] и различаются на (a, b), то существует такое число x, что [f (b) -f (a)] g '(x) = [g (b) -g (a)] f' (x) .

Если g (b) ≠ g (a) и g ’(x) ≠ 0, это можно записать как:

Правило L’Hôpital

Заключение

В этом посте мы рассказали, как использовать производные для поиска локальных максимумов и минимумов, они позволяют нам находить возможные решения для оптимизации нашей функции затрат. Это позволит нам легче определить градиент.

Это двадцать седьмой пост из моего конкретного # 100daysofML, я буду публиковать достижения в этой задаче на GitHub, Twitter и Medium (Adrià Serra).

Https://twitter.com/CrunchyML