Матриця Гесе

Матеріал з Вікіпедії — вільної енциклопедії.
(Перенаправлено з Матриця Гессе)
Перейти до навігації Перейти до пошуку

Матриця Гесеквадратна матриця елементами якої є часткові похідні деякої функції. Поняття було введене Людвігом Отто Гесе (1844), який використовував іншу назву. Термін матриця Гесе був введений Джеймсом Джозефом Сильвестром.

Визначення[ред. | ред. код]

Формально, нехай дано дійсну функцію від n змінних:

якщо у функції f існують всі похідні другого порядку, то можна визначити матрицю Гесе для цієї функції:

де тобто

Визначник цієї матриці називається визначником Гесе, або гесіаном.

Значення матриці Гесе пояснюється її появою у формулі Тейлора:

Матриці Гесе використовуються в задачах оптимізації методом Ньютона. Повне обчислення матриці Гесе може бути досить складним, тому були розроблені квазіньютонівські алгоритми, засновані на наближених виразах для матриці Гесе. Найвідоміший з них — алгоритм Бройдена - Флетчера - Гольдфарба - Шанно.

Симетрія матриці Гессе[ред. | ред. код]

Мішані похідні функції f — це елементи матриці Гессе, що стоять не на головній діагоналі. Якщо вони неперервні, то порядок диференціювання не важливий:

Це можна також записати як

В цьому випадку матриця Гесе є симетричною.

Критичні точки функції[ред. | ред. код]

Якщо градієнт (її векторна похідна) рівний нулю в деякій точці , то ця точка називається критичною.

  • Якщо матриця Гесе є додатно визначеною в точці , то — точка локального мінімуму функції .
  • Якщо матриця Гесе є від'ємно визначеною в точці , то — точка локального максимуму функції .
  • Якщо матриця Гесе не є ні додатно визначеною, ні від'ємно визначеною, причому є невиродженою (тобто ), то сідлова точка функції .

Обрамлена матриця Гесе[ред. | ред. код]

У випадку оптимізації з додатковими умовами виникає також поняття обрамленої матриці Гесе. Нехай знову маємо функцію:

але тепер також розглянемо умови:

При оптимізації функції f з додатковими умовами обрамлена матриця Гесе має вигляд:

Для даної матриці можна сформувати різні головні мінори. Позначимо — головний мінор матриці, для якого останнім елементом на головній діагоналі є Тоді можна сформувати достатні умови екстремуму для функції при виконанні обмежень.

Функція буде мати максимум при виконанні умов, якщо знаки послідовних n - m мінорів будуть чергуватися, при чому знак буде рівний

Функція буде мати мінімум при виконанні умов, всі послідовні n - m мінорів мають один знак, а саме

Варіації і узагальнення[ред. | ред. код]

Якщо f — векторзначна функція, тобто

то її другі часткові похідні утворюють не матрицю, а тензор рангу n+1.

Література[ред. | ред. код]

  • Кудрявцев Л.Д. «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с.
  • Chiang, Alpha C., Fundamental Methods of Mathematical Economics, third edition, McGraw-Hill, 1984.
  • Nocedal, Jorge; Wright, Stephen J. (2006), Numerical Optimization (2nd ed.), Berlin, New York: Springer-Verlag, ISBN 978-0-387-30303-1