Матриця Гессе
Матриця Гессе — квадратна матриця елементами якої є часткові похідні деякої функції. Поняття було введене Людвігом Отто Гессе (1844), який використовував іншу назву. Термін матриця Гессе був введений Джеймсом Джозефом Сильвестром.
Зміст |
[ред.] Визначення
Формально, нехай дано дійсну функцію від n змінних:
якщо у функції f існують всі похідні другого порядку, то можна визначити матрицю Гессе для цієї функції:
де
тобто 
Визначник цієї матриці називається визначником Гессе, або гессіаном.
Значення матриці Гессе пояснюється її появою у формулі Тейлора:
Матриці Гессе використовуються в задачах оптимізації методом Ньютона. Повне обчислення матриці Гессе може бути досить складним, тому були розроблені квазіньютонівські алгоритми, засновані на наближених виразах для матриці Гессе. Найвідоміший з них — алгоритм Бройдена - Флетчера - Гольдфарба - Шанно.
[ред.] Симетрія матриці Гессе
Змішані похідні функції f — це елементи матриці Гессе, що стоять не на головній діагоналі. Якщо вони неперервні, то порядок диференціювання не важливий:
Це можна також записати як
В цьому випадку матриця Гессе є симетричною.
[ред.] Критичні точки функції
Якщо градієнт
(її векторна похідна) рівний нулю в деякій точці
, то ця точка називається критичною.
- якщо матриця Гессе є додатноозначеною в точці
, то
— точка локального мінімуму функції
, - якщо матриця Гессе є від'ємноозначеною в точці
, то
— точка локального максимуму функції
, - якщо матриця Гессе не є ні додатноозначеною ні від'ємноозначеною і невироджена
, то
— сідлова точка функції
.
[ред.] Обрамлена матриця Гессе
У випадку оптимізації з додатковими умовами виникає також поняття обрамленої матриці Гессе. Нехай знову маємо функцію:

але тепер також розглянемо умови:

При оптимізації функції f з додатковими умовами обрамлена матриця Гессе має вигляд:

Для даної матриці можна сформувати різні головні мінори. Позначимо
— головний мінор матриці, для якого останнім елементом на головній діагоналі є
Тоді можна сформувати достатні умови екстремуму для функції при виконанні обмежень.
Функція буде мати максимум при виконанні умов, якщо знаки послідовних n - m мінорів
будуть чергуватися, при чому знак
буде рівний 
Функція буде мати мінімум при виконанні умов, всі послідовні n - m мінорів
мають один знак, а саме 
[ред.] Варіації і узагальнення
Якщо f — векторзначна функція, тобто
то її другі часткові похідні утворюють не матрицю, а тензор рангу n+1.
[ред.] Література
- Кудрявцев Л.Д. «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с.
- Chiang, Alpha C., Fundamental Methods of Mathematical Economics, third edition, McGraw-Hill, 1984.
- Nocedal, Jorge; Wright, Stephen J. (2006), Numerical Optimization (2nd ed.), Berlin, New York: Springer-Verlag, ISBN 978-0-387-30303-1






,
, то 