Рівність змішаних похідних

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Означення[ред.ред. код]

Нехай дано достатньо гладку (скалярну) функцію f багатьох змінних:

(1) \qquad f = f(x_1, x_2, \dots x_n)

Ми можемо взяти частинну похідну цієї функції по одному з аргументів x_i, вважаючи решту аргументів постійними параметрами. В результаті ми одержимо нову функцію:

(2) \qquad \phi(x_i) = {\partial f \over \partial x_i} \bigg|_{x_1,\dots x_{i-1}, x_{i+1}, \dots x_n = const}

Звичайно, ця нова функція теж залежить від решти аргументів, як від параметрів. Тобто чисельне значення \phi в загальному випадку залежить від усіх тих змінних x_1, x_2, \dots x_n, що і оригінальна функція f:

(3) \qquad \phi = \phi(x_1, x_2, \dots x_n)

Якщо функція \phi виявиться досить гладкою, то ми можемо і її продиференціювати, взявши частинну похідну по тому самому, або по іншому аргументу x_j:

(4) \qquad {\partial \phi \over \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i}

Якщо j \ne i, то вираз в правій частині рівності (4) називається мішаною похідною.

Основа теореми[ред.ред. код]

Для достатньо гладкої функції багатьох змінних значення мішаної похідної не залежить від порядку диференціювання:

(5) \qquad {\partial^2 f \over \partial x_i \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i}

Хвіст теореми[ред.ред. код]

Теорема буде не повною, якщо не визначити, що означають слова «достатньо гладка функція».

Я навмисне розділив цю теорему на основу і «хвіст», оскільки ця теорема є базовою в теорії функцій багатьох змінних і широко застосовується в математичній фізиці, теорії диференціальних рівнянь з частинними похідними, диференціальній геометрії. Тому цю теорему доцільно запамятати. Основа теореми досить коротка для запамятовування. Але «хвіст» з поможливості точною вказівкою гладкості не такий короткий як хотілось би.

Будемо уточнювати необхідну міру гладкості поетапно. 1. Для аналітичної функції теорема справедлива. 2. Як побачимо в ході доведення, теорема справедлива і для ширшого класу функцій, які мають в околі точки тільки такі неперервні похідні

(6) \qquad {\partial f \over \partial x_i}, \; {\partial f \over \partial x_j}, \; {\partial^2 f \over \partial x_i \partial x_j}, {\partial^2 f \over \partial x_j \partial x_i}

3. Оскільки для фіксованих індексів i,j всі похідні із переліку (6) беруться при умові, що будь-який третій аргумент x_k є константою, то функція f (а також усі похідні (6)) може бути розривною щодо третіх аргументів. Наприклад, складемо функцію з двох доданків:

f(x_1, x_2, \dots x_n) = \Phi(x_i, x_j) + Z(\dots x_{i-1}, x_{i+1}, \dots x_{j-1}, x_{j+1}, \dots)

де перший доданок є гладкою функцією двох аргументів, а другий доданок розривний у всіх точках.

Подальше уточнення гладкості функції ми будемо робити в ході доведення теореми, і сформулюємо в самому кінці. Перетворення в ході доведення ми робитимемо неспішно, занотовуючи після кожного перетворення курсивом умови на функцію, за яких це перетворення справедливе.

Доведення теореми[ред.ред. код]

Як ми щойно вияснили, для доведення теореми можна не розглядати залежність функції від третіх аргументів. Тому для простоти запису змінимо позначення x_i, x_j на x, y, тобто будемо розглядати таку функцію двох змінних:

(7) \qquad f = f(x, y)

Також для спрощення формул позначатимемо частинні похідні індексами внизу функції:

(8) \qquad f_x(x, y) = {\partial f(x, y) \over \partial x}, \; f_y(x, y) = {\partial f(x, y) \over \partial y}
(8a) \qquad f_{xy} = {\partial^2 f \over \partial x \partial y}, \; f_{yx} = {\partial^2 f \over \partial y \partial x}

Нехай в точці (x, y) існує мішана похідна:

(9) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {f_y(x + \Delta  x, y) - f_y(x, y) \over \Delta x}

Ми припускаємо, що мішана похідна f_{xy} існує в точці (x, y), і заодно існує перша похідна f_y(x, y) вздовж (горизонтальної) прямої y = const

Далі, різниця похідних дорівнює похідній від різниці, тому перетворюємо формулу (9) в:

(10) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} {\partial \over \partial y} \left [ f(x + \Delta x, y) - f(x, y) \right ]

Це перетворення ніяких додаткових умов не накладає, оскільки різниця диференційовних функцій завжди є функцією диференційовною (навпаки було б невірно, бо навіть гладку функцію можна записати у вигляді суми чи різниці двох розривних функцій).

Далі, різницю в квадратних дужках формули (10) можна записати у вигляді визначеного інтеграла від похідної:

(11) \qquad f_{xy} (x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x}  {\partial \over \partial y} \int_x^{x+\Delta x} f_x(\xi, y) d \xi

Потрібно, щоб існувала частинна похідна f_x вздовж прямої y = const

Тепер частинну похідну по ігреку в формулі (11) запишемо згідно з означенням похідної як границі:

(12) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} {1 \over \Delta y} \left ( \int_x^{x + \Delta x} f_x(\xi, y + \Delta y) d \xi - \int_x^{x + \Delta x} f_x(\xi, y) d \xi \right )

Як бачимо, треба щоб частинна похідна f_x існувала не лише на прямій y = const, але в деякому двомірному околі точки (x, y).

Далі, різниця інтегралів дорівнює інтегралу від різниці, до того ж під знак інтеграла можна внести постійний множник {1 \over \Delta y}

(13) \qquad f_{xy} =  \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} d \xi

Це перетворення також не накладає додаткових умов, оскільки різниця інтегровних функцій є функцією інтегровною.

За теоремою Лагранжа, підінтегральний вираз у формулі (13) дорівнює похідній у середній точці:

(14) \qquad {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} = f_{yx}(\xi, \eta)

Середня точка, звичайно, є функцією:

(14a) \qquad \eta = \eta(\xi, \Delta y)

значення якої лежать в інтервалі (якщо наприклад \Delta y > 0)

(14b) \qquad \eta \in \, ]y, y + \Delta y[

Для справедливості (14) потрібно існування мішаної похідної f_{yx} = {\partial^2 f \over \partial y \partial x} в деякому двомірному околі точки (x, y).

Для закінчення доведення нам треба прийняти, що мішана похідна неперервна в точці (x, y) як функція двох змінних. Значення цієї похідної в бизькій точці (\xi, \eta) дорівнює з точністю до наскінченно малого доданка значенню похідної в точці (x, y):

(15) \qquad f_{yx}(\xi, \eta) = f_{yx}(x, y) + o(\xi - x, \eta -y)

Мішана похідна f_{yx} існує в двомірному околі точки (x, y) і неперервна в цій точці як функція двох змінних.

Підставимо (14) і (15) в (13).

(16) \qquad f_{xy} =  \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi

Замітимо, що (хоч і в інших позначенях) формула (16) еквівалентна формулі (13), а тому інтеграл і обидві границі існують. Оскільки підінтегральна функція в (16) інтегровна, а перший доданок f_{yx}(x,y) є константою щодо змінної інтегрування \xi, то другий доданок теж виявляється інтегровним, і ми можемо розбити наш інтеграл на суму двох інтегралів, перший з яких легко береться як інтеграл від константи:

(17) \qquad \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi = \int_x^{x+\Delta x} f_{yx}(x,y) d \xi + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi =
= f_{yx} \Delta x + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi

Після підстановки (17) в (16) ми можемо винести постійний доданок спочатку за межі першої границі, а потім за межі іншої границі:

(18) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \left ( f_{yx}(x,y) \Delta x +  {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \right ) =
= f_{yx}(x, y) + \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi

Покажемо, що другий доданок в останньому виразі формули (18) дорівнює нулю. Візьмемо довільне додатне число \epsilon. Неперервність мішаної похідної f_{yx} в точці (x, y) означає, що існує таке додатне число \delta, що для кожної точки (\xi, \eta) всередині квадрата |\xi - x| < \delta, \; |\eta - y| < \delta справедлива нерівність:

(19) \qquad |o(\xi-x, \eta - y)| = |f_{yx}(\xi, \eta) - f_{yx}(x,y)| < \epsilon

Якщо ми візьмемо додатні числа \Delta x < \delta, \; \Delta y < \delta, то інтеграл в останньому доданку формули (18) оцінюється зверху:

(20) \qquad \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi < \int_x^{x+\Delta x} \epsilon d \xi = \epsilon \Delta x

тому і мусь цей доданок (позначимо його L) оцінюється зверху:

(21) \qquad L = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \le \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \epsilon \Delta x = \epsilon

Аналогічно (якщо взяти -\epsilon < \Delta x < 0), маємо оцінку знизу:

(22) \qquad L \ge -\epsilon

Оскільки додатне число \epsilon може бути як завгодно малим, то з необхідністю слідує L = 0. Теорему доведено.

Закінчення хвоста теореми[ред.ред. код]

Як ми бачимо з нотатків (виділених курсивом) в ході доведення, від функції вимагається існування одної мішаної похідної (наприклад f_{xy}) в точці, а також існування другої мішаної похідної f_{yx} в двомірному околі точки і її неперервність в цій точці. Із цієї умови також слідує існування похідної f_y вздовж відрізка прямої y = const, і існування похідної f_x в двомірному околі точки.

До речі, існування f_{xy} в точці (x, y) слідує з двох фактів: (а) існує похідна f_y вздовж відрізка прямої y = const, що проходить через точку (x, y); (б)мішана похідна f_{yx} існує і неперервна в цій точці.
Це можна помітити переглянувши хід доведення (не поспішати переходити до границі \Delta x \rightarrow 0 аж до формули (18)).

Приклад[ред.ред. код]

Розглянемо функцію

(23) \qquad f(x, y) = xy + y^2 \chi(y)

Де функція Діріхле \chi(y) дорівнює нулю в раціональних точках y={m \over n} і одиниці в ірраціональних. Функція (23) визначена на всій площині; неперервна (як функція двох змінних) вздовж прямої y = 0 і розривна в усіх інших точках площини.
Скрізь існує і неперервна частинна похідна:

(24) \qquad f_x(x, y) = {\partial f \over \partial x} = y

а також одна з мішаних похідних:

(25) \qquad f_{yx}(x, y) = {\partial^2 f \over \partial y \partial x} = 1

Частинна похідна по ігреку існує лише в точках прямої y=0:

(26) \qquad f_y(x, 0) = x

Також в цих же точках прямої існує друга мішана похідна:

(27) \qquad f_{xy}(x, 0) = \lim_{\Delta x \rightarrow 0} {f_y(x+\Delta x, 0) - f_y(x, 0) \over \Delta x} = 1

Як бачимо, для точок прямої y = 0 умови теореми виконуються, і обидві мішані похідні рівні.

Контрприклад[ред.ред. код]

Розглянемо функцію двох змінних x, y

(28) \qquad f(x, y) = {|a x + b y|^3 \over \sqrt{x^2 + y^2}}

де буквами a, b позначені деякі ненульові параметри. Формула (28) задає неперервну функцію всюди на площині за винятком початку координат x=0, \; y=0. Ми можемо довизначити функцію f(x,y) в початку координат

(29) \qquad f(0,0) = 0

Ця довизначена функція буде неперервною також і в початку координат, що можна бачити, представивши формулу (28) в полярній системі координат (і спрямовуючи r \rightarrow 0):

(30) \qquad f(r, \phi) = (a^2+b^2)^{3 \over 2} \, r^2 |\sin(\phi + \phi_0)|^3

Покажемо, що для цієї довизначеної функції f мішані похідні в початку координат існують, але не рівні між собою.

Спочатку обчислимо перші похідні f_x, \, f_y. Як проміжний результат, замітимо, що функція «куб модуля» двічі диференційовна, і її перша та друга похідні обчислюються за формулами:

(31) \qquad {d \over d x} |x|^3 = 3 x |x|
(31a) \qquad {d^2 \over d x^2} |x|^3 = {d \over d x} (3 x |x|) = 6 |x|

Тепер, враховуючи (28) і (31), запишемо перші похідні функції f(x,y) в точці площини, відмінній від початку координат (r = \sqrt{x^2 + y^2}):

(32) \qquad f_x = 3 a {(a x + b y)|a x + b y| \over r} - {x \over r^3} |a x + b y|^3
(33) \qquad f_y = 3 b {(a x + b y)|a x + b y| \over r} - {y \over r^3} |a x + b y|^3

Можна також обчислити перші похідні в початку координат, виходячи з означення похідної:

(32a) \qquad f_x(0, 0) = \lim_{x \rightarrow 0} {f(x, 0) - f(0,0) \over x} = \lim_{x \rightarrow 0} {|ax|^3 \over {x |x|}} = 0

Аналогічно

(33a) \qquad f_y(0, 0) = 0

Перші похідні існують і неперервні на всій площині (x, y).

Перейдемо тепер до обчислення мішаних похідних в початку координат:

(34) \qquad f_xy(0, 0) = \lim_{x \rightarrow 0} {f_y(x, 0) - f_y(0,0) \over x} =  \lim_{x \rightarrow 0} {1 \over x} \left ({3 b a x |a x| \over |x|} \right ) = 3 a b |a|

Аналогічне обчислення дає:

(35) \qquad f_yx(0, 0) = 3 a b |b|

Легко бачити, що формули (34) і (35) дають різні результати, якщо:

(36) \qquad |a| > 0, \; |b| > 0, \; |a| \ne |b|

Причина цієї нерівності в тому, що не виконується умова теореми — обидві мішані похідні (хоча існують скрізь) є розривними в початку координат.

Можна також розглянути функцію

f(x, y) = {x y (x^2 - y^2) \over x^2 + y^2}

Спрощене доведення для аналітичних функцій[ред.ред. код]

Аналітична функція двох змінних (принаймні локально) розкладається в збіжний степеневий ряд:

(37) \qquad f(x, y) = \sum_{n, m = 0}^{\infty} a_{nm} (x - x_0)^n (y - y_0)^m

Як відомо, степенний ряд можна диференціювати почленно в межах його радіуса збіжності. Таким чином знаходимо перші похідні:

(38) \qquad f_x =  \sum_{n, m = 0}^{\infty} n a_{nm} (x - x_0)^{n-1} (y - y_0)^m
(39) \qquad f_y = \sum_{n, m = 0}^{\infty} m a_{nm} (x - x_0)^n (y - y_0)^{m-1}

Повторне диференціювання (38) і (39) дає одну й ту ж формулу для обох мішаних похідних:

(40) \qquad f_{xy} = f_yx = \sum_{n, m = 0}^{\infty} n m a_{nm} (x - x_0)^{n-1} (y - y_0)^{m-1}