Метод найменших квадратів
Метод найменших квадратів — метод знаходження наближеного розв'язку надлишково-визначеної системи. Часто застосовується в регресійному аналізі. На практиці найчастіше використовується лінійний метод найменших квадратів, що використовується у випадку системи лінійних рівнянь. Зокрема важливим застосуванням у цьому випадку є оцінка параметрів у лінійній регресії, що широко застосовується у математичній статистиці і економетриці.
Зміст |
Лінійний випадок [ред.]
Одна незалежна змінна [ред.]
Нехай маємо лінійну регресію зі скалярною змінною x:
а також вибірку початкових даних
розміру M. Тоді
Множинна регресія (випадок багатьох незалежних змінних) [ред.]
Для надлишково-визначеної системи m лінійних рівнянь з n невідомими 
чи в матричній формі запису:
зазвичай не існує точного розв'язку, і потрібно знайти такі β, які мінімізують наступну норму:
Такий розв'язок завжди існує і він є єдиним:
хоч дана формула не є ефективною через необхідність знаходити обернену матрицю.
Виведення формули [ред.]
Значення
досягає мінімуму в точці в якій похідна по кожному параметру рівна нулю. Обчислюючи ці похідні одержимо:
де використано позначення 
Також виконуються рівності:
Підставляючи вирази для залишків і їх похідних одержимо рівність:
Дану рівність можна звести до вигляду:
або в матричній формі:
Числові методи для обчислення розв'язку [ред.]
Якщо матриця
є невиродженою та додатноозначеною, тобто має повний ранг, тоді система може бути розв'язана за допомогою розкладу Холецького
, де
— верхня трикутна матриця.
Розв'язок отримаємо в два кроки:
- Отримаємо
з рівняння 
- Підставимо і отримаємо
з 
В обох випадках використовуються властивості трикутної матриці.
Статистичні властивості [ред.]
Одним із найважливіших застосувань лінійного МНК є оцінка параметрів лінійної регресії. Для заданого набору даних
будується модель:
або в матричній формі:
де:
В цих формулах
— вектор параметрів, які оцінюються, наприклад, за допомогою методу найменших квадратів, а
— вектор випадкових змінних.
У класичній моделі множинної лінійної регресії приймаються такі умови:
- тобто випадкові змінні є гомоскедастичними і між ними відсутня будь-яка залежність.
- Ранг матриці X рівний p + 1, тобто між пояснюючими змінними відсутня лінійна залежність.
Для такої моделі оцінка
одержана методом найменших квадратів володіє властивостями:
- Незміщеність. Оцінка
є незміщеною, тобто
Справді:
- Коваріаційна матриця оцінки
рівна:
![\operatorname{Var}[\, \hat\beta \,] = \sigma^2(X'X)^{-1}.](//upload.wikimedia.org/math/e/d/7/ed738a03e5a48d1f5bd867008835c3f5.png)
- Це випливає з того, що
і
-
- Ефективність. Згідно з теоремою Гауса — Маркова оцінка, що одержана МНК, є найкращою лінійною незміщеною оцінкою.
- Змістовність. При доволі слабких обмеженнях на матрицю X метод найменших квадратів є змістовним, тобто при збільшенні розміру вибірки, оцінка за імовірністю прямує до точного значення параметру. Однією з достатніх умов є наприклад прямування найменшого власного значення матриці
до безмежності при збільшенні розміру вибірки. - Якщо додатково припустити нормальність змінних
то оцінка МНК має розподіл:
В математичному моделюванні [ред.]
Нехай ми маємо вибірку початкових даних
. Функція
— невідома.
Якщо ми знаємо приблизний вигляд функції
, то задамо її у вигляді функціоналу
, де
— невідомі константи.
Нам потрібно мінімізувати відмінності між
та
. Для цього беруть за міру суму квадратів різниць значень цих функцій у всіх точках
і її мінімізують (тому метод так і називається):
Коефіцієнти
в яких така міра мінімальна знаходять з системи:
Джерела [ред.]
- Лоусон Ч., Хенсон Р. Численное решение задач методом наименьших квадратов. — М.: Наука, 1986.
- Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-е изд., испр. — Т. 2: Айвазян С А. Основы эконометрики. — М.: ЮНИТИ- ДАНА, 2001. - 432 с. ISBN 5-238-00305-6
- Björck, Åke (1996). Numerical methods for least squares problems. Philadelphia: SIAM. ISBN 0-89871-360-9.
- Greene, William H. (2002). Econometric analysis (5th ed.). New Jersey: Prentice Hall












з рівняння 




![\operatorname{E}[\,\varepsilon_i] = 0.](http://upload.wikimedia.org/math/e/1/a/e1aae866180c640637d33fd817e71e6e.png)
![\operatorname{E}[\,\varepsilon_i \varepsilon_j] = \begin{cases}\sigma^2 & i = j \\ 0 & i \neq j \end{cases}](http://upload.wikimedia.org/math/7/6/c/76c7384742d5519e8792df3d07e4d62c.png)
Справді:![\operatorname{E}[\,\hat\beta] = \operatorname{E}\Big[(X'X)^{-1}X'(X\beta+\varepsilon)\Big] = \beta + \operatorname{E}\Big[(X'X)^{-1}X'\varepsilon\Big] = \beta + \Big[(X'X)^{-1}X'\varepsilon\Big]\operatorname{E}(\varepsilon) =\beta](http://upload.wikimedia.org/math/e/b/c/ebc6625c2251fd52805cec63deac89a1.png)
![\operatorname{Var}[\, \hat\beta \,] = \sigma^2(X'X)^{-1}.](http://upload.wikimedia.org/math/e/d/7/ed738a03e5a48d1f5bd867008835c3f5.png)
і

до безмежності при збільшенні розміру вибірки.
то оцінка МНК має розподіл:

