Матриця (математика)
Матриця | |
Досліджується в | лінійна алгебра і теорія матриць |
---|---|
Підтримується Вікіпроєктом | Вікіпедія:Проєкт:Математика |
Матриця у Вікісховищі |
Ма́триця — математичний об'єкт, записаний у вигляді прямокутної таблиці чисел (чи елементів кільця), він допускає операції (додавання, віднімання, множення та множення на скаляр). Зазвичай, матриці представляються двовимірними (прямокутними) таблицями. Іноді розглядають багатовимірні матриці або матриці непрямокутної форми. У цій статті вони розглядатися не будуть.
Вивченням матриць займається теорія матриць.
Матриці є корисними для запису даних, що залежать від двох категорій, наприклад: для коефіцієнтів систем лінійних рівнянь та лінійних перетворень.
Матрицею розміру (m-на-n,або mn-матрицею) називається множина з елементів , розміщених у вигляді прямокутної таблиці з рядків і стовпців, а і — її розмірністю:
де – елемент матриці; – номер рядка; – номер стовпця.
- при альтернативному позначенні використовуються великі круглі дужки:
- Горизонтальні лінії в матриці звуть рядками, вертикальні — стовпчиками або стовпцями.
- Елемент матриці A, що знаходиться на перетині i-го рядка з j-им стовпчиком, називають i,j-им елементом або (i,j)-им елементом A.
Записують це як чи a[i,j], або, в нотації мови програмування C, A[i][j]
.
Часто пишуть для означення матриці A розмірності n x m, де кожен елемент матриці A[i,j] позначають як aij для всіх 1 ≤ i ≤ n та 1 ≤ j ≤ m.
Матриця є матрицею 4×3. Елемент A[2,3], або дорівнює 7.
Розмір матриці визначає кількість рядків і стовпців, які вона містить. Матрицю із m рядками і n стовпцями називають матрицею m × n або m-на-n матрицею, а самі m і n називають розмірами матриці.
Матриці, які мають лише один рядок називаються векторами-рядками, а ті що мають один стовпець називаються векторами-стовпцями. Матриця з однаковою кількістю рядків і стовпців називається квадратною матрицею. Матриця з нескінченною кількістю рядків або стовпців (або їх обох) називається нескінченною матрицею. Наприклад, в комп'ютерних програмах, іноді зручно розглядати таку матрицю, що не містить рядків чи стовпців, що називається порожньою матрицею.
Назва | Розмір | Приклад | Визначення |
---|---|---|---|
Вектор-рядок | 1 × n | Матриця з одним рядком, іноді використовується для представлення вектора | |
Вектор-стовпець | n × 1 | Матриця з одним стовпцем, іноді використовується для представлення вектора | |
Квадратна матриця | n × n | Матриця з однаковою кількістю рядків і стовпців, іноді використовується для представлення лінійних перетворень у векторному просторі, такі як обертання, відбиття і скіс. |
Дві матриці та називаються рівними , якщо рівні їх відповідні елементи, тобто .
Якщо дано дві матриці m-на-n A і B, можемо визначити їх суму A + B як матрицю m-на-n, що утворюється додаванням відповідних елементів, тобто,
(A + B)[i, j] = A[i, j] + B[i, j]. Наприклад,
- Основні властивості операцій додавання матриць:
- A + B = B + A (комутативність).
- A + (B + C) = (A + B) + C (асоціативність).
- A + 0 = A, для будь-якої матриці. Також, для будь-якої матриці A існує протилежна матриця (-A), така, що A + (-A) = 0.
Якщо дано матрицю A і число c, можемо означити множення на скаляр cA як (cA)[i, j] = cA[i, j]. Наприклад,
З цими двома операціями множина M(m, n, R) усіх матриць m-на-n з дійсними елементами є дійсним векторним простором розмірності mn.
Множення двох матриць має сенс лише тоді, коли число стовпчиків першої матриці дорівнює числу рядків другої матриці. Якщо A — матриця m-на-n (m рядків, n стовпчиків), а B — матриця n-на-p (n рядків, p стовпчиків), їх добуток AB є матрицею m-на-p (m рядків, p стовпчиків), що розраховується за формулою:
- (AB)[i, j] = A[i, 1] * B[1, j] + A[i, 2] * B[2, j] + ... + A[i, n] * B[n, j] для кожної пари i та j, тобто .
Наприклад,
Це множення має такі властивості:
- (AB)C = A(BC) для всіх матриць A розмірності k-на-m, B розмірності m-на-n і C розмірності n-на-p (асоціативність).
- (A + B)C = AC + BC для всіх матриць A і B розмірності m-на-n і матриць C розмірності n-на-k (дистрибутивність).
- C(A + B) = CA + CB для всіх матриць A і B розмірності m-на-n і матриць C розмірності k-на-m (дистрибутивність).
Зауваження: комутативність має місце не завжди: для добутку певних матриць A і B може бути AB ≠ BA.
Матриці називають антикомутативними, якщо AB = −BA. Такі матриці є дуже важливими в представленнях[en] алгебр Лі та в представленнях алгебр Кліффорда.
Транспонування матриці A розміром m-на-n утворює матрицю n-на-m AT (що також позначається як Atr або tA), яка є результатом перевертання рядків у стовпці й навпаки:
- (AT)i,j = Aj,i.
Приклад:
Матрицю можна розбити на блоки (підматриці) з елементів і присвоїти різним блокам імена. При цьому, коли один блок знаходиться під іншим, то ці блоки повинні мати однакове число стовпців. Коли ж два блоки розташовуються поруч, то вони повинні мати однакове число рядків. Дві блокові матриці, розбиті однаково (тобто відповідні блоки мають однакову розмірність).
Для транспонування блокових матриць необхідно транспонувати кожний блок окремо, а потім транспонувати розташування блоків:
.
- Матриці можуть представляти лінійні перетворення, оскільки множення матриць відповідає композиції відображень, як це буде показано далі.
Надалі ототожнюватимемо елементи Rn з множиною рядків або матриць n-на-1. Для кожного лінійного відображення f : Rn -> Rm існує єдина матриця A розмірності m-на-n така, що f(x) = Ax для всіх x з Rn. Кажемо, що матриця A «представляє» лінійне відображення f. Тепер, якщо матриця B розмірності k-на-m представляє інше лінійне відображення g : Rm -> Rk, лінійне відображення g o f представлене матрицею BA. Це випливає з зазначеної вище властивості асоціативності множення матриць.
- Ранг матриці A — це розмірність образа лінійного відображення, представленого матрицею A. Вона збігається з розмірністю простору, згенерованого рядками матриці A, а також із розміром простору, згенерованого стовпчиками матриці A.
- Транспонованою матрицею матриці A розмірності m-на-n є матриця Atr (також іноді позначають як AT або tA) розмірності n-на-m, яку одержують заміною рядків стовпчиками і навпаки, себто Atr[i, j] = A[j, i] для всіх індексів i та j. Якщо A описує лінійне відображення відносно двох базисів, матриця A tr описує транспозицію лінійного відображення відносно дуальних базисів, див. дуальний простір.
Маємо (A + B)tr = Atr + Btr і (AB)tr = Btr * Atr.
У багатьох розділах математики з'являються матриці певної структури. Декілька важливих прикладів:
- Квадратна матриця
- Одинична матриця
- Симетрична матриця — матриця, симетричні елементи яких відносно головної діагоналі (від верхнього лівого до нижнього правого кута) є рівними, себто,
- ai,j = aj,i.
- Нормальна матриця
- Ідеальна матриця
- Унітарна матриця
- Ермітова матриця (або самоспряжена) — матриця, симетричні елементи яких відносно головної діагоналі є комплексно-спряженими один до одного, себто,
- ai,j=a*j,i.
- Стохастичні матриці — квадратні матриці, стовпчики яких є векторами ймовірності[en]; вони застосовуються для означення Марківських ланцюгів.
Матриці використовують для компактного представлення систем лінійних рівнянь і роботи з ними. Наприклад, якщо A є матрицею m-на-n, x позначає вектор стовпець (що є матрицею n×1) n змінних x1, x2, ..., xn, і b є вектором-стовпцем m×1, тоді матричне рівняння
є еквівалентним наступній системі лінійних рівнянь:
Із використанням матриць, це можна розв'язати у більш компактній формі ніж виписувати всі ці рівняння окремо. Якщо n = m а рівняння є незалежними, це можливо зробити записавши
де A−1 є оберненою матрицею для A. Якщо A не має оберненої матриці, розв'язок, якщо такий існує можна знайти за допомогою псевдооберненої матриці.
Матриці й операція множення матриць розкривають свої важливі властивості при застосуванні для лінійних перетворень, що також називають лінійними відображеннями. Дійсна m-на-n матриця A задає лінійне перетворення Rn → Rm і відображає кожен вектор x у Rn у матричний добуток Ax, що в свою чергу є вектором у Rm. Відповідно, кожне лінійне перетворення f: Rn → Rm може здаватися унікальною m-на-n матрицею A: більш детально, (i, j)-входження із A є iю координатою f(ej), де ej = (0,...,0,1,0,...,0) є одиничним вектором зі значенням 1 у jій позиції і 0 в інших позиціях. Говорять, що матриця A задає лінійне відображення f, і A називається матрицею перетворення для f.
Наприклад, матрицю 2×2
можна розглядати як перетворення одиничного квадрату у паралелограм із вершинами у (0, 0), (a, b), (a + c, b + d), і (c, d). Паралелограм зображений праворуч отримано за допомогою множення A на кожний вектор-стовпець і по черзі. Ці вектори задають вершини одиничного квадрату.
Наступна таблиця показує декілька 2-на-2 матриць із відповідними лінійними відображеннями у R2. Початкова синя фігура відображається у зелену сітку і фігуру. Початок координат (0,0) відмічено чорною точкою.
Горизонтальний скіс при m=1.25. | Відбиття відносно вертикальної осі | Відображення стиснення при r=3/2 | Масштабування на коефіцієнт 3/2 | Поворот на кут π/6R = 30° |
Квадратною матрицею називають матрицю з однаковою кількістю рядків і стовпців. Матриця n-на-n є квадратною матрицею порядку n. Будь-які дві квадратні матриці однакового порядку можна додавати й множити. Входження aii утворюють головну діагональ квадратної матриці. Вони знаходяться на уявній лінії, яка проходить від верхнього лівого кута до нижнього правого кута матриці.
Назва Приклад для n = 3 Діагональна матриця Нижньотрикутна матриця Верхньотрикутна матриця
Якщо всі елементи матриці A нижче головної діагоналі дорівнюють нулю, A називають верхньотрикутною матрицею. Аналогічно, якщо всі елементи A вище головної діагоналі дорівнюють нулю, A називають нижньотрикутною матрицею. У випадку, коли всі елементи матриці крім головної діагоналі є нулями, A називають діагональною матрицею.
Одинична матриця In розміром n є матрицею n-на-n в якій всі елементи головної діагоналі дорівнюють 1 а всі інші елементи дорівнюють 0, наприклад,
Це квадратна матриця порядку n, і також це є особливим випадком діагональної матриці. Вона називається діагональною матрицею, оскільки множення на неї залишає матрицю незмінною:
- AIn = ImA = A для будь-якої m-на-n матриці A.
Квадратна матриця A що дорівнює своїй транспонованій матриці, тобто, A = AT, є симетричною матрицею. Якщо замість того, A дорівнює негативній транспонованій матриці, тобто, A = −AT, то A є кососиметричною матрицею. У випадку комплексних матриць, поняття симетрії часто заміняється поняттям Ермітової матриці, що задовольняє умові A∗ = A, де зірочка позначає ермітове-спряження матриці, що є транспонованою комплексною спряженою матриці A.
Відповідно до спектральної теореми, дійсні симетричні матриці і комплексні Ермітові матриці мають власний базис; такий що, кожен вектор можна задати у вигляді лінійної комбінації власних векторів. В обох випадках всі власні значення є дійсними.[2]
Квадратна матриця A називається невиродженою або не-сингулярною якщо існує матриця B, така що
де In n×n є одиничною матрицею із 1-ями на головній діагоналі і 0-ми в інших місцях. Якщо B існує, вона є єдиною і називається оберненою матрицею для A, і позначається як A−1.
Додатноозначена матриця | Невизначена матриця |
---|---|
Q(x,y) = 1/4 x2 + y2 | Q(x,y) = 1/4 x2 − 1/4 y2 |
Точки при яких Q(x,y)=1 (Еліпс). |
Точки при яких Q(x,y)=1 (Гіпербола). |
Симетрична n×n-матриця A називається додатноозначеною якщо для всіх не нульових векторів x ∈ Rn відповідна квадратична форма, що задається як
- f(x) = xTA x
утворює в результаті лише додатні значення для будь-якого вхідного вектору x. Якщо f(x) приводить до утворення лише від'ємних значень тоді A є від'є́мно ви́значеною; якщо f утворює як додатні, так і від'ємні значення, тоді A є невизначеною.[5] Якщо квадратична форма f породжує лише не-від'ємні значення (додатні або нуль), симетрична матриця називається додатно напіввизначеною. Таблиця праворуч показує два варіанти для матриць 2-на-2.
Якщо в якості входів задати два різні вектори буде отримана білінійна форма, що пов'язана з A:
- BA (x, y) = xTAy.[6]
Ортогональна матриця це квадратна матриця із дійсними елементами, чиї стовпці і рядки є ортогональними одиничними векторами (тобто, ортонормованими векторами). Це рівносильно тому, що матриця A є ортогональною якщо її транспонована матриця дорівнює її оберненій матриці:
що тягне за собою
де I є одиничною матрицею розміром n.
Слід, tr(A) квадратної матриці A є сумою елементів її діагоналі. Хоча операція множення не є комутативною, слід добутку двох матриць не залежить від порядку операцій:
- tr(AB) = tr(BA).
Це випливає прямо з визначення операції множення матриць:
Також, слід матриці буде дорівнювати сліду її транспонованої матриці, тобто,
- tr(A) = tr(AT).
Визначник (визначник) det(A) або |A| квадратної матриці A, що визначає деякі властивості матриці. Матриця є невиродженою, тоді й тільки тоді, коли її детермінант не є нульовим. Його абсолютне значення дорівнює площі (у R2) або об'єму (у R3) відображення одиничного квадрата (або куба), а його знак відповідає орієнтації відповідного лінійного відображення: визначник є додатним тоді, й тільки тоді, коли орієнтація зберігається.
Визначник матриці 2×2 дорівнює:
Детермінант матриці 3×3 матиме 6 термів (Правило Саррюса). Більш складна Формула Лейбніца узагальнює ці дві формули до всіх вимірів.[7]
Визначник добутку квадратних матриць дорівнює добутку їх визначників:
- det(AB) = det(A) · det(B).[8]
Додавання до рядка іншого рядка помноженого на деяке значення, або додавання стовпця до іншого стовпця, не змінює детермінанта матриці. Заміна місцями двох рядків або стовпців приводить до зміни знаку визначника, тобто множення його на −1.[9] Використовуючи ці операції, можна звести будь-яку матрицю до нижньої (або верхньої) трикутної матриці, а для таких матриць визначник буде дорівнювати добутку елементів головної діагоналі; що є методом розрахунку визначника будь-якої матриці. З рештою, розклад Лапласа дозволяє виразити визначник через мінори, тобто, детермінанти менших матриць.[10] Це розкладання можна використовувати для рекурсивного визначення визначника, що можна розглядати як рівнозначний до формули Лейбніца. Визначник використовується для розв'язання систем лінійних рівнянь за допомогою методу Крамера.[11]
Якщо взяти кільце R, можемо розглядати множину M(m,n, R) усіх матриць m на n з елементами з R. Додавання та множення цих матриць може бути означене, як у випадку дійсних чи комплексних матриць. Множина M(n, R) усіх квадратних матриць n на n над кільцем R сама є кільцем, ізоморфним до кільця ендоморфізмів правого R-модуля Rn.
Також, якщо елементи беруться з напівкільця S, додавання та множення матриць можна означити звичайним чином. Множина всіх квадратних матриць n×n над S сама є напівкільцем. Зважте на те, що алгоритми множення матриць, такі як алгоритм Штрассена, взагалі застосовні лише до матриць над кільцями і не працюють для матриць над напівкільцями, що не є кільцями.
Якщо R є комутативним кільцем, тоді M(n, R) є унітарною асоціативною алгеброю над R. Також має сенс означити детермінант квадратних матриць, застосовуючи формулу Лейбніца. Матриця має обернену тоді й лише тоді, коли її визначник як елемент R має обернений елемент в R.
Усі твердження цієї статті для дійсних та комплексних матриць справджуються і для матриць над довільним полем.
Матриці над кільцем поліномів є важливими у вивченні теорії керування.
Вивчати матриці почали досить давно. Латинські квадрати та магічні квадрати були відомі ще в доісторичні часи.
Китайський текст «Математика в дев'яти книгах» (написаний ще до нашої ери) містить приклади використання матриць для розв'язання системи рівнянь, включно з поняттям визначника, ще задовго до введення визначників японським математиком Такакадзу Секі (1683) та німецьким математиком Лейбніцем (1693). Крамер розвинув цю теорію, увівши правило Крамера 1750 р. Карл Фрідріх Ґаус та Вільгельм Йордан розробили метод Ґауса — Йордана, який полягає в знаходженні оберненої матриці (1800).
Термін «матриця» уперше було запроваджено 1848 р. Дж. Дж. Сильвестром. Кейлі, Гамільтон, Ґрассман, Фробеніус, фон Нойман. Інші видатні математики також зробили свій внесок у теорію матриць.
- Теорія матриць
- Лінійна алгебра
- Вектор
- Мінор матриці
- Алгебраїчне доповнення
- Загальна лінійна група
- Матрична функція
- Матриця одиниць
- Вступ до лінійної алгебри: матриці та дії з ними. Лекція 1 на YouTube, М. Іоргов (Інститут теоретичної фізики НАН України) (укр.)
- Вступ до лінійної алгебри: матриці та дії з ними. Лекція 2 на YouTube, М. Іоргов (Інститут теоретичної фізики НАН України) (укр.)
- Гантмахер Ф. Р. Теорія матриць. — 2024. — 400+ с.(укр.)
- Р.Беллман. Введение в теорию матриц. — М: : Наука, 1969. — 368 с.(рос.)
- Ланкастер П. . Теория матриц. — 2. — Москва : Наука, 1982. — 272 с.(рос.)
- Р.Хорн , Ч.Джонсон . Матричный анализ. — М: : Мир, 1989. — 653 с.(рос.)
- Gene H. Golub , Charles F. Van Loan . Matrix Computations. — 4. — М: : The Johns Hopkins University Press, 2013. — 756 с.(англ.)
- Матриці, дії над матрицями // Вища математика в прикладах і задачах / Клепко В.Ю., Голець В.Л.. — 2-ге видання. — К. : Центр учбової літератури, 2009. — С. 5-7. — 594 с.
- Узагальнена еквівалентність матриць і їх наборів та факторизація матриць над кільцями : монографія / В. М. Петричкович ; НАН України, Ін-т приклад. проблем механіки і математики ім. Я. С. Підстригача. – Львів : ІППММ, 2015. – 312 с. – Бібліогр.: с. 285-311 (245 назв). – ISBN 978-96-02-7619-2
- ↑ Brown 1991, I.2.21 and 22
- ↑ Horn & Johnson 1985, Theorem 2.5.6
- ↑ Brown 1991, Definition I.2.28
- ↑ Brown 1991, Definition I.5.13
- ↑ Horn & Johnson 1985, Chapter 7
- ↑ Horn & Johnson 1985, Example 4.0.6, p. 169
- ↑ Brown 1991, Definition III.2.1
- ↑ Brown 1991, Theorem III.2.12
- ↑ Brown 1991, Corollary III.2.16
- ↑ Mirsky 1990, Theorem 1.4.1
- ↑ Brown 1991, Theorem III.3.18