Очікує на перевірку

Матриця (математика)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Матриця
Зображення
Досліджується в лінійна алгебра і теорія матриць
Підтримується Вікіпроєктом Вікіпедія:Проєкт:Математика
CMNS: Матриця у Вікісховищі

Ма́триця — математичний об'єкт, записаний у вигляді прямокутної таблиці чисел (чи елементів кільця), він допускає операції (додавання, віднімання, множення та множення на скаляр). Зазвичай, матриці представляються двовимірними (прямокутними) таблицями. Іноді розглядають багатовимірні матриці або матриці непрямокутної форми. У цій статті вони розглядатися не будуть.

Вивченням матриць займається теорія матриць.

Матриці є корисними для запису даних, що залежать від двох категорій, наприклад: для коефіцієнтів систем лінійних рівнянь та лінійних перетворень.

Означення та нотація

[ред. | ред. код]

Матрицею розміру (m-на-n,або mn-матрицею) називається множина з елементів , розміщених у вигляді прямокутної таблиці з рядків і стовпців, а і — її розмірністю:

де – елемент матриці; – номер рядка; – номер стовпця.

при альтернативному позначенні використовуються великі круглі дужки:
  • Горизонтальні лінії в матриці звуть рядками, вертикальні — стовпчиками або стовпцями.
  • Елемент матриці A, що знаходиться на перетині i-го рядка з j-им стовпчиком, називають i,j-им елементом або (i,j)-им елементом A.

Записують це як чи a[i,j], або, в нотації мови програмування C, A[i][j].

Часто пишуть для означення матриці A розмірності n x m, де кожен елемент матриці A[i,j] позначають як aij для всіх 1 ≤ in та 1 ≤ jm.

Приклад

[ред. | ред. код]

Матриця     є матрицею 4×3. Елемент A[2,3], або дорівнює 7.

Розмір

[ред. | ред. код]

Розмір матриці визначає кількість рядків і стовпців, які вона містить. Матрицю із m рядками і n стовпцями називають матрицею m × n або m-на-n матрицею, а самі m і n називають розмірами матриці.

Матриці, які мають лише один рядок називаються векторами-рядками, а ті що мають один стовпець називаються векторами-стовпцями. Матриця з однаковою кількістю рядків і стовпців називається квадратною матрицею. Матриця з нескінченною кількістю рядків або стовпців (або їх обох) називається нескінченною матрицею. Наприклад, в комп'ютерних програмах, іноді зручно розглядати таку матрицю, що не містить рядків чи стовпців, що називається порожньою матрицею.

Назва Розмір Приклад Визначення
Вектор-рядок 1 × n Матриця з одним рядком, іноді використовується для представлення вектора
Вектор-стовпець n × 1 Матриця з одним стовпцем, іноді використовується для представлення вектора
Квадратна матриця n × n Матриця з однаковою кількістю рядків і стовпців, іноді використовується для представлення лінійних перетворень у векторному просторі, такі як обертання, відбиття і скіс.

Дії над матрицями

[ред. | ред. код]

Операція порівняння

[ред. | ред. код]

Дві матриці та називаються рівними , якщо рівні їх відповідні елементи, тобто .

Додавання

[ред. | ред. код]

Якщо дано дві матриці m-на-n A і B, можемо визначити їх суму A + B як матрицю m-на-n, що утворюється додаванням відповідних елементів, тобто,
(A + B)[i, j] = A[i, j] + B[i, j]. Наприклад,

Основні властивості операцій додавання матриць:
  • A + B = B + A (комутативність).
  • A + (B + C) = (A + B) + C (асоціативність).
  • A + 0 = A, для будь-якої матриці. Також, для будь-якої матриці A існує протилежна матриця (-A), така, що A + (-A) = 0.

Множення на скаляр

[ред. | ред. код]

Якщо дано матрицю A і число c, можемо означити множення на скаляр cA як (cA)[i, j] = cA[i, j]. Наприклад,

З цими двома операціями множина M(m, n, R) усіх матриць m-на-n з дійсними елементами є дійсним векторним простором розмірності mn.

Множення матриць

[ред. | ред. код]
Докладніше: Множення матриць
Схематичне зображення добутку AB двох матриць A і B.

Множення двох матриць має сенс лише тоді, коли число стовпчиків першої матриці дорівнює числу рядків другої матриці. Якщо A — матриця m-на-n (m рядків, n стовпчиків), а B — матриця n-на-p (n рядків, p стовпчиків), їх добуток AB є матрицею m-на-p (m рядків, p стовпчиків), що розраховується за формулою:

(AB)[i, j] = A[i, 1] * B[1, j] + A[i, 2] * B[2, j] + ... + A[i, n] * B[n, j] для кожної пари i та j, тобто .

Наприклад,

Це множення має такі властивості:

  • (AB)C = A(BC) для всіх матриць A розмірності k-на-m, B розмірності m-на-n і C розмірності n-на-p (асоціативність).
  • (A + B)C = AC + BC для всіх матриць A і B розмірності m-на-n і матриць C розмірності n-на-k (дистрибутивність).
  • C(A + B) = CA + CB для всіх матриць A і B розмірності m-на-n і матриць C розмірності k-на-m (дистрибутивність).

Зауваження: комутативність має місце не завжди: для добутку певних матриць A і B може бути AB ≠ BA.

Матриці називають антикомутативними, якщо AB = −BA. Такі матриці є дуже важливими в представленнях[en] алгебр Лі та в представленнях алгебр Кліффорда.

Транспонування

[ред. | ред. код]

Транспонування матриці A розміром m-на-n утворює матрицю n-на-m AT (що також позначається як Atr або tA), яка є результатом перевертання рядків у стовпці й навпаки:

(AT)i,j = Aj,i.

Приклад:

Розбиття

[ред. | ред. код]
Докладніше: Блочна матриця

Матрицю можна розбити на блоки (підматриці) з елементів і присвоїти різним блокам імена. При цьому, коли один блок знаходиться під іншим, то ці блоки повинні мати однакове число стовпців. Коли ж два блоки розташовуються поруч, то вони повинні мати однакове число рядків. Дві блокові матриці, розбиті однаково (тобто відповідні блоки мають однакову розмірність).

Для транспонування блокових матриць необхідно транспонувати кожний блок окремо, а потім транспонувати розташування блоків:

.

Лінійні перетворення, ранг і транспонування

[ред. | ред. код]

Надалі ототожнюватимемо елементи Rn з множиною рядків або матриць n-на-1. Для кожного лінійного відображення f : Rn -> Rm існує єдина матриця A розмірності m-на-n така, що f(x) = Ax для всіх x з Rn. Кажемо, що матриця A «представляє» лінійне відображення f. Тепер, якщо матриця B розмірності k-на-m представляє інше лінійне відображення g : Rm -> Rk, лінійне відображення g o f представлене матрицею BA. Це випливає з зазначеної вище властивості асоціативності множення матриць.

  • Ранг матриці A — це розмірність образа лінійного відображення, представленого матрицею A. Вона збігається з розмірністю простору, згенерованого рядками матриці A, а також із розміром простору, згенерованого стовпчиками матриці A.

Маємо (A + B)tr = Atr + Btr і (AB)tr = Btr * Atr.

Спеціальні види матриць

[ред. | ред. код]
Докладніше: Перелік матриць

У багатьох розділах математики з'являються матриці певної структури. Декілька важливих прикладів:

ai,j = aj,i.
ai,j=a*j,i.

Лінійні рівняння

[ред. | ред. код]

Матриці використовують для компактного представлення систем лінійних рівнянь і роботи з ними. Наприклад, якщо A є матрицею m-на-n, x позначає вектор стовпець (що є матрицею n×1) n змінних x1, x2, ..., xn, і b є вектором-стовпцем m×1, тоді матричне рівняння

є еквівалентним наступній системі лінійних рівнянь:

[1]

Із використанням матриць, це можна розв'язати у більш компактній формі ніж виписувати всі ці рівняння окремо. Якщо n = m а рівняння є незалежними, це можливо зробити записавши

де A−1 є оберненою матрицею для A. Якщо A не має оберненої матриці, розв'язок, якщо такий існує можна знайти за допомогою псевдооберненої матриці.

Лінійні перетворення

[ред. | ред. код]
Вектор заданий 2-на-2 матрицею відповідає сторонам одиничного квадрата, що перетворено на паралелограм.

Матриці й операція множення матриць розкривають свої важливі властивості при застосуванні для лінійних перетворень, що також називають лінійними відображеннями. Дійсна m-на-n матриця A задає лінійне перетворення RnRm і відображає кожен вектор x у Rn у матричний добуток Ax, що в свою чергу є вектором у Rm. Відповідно, кожне лінійне перетворення f: RnRm може здаватися унікальною m-на-n матрицею A: більш детально, (i, j)-входження із A є iю координатою f(ej), де ej = (0,...,0,1,0,...,0) є одиничним вектором зі значенням 1 у jій позиції і 0 в інших позиціях. Говорять, що матриця A задає лінійне відображення f, і A називається матрицею перетворення для f.

Наприклад, матрицю 2×2

можна розглядати як перетворення одиничного квадрату у паралелограм із вершинами у (0, 0), (a, b), (a + c, b + d), і (c, d). Паралелограм зображений праворуч отримано за допомогою множення A на кожний вектор-стовпець і по черзі. Ці вектори задають вершини одиничного квадрату.

Наступна таблиця показує декілька 2-на-2 матриць із відповідними лінійними відображеннями у R2. Початкова синя фігура відображається у зелену сітку і фігуру. Початок координат (0,0) відмічено чорною точкою.

Горизонтальний скіс при m=1.25. Відбиття відносно вертикальної осі Відображення стиснення при r=3/2 Масштабування на коефіцієнт 3/2 Поворот на кут π/6R = 30°

Квадратна матриця

[ред. | ред. код]
Докладніше: Квадратна матриця

Квадратною матрицею називають матрицю з однаковою кількістю рядків і стовпців. Матриця n-на-n є квадратною матрицею порядку n. Будь-які дві квадратні матриці однакового порядку можна додавати й множити. Входження aii утворюють головну діагональ квадратної матриці. Вони знаходяться на уявній лінії, яка проходить від верхнього лівого кута до нижнього правого кута матриці.

Основні типи

[ред. | ред. код]
Назва Приклад для n = 3
Діагональна матриця
Нижньотрикутна матриця
Верхньотрикутна матриця

Діагональна і трикутна матриця

[ред. | ред. код]

Якщо всі елементи матриці A нижче головної діагоналі дорівнюють нулю, A називають верхньотрикутною матрицею. Аналогічно, якщо всі елементи A вище головної діагоналі дорівнюють нулю, A називають нижньотрикутною матрицею. У випадку, коли всі елементи матриці крім головної діагоналі є нулями, A називають діагональною матрицею.

Одинична матриця

[ред. | ред. код]
Докладніше: Одинична матриця

Одинична матриця In розміром n є матрицею n-на-n в якій всі елементи головної діагоналі дорівнюють 1 а всі інші елементи дорівнюють 0, наприклад,

Це квадратна матриця порядку n, і також це є особливим випадком діагональної матриці. Вона називається діагональною матрицею, оскільки множення на неї залишає матрицю незмінною:

AIn = ImA = A для будь-якої m-на-n матриці A.

Симетричні або кососиметричні матриці

[ред. | ред. код]

Квадратна матриця A що дорівнює своїй транспонованій матриці, тобто, A = AT, є симетричною матрицею. Якщо замість того, A дорівнює негативній транспонованій матриці, тобто, A = −AT, то A є кососиметричною матрицею. У випадку комплексних матриць, поняття симетрії часто заміняється поняттям Ермітової матриці, що задовольняє умові A = A, де зірочка позначає ермітове-спряження матриці, що є транспонованою комплексною спряженою матриці A.

Відповідно до спектральної теореми, дійсні симетричні матриці і комплексні Ермітові матриці мають власний базис; такий що, кожен вектор можна задати у вигляді лінійної комбінації власних векторів. В обох випадках всі власні значення є дійсними.[2]

Невироджена матриця і її обернена

[ред. | ред. код]

Квадратна матриця A називається невиродженою або не-сингулярною якщо існує матриця B, така що

AB = BA = In ,[3][4]

де In n×n є одиничною матрицею із 1-ями на головній діагоналі і 0-ми в інших місцях. Якщо B існує, вона є єдиною і називається оберненою матрицею для A, і позначається як A−1.

Додатноозначена матриця

[ред. | ред. код]
Додатноозначена матриця Невизначена матриця
Q(x,y) = 1/4 x2 + y2 Q(x,y) = 1/4 x2 − 1/4 y2

Точки при яких Q(x,y)=1
(Еліпс).

Точки при яких Q(x,y)=1
(Гіпербола).

Симетрична n×n-матриця A називається додатноозначеною якщо для всіх не нульових векторів x ∈ Rn відповідна квадратична форма, що задається як

f(x) = xTA x

утворює в результаті лише додатні значення для будь-якого вхідного вектору x. Якщо f(x) приводить до утворення лише від'ємних значень тоді A є від'є́мно ви́значеною; якщо f утворює як додатні, так і від'ємні значення, тоді A є невизначеною.[5] Якщо квадратична форма f породжує лише не-від'ємні значення (додатні або нуль), симетрична матриця називається додатно напіввизначеною. Таблиця праворуч показує два варіанти для матриць 2-на-2.

Якщо в якості входів задати два різні вектори буде отримана білінійна форма, що пов'язана з A:

BA (x, y) = xTAy.[6]

Ортогональна матриця

[ред. | ред. код]

Ортогональна матриця це квадратна матриця із дійсними елементами, чиї стовпці і рядки є ортогональними одиничними векторами (тобто, ортонормованими векторами). Це рівносильно тому, що матриця A є ортогональною якщо її транспонована матриця дорівнює її оберненій матриці:

що тягне за собою

де I є одиничною матрицею розміром n.

Основні операції

[ред. | ред. код]

Слід матриці

[ред. | ред. код]

Слід, tr(A) квадратної матриці A є сумою елементів її діагоналі. Хоча операція множення не є комутативною, слід добутку двох матриць не залежить від порядку операцій:

tr(AB) = tr(BA).

Це випливає прямо з визначення операції множення матриць:

Також, слід матриці буде дорівнювати сліду її транспонованої матриці, тобто,

tr(A) = tr(AT).

Визначник

[ред. | ред. код]
Докладніше: Визначник
Лінійне перетворення R2 задане наведеною матрицею. Визначник матриці дорівнює −1, площа зеленого паралелограма праворуч дорівнює 1, але відображення має обернену орієнтацію.

Визначник (визначник) det(A) або |A| квадратної матриці A, що визначає деякі властивості матриці. Матриця є невиродженою, тоді й тільки тоді, коли її детермінант не є нульовим. Його абсолютне значення дорівнює площі (у R2) або об'єму (у R3) відображення одиничного квадрата (або куба), а його знак відповідає орієнтації відповідного лінійного відображення: визначник є додатним тоді, й тільки тоді, коли орієнтація зберігається.

Визначник матриці 2×2 дорівнює:

Детермінант матриці 3×3 матиме 6 термів (Правило Саррюса). Більш складна Формула Лейбніца узагальнює ці дві формули до всіх вимірів.[7]

Визначник добутку квадратних матриць дорівнює добутку їх визначників:

det(AB) = det(A) · det(B).[8]

Додавання до рядка іншого рядка помноженого на деяке значення, або додавання стовпця до іншого стовпця, не змінює детермінанта матриці. Заміна місцями двох рядків або стовпців приводить до зміни знаку визначника, тобто множення його на −1.[9] Використовуючи ці операції, можна звести будь-яку матрицю до нижньої (або верхньої) трикутної матриці, а для таких матриць визначник буде дорівнювати добутку елементів головної діагоналі; що є методом розрахунку визначника будь-якої матриці. З рештою, розклад Лапласа дозволяє виразити визначник через мінори, тобто, детермінанти менших матриць.[10] Це розкладання можна використовувати для рекурсивного визначення визначника, що можна розглядати як рівнозначний до формули Лейбніца. Визначник використовується для розв'язання систем лінійних рівнянь за допомогою методу Крамера.[11]

Матриці в абстрактній алгебрі

[ред. | ред. код]

Якщо взяти кільце R, можемо розглядати множину M(m,n, R) усіх матриць m на n з елементами з R. Додавання та множення цих матриць може бути означене, як у випадку дійсних чи комплексних матриць. Множина M(n, R) усіх квадратних матриць n на n над кільцем R сама є кільцем, ізоморфним до кільця ендоморфізмів правого R-модуля Rn.

Також, якщо елементи беруться з напівкільця S, додавання та множення матриць можна означити звичайним чином. Множина всіх квадратних матриць n×n над S сама є напівкільцем. Зважте на те, що алгоритми множення матриць, такі як алгоритм Штрассена, взагалі застосовні лише до матриць над кільцями і не працюють для матриць над напівкільцями, що не є кільцями.

Якщо R є комутативним кільцем, тоді M(n, R) є унітарною асоціативною алгеброю над R. Також має сенс означити детермінант квадратних матриць, застосовуючи формулу Лейбніца. Матриця має обернену тоді й лише тоді, коли її визначник як елемент R має обернений елемент в R.

Усі твердження цієї статті для дійсних та комплексних матриць справджуються і для матриць над довільним полем.

Матриці над кільцем поліномів є важливими у вивченні теорії керування.

Історія

[ред. | ред. код]

Вивчати матриці почали досить давно. Латинські квадрати та магічні квадрати були відомі ще в доісторичні часи.

Китайський текст «Математика в дев'яти книгах» (написаний ще до нашої ери) містить приклади використання матриць для розв'язання системи рівнянь, включно з поняттям визначника, ще задовго до введення визначників японським математиком Такакадзу Секі (1683) та німецьким математиком Лейбніцем (1693). Крамер розвинув цю теорію, увівши правило Крамера 1750 р. Карл Фрідріх Ґаус та Вільгельм Йордан розробили метод Ґауса — Йордана, який полягає в знаходженні оберненої матриці (1800).

Термін «матриця» уперше було запроваджено 1848 р. Дж. Дж. Сильвестром. Кейлі, Гамільтон, Ґрассман, Фробеніус, фон Нойман. Інші видатні математики також зробили свій внесок у теорію матриць.

Див. також

[ред. | ред. код]

Навчальні матеріали

[ред. | ред. код]

Джерела

[ред. | ред. код]

Примітки

[ред. | ред. код]
  1. Brown 1991, I.2.21 and 22
  2. Horn & Johnson 1985, Theorem 2.5.6
  3. Brown 1991, Definition I.2.28
  4. Brown 1991, Definition I.5.13
  5. Horn & Johnson 1985, Chapter 7
  6. Horn & Johnson 1985, Example 4.0.6, p. 169
  7. Brown 1991, Definition III.2.1
  8. Brown 1991, Theorem III.2.12
  9. Brown 1991, Corollary III.2.16
  10. Mirsky 1990, Theorem 1.4.1
  11. Brown 1991, Theorem III.3.18