MNIST (база даних)

База даних MNIST (скорочення від Mixed National Institute of Standards and Technology) — об'ємна база даних зразків рукописного написання цифр^[1]. Є стандартом, запропонованим Національним інститутом стандартів і технологій США з метою калібрування і зіставлення методів розпізнавання зображень за допомогою машинного навчання, в першу чергу на основі штучних нейронних мереж^[2]^[3]. База даних містить 60000 зображень для навчання і 10000 зображень для тестування.

Дані складаються з заздалегідь підготовлених прикладів зображень, отриманих з рукописних документів шляхом обробки чорно-білих зразків символів NIST розміром $20\times 20$ пікселів. Творці бази даних NIST, в свою чергу, використовували набір зразків з Бюро перепису населення США, до якого були додані ще тестові зразки, написані студентами американських університетів. Зразки з набору з NIST були нормалізовані, пройшли згладжування та приведення до напівтонового зображенню розміром $28\times 28$ пікселів.

Рекордні результати машинного розпізнавання на базі MNIST були досягнуті на згорткових нейронних мережах, рівень помилки був доведений до 0,23 %.

Результати обробки для різних систем[ред. | ред. код]

У таблиці наведені приклади результатів машинного навчання в різних системах класифікації зображень.

Тип	Структура	Спотворення	Попередня обробка	Помилка (%)
Лінійний класифікатор	Однорівневий перцептрон	Ні	Ні	12.0
Лінійний класифікатор	Попарний лінійний класифікатор	Ні	Вирівнювання	7.6
Метод найближчих k-сусідів	К-ПН з нелінійною деформацією (P2DHMDM)	Ні	Shiftable edges	0.52
Метод градієнтного підсилювання^[en]	Обробка залишків на основі гаароподібних ознак	Ні	Гаароподібна ознака	0.87
Нелінійний класифікатор	40 PCA + квадратичний класифікатор	Ні	Ні	3.3
Метод опорних векторів	Віртуальна система опорних векторів, град-9 поли, 2-пікселя jittered	Ні	Вирівнювання	0.56
Нейронна мережа	2-рівнева мережа 784-800-10	Ні	Ні	1.6
Нейронна мережа	2-рівнева мережа 784-800-10	Пружні деформації	Ні	0.7
Глибока нейронна мережа	6-рівнева мережа 784-2500-2000-1500-1000-500-10	Пружні деформації	Ні	0.35
Згорткова нейронна мережа	6-рівнева мережа 784-40-80-500-1000-2000-10	Ні	Розширення даних для навчання	0.31
Згорткова нейронна мережа	6-рівнева мережа 784-50-100-500-1000-10-10	Ні	Розширення даних для навчання	0.27
Згорткова нейронна мережа	Ансамбль з 35 CNN-мереж, 1-20-С-40-С-150-10	Пружні деформації	З нормалізацією	0.23
Згорткова нейронна мережа	Ансамбль з 5 CNN-мереж, 6-784-50-100-500-1000-10-10	Ні	Розширення даних для навчання	0.21

Примітки[ред. | ред. код]

↑ Слюсар, В.И. (2021). Тензорно-матричная версия LeNet5 (PDF). IV Міжнародна науково-практична конференція «Інтеграція інформаційних систем і інтелектуальних технологій в умовах трансформації інформаційного суспільства», що присвячена 50-ій річниці кафедри інформаційних систем та технологій, 21-22 жовтня 2021 р., Полтава: Полтавський державний аграрний університет.: 114—119. doi:10.32782/978-966-289-562-9. Архів оригіналу (PDF) за 2 листопада 2021. Процитовано 30 жовтня 2021.
↑ Support vector machines speed pattern recognition - Vision Systems Design. Vision Systems Design. Архів оригіналу за 21 вересня 2013. Процитовано 17 серпня 2013.
↑ Gangaputra, Sachin. Handwritten digit database. Архів оригіналу за 21 вересня 2013. Процитовано 17 серпня 2013.

Див. також[ред. | ред. код]

Список наборів даних для досліджень з машинного навчання

Джерела[ред. | ред. код]

MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges [Архівовано 7 квітня 2021 у Wayback Machine.] — Домашня сторінка бази даних
Neural Net for Handwritten Digit Recognition in JavaScript [Архівовано 28 березня 2019 у Wayback Machine.] — Реалізація нейронної мережі на JavaScript для розпізнавання цифр написаних від руки на основі бази MNIST

[slyusar-1] Слюсар, В.И. (2021). Тензорно-матричная версия LeNet5 (PDF). IV Міжнародна науково-практична конференція «Інтеграція інформаційних систем і інтелектуальних технологій в умовах трансформації інформаційного суспільства», що присвячена 50-ій річниці кафедри інформаційних систем та технологій, 21-22 жовтня 2021 р., Полтава: Полтавський державний аграрний університет.: 114—119. doi:10.32782/978-966-289-562-9. Архів оригіналу (PDF) за 2 листопада 2021. Процитовано 30 жовтня 2021.

[2] Support vector machines speed pattern recognition - Vision Systems Design. Vision Systems Design. Архів оригіналу за 21 вересня 2013. Процитовано 17 серпня 2013.

[3] Gangaputra, Sachin. Handwritten digit database. Архів оригіналу за 21 вересня 2013. Процитовано 17 серпня 2013.

[1]

[2]

[3]

MNIST (база даних)

Зміст

Результати обробки для різних систем[ред. | ред. код]

Примітки[ред. | ред. код]

Див. також[ред. | ред. код]

Джерела[ред. | ред. код]

Навігаційне меню

MNIST (база даних)

Результати обробки для різних систем[ред. | ред. код]

Примітки[ред. | ред. код]

Див. також[ред. | ред. код]

Джерела[ред. | ред. код]

Навігаційне меню

Пошук