Надмірність даних
У головній пам’яті комп’ютера, допоміжній пам’яті та шинах комп’ютера надмірність даних — це наявність даних, які є додатковими до фактичних даних і дозволяють виправити помилки в збережених або переданих даних. Додаткові дані можуть бути просто повною копією фактичних даних або лише виділеними фрагментами даних, які дозволяють виявити помилки та відновити втрачені або пошкоджені дані до певного рівня.
Наприклад, включаючи додаткові контрольні суми даних, пам’ять ECC здатна виявляти та виправляти однобітові помилки в кожному слові пам’яті, тоді як RAID 1 об’єднує два жорстких диска (HDD) у логічний блок зберігання, що дозволяє збереженим даним не бути втраченими навіть при повному виходу з ладу одного диска.[1] [2] Надлишковість даних також може використовуватися як захід проти тихого пошкодження даних ; наприклад, такі файлові системи, як Btrfs і ZFS, використовують контрольну суму даних і метаданих у поєднанні з копіями збережених даних, щоб виявити тихе пошкодження даних і виправити його наслідки.[3]
Незважаючи на свою природу, надмірність даних також має місце в системах баз даних, значення яких повторюються без потреби в одному або кількох записах або полях, у таблиці, або коли поле використовується/повторюється в двох або більше таблицях. Часто це зустрічається в ненормалізованих конструкціях баз даних і призводить до ускладнення управління базою даних, введення ризику пошкодження даних і збільшення необхідного обсягу зберігання. Коли це зроблено навмисне з раніше нормованої схеми бази даних, це може розглядатися як форма денормалізації бази даних; використовується для підвищення продуктивності запитів до бази даних (скорочення часу відповіді бази даних).
Наприклад, коли дані клієнта дублюються та додаються до кожного купленого продукту, надлишковість даних є відомим джерелом невідповідності, оскільки даний клієнт може мати різні значення для одного або кількох своїх атрибутів.[4] Надлишковість даних призводить до аномалій і пошкодження даних, і, як правило, її слід уникати навмисно;[5] застосування нормалізації бази даних запобігає надмірності та забезпечує найкраще використання сховища.[6]
- Обслуговування даних
- Дедуплікація даних
- Очищення даних
- Наскрізний захист даних
- Резервування (техніка)
- Надлишковість (теорія інформації)
- ↑ Xin Li; Michael C. Huang; Kai Shen; Lingkun Chu (9 травня 2010). A Realistic Evaluation of Memory Hardware Errors and Software System Susceptibility (PDF). cs.rochester.edu. Архів оригіналу (PDF) за 15 травня 2015. Процитовано 16 січня 2015.
- ↑ Remzi H. Arpaci-Dusseau; Andrea C. Arpaci-Dusseau (3 січня 2015). Operating Systems – Three Easy Pieces: Redundant Arrays of Inexpensive Disks (RAIDs) (PDF). cs.wisc.edu. Архів оригіналу (PDF) за 6 лютого 2015. Процитовано 16 січня 2015.
- ↑ Margaret Bierman; Lenz Grimmer (August 2012). How I Use the Advanced Capabilities of Btrfs. Oracle Corporation. Архів оригіналу за 2 січня 2014. Процитовано 26 січня 2015.
- ↑ Jorge H. Doorn; Laura C. Rivero (2002). Database integrity: challenges and solutions. Idea Group Inc (IGI). с. 4—5. ISBN 978-1-930708-38-9. Архів оригіналу за 3 січня 2014. Процитовано 23 січня 2011.
- ↑ Peter Rob; Carlos Coronel (2009). Database systems: design, implementation, and management. Cengage Learning. с. 88. ISBN 978-1-4239-0201-0. Архів оригіналу за 3 січня 2014. Процитовано 22 січня 2011.
- ↑ I. T. L. Education Solutions Limited; Itl (2009). Introduction to Information Technology. Pearson Education India. с. 522. ISBN 978-81-7758-118-8. Архів оригіналу за 3 січня 2014. Процитовано 4 лютого 2011.