Конвертація даних
Конверта́ція да́них — перетворення даних з одного формату в інший. Зазвичай зі збереженням основного логічно-структурного змісту інформації[1]. У комп’ютерному середовищі дані кодуються різними способами. Наприклад, апаратне забезпечення комп’ютера створюється на основі певних стандартів, які вимагають наявності в даних таких елементів, як перевірка бітів парності. Аналогічно, операційна система ґрунтується на стандартах обробки даних і файлів. Крім того, кожна комп'ютерна програма обробляє дані по-різному. У разі зміни будь-якого з цих елементів дані мають бути конвертовані, перш ніж їх можна буде використати на іншому комп’ютері, в іншій операційній системі або програмі. Навіть різні версії таких елементів зазвичай використовують різні структури даних[2].
Зміна послідовності бітів з одного формату на інший, зазвичай з метою взаємодії між програмами або використання нових функцій, є різновидом перетворення даних. Такі перетворення можуть бути дуже простими, як-от перетворення текстового файлу з одного кодування символів в інше, або складнішими — наприклад, перетворення офісних форматів файлів, а також форматів зображень чи аудіоформатів[3][4][5].
Існує багато способів перетворення даних у комп’ютерному середовищі. Воно може відбуватися непомітно для користувача, наприклад під час оновлення програми до новішої версії. В інших випадках перетворення потребує використання спеціальної програми-конвертера або складного процесу з проміжними етапами, зокрема процедур експорту та імпорту, які можуть включати перетворення до й з текстових файлів з роздільниками (наприклад, із табуляцією або комами)[6]. Деякі програми здатні розпізнавати кілька форматів файлів на етапі введення даних і зберігати результати в різних форматах, що дозволяє використовувати їх як інструменти для конвертації. Якщо вихідний або цільовий формат не підтримується, іноді застосовується третя програма, яка виконує перетворення в проміжний формат, після чого дані переформатовуються за допомогою першої програми[7].
Перетворення даних БД пов'язане з різницею логічних структур даних, а також з такими проблемами:
- багатомодельність представлення даних (ієрархічні, мережні, реляційні) в різних БД і СКБД;
- різниця в логічних структурах даних, в довідниках, класифікаторах і в системах кодування інформації;
- використання різних мов для представлення текстової інформації;
- різні типи СКБД і постійний розвиток даних БД в процесі експлуатації.
Проблема 1 розв'язується шляхом переходу до реляційної моделі даних і СКБД, яка є потужним математичним апаратом, який ґрунтується на теорії множин і математичній логіці. Ця модель складається із структурної, маніпуляційної і цілісної частин. У цих частинах, відповідно, фіксується структура даних, опис програм в SQL-мові і вимоги до цілісності. Ієрархічні або мережні моделі даних загалом не підтримують цілісність, тому при переході від них до реляційних БД виникає порушення цілісності даних.
Проблема 2 викликана тим, що логічна структура даних або концептуальна схема БД припускають проєктування нової структури БД при зміні наочної області або при переході до нового типу СКБД. При цьому зіставляються дані старої та нової БД і змінюється довідкова інформація і класифікатори.
Проблема 3 визначається різномовними текстовими представленнями інформації в БД. У старих БД використовувалася, як правило, одна мова, а в нових їх може бути декілька, тому для зберігання даних з простим доступом до текстових даних встановлюється відповідність текстових даних, записаних в різних мовах.
Проблему 4 можна сформулювати як метод зберігання і обробки різних даних, викликаних специфікою СКБД ієрархічного, мережного і реляційного типів. Наявність явної несумісності типів і структур цих моделей даних, різні мови маніпулювання даними призводять до того, що не можна згенерувати мовою старої СКБД скрипти для перенесення даних і подальшого запуску БД в середовище іншої СКБД. Кожна СКБД забезпечує внесення змін в БД, які певною мірою змінюють і концептуальну модель даних, якщо до неї вносять нові об'єкти. Внесені зміни повинні відображатися в довідниках і класифікаторах, що забезпечує перенесення даних із старої БД до нової з урахуванням поточних змін[8].
- ↑ Date, C. J. (2004). An introduction to database systems (вид. 8th ed). Boston: Pearson/Addison Wesley. ISBN 978-0-321-19784-9.
- ↑ Silberschatz, Abraham; Galvin, Peter B.; Gagne, Greg (2019). Operating system concepts (вид. Global Edition). Hoboken, NJ: Wiley. ISBN 978-1-119-45633-9.
- ↑ Daniels, Peter T. (1993-03). The Unicode Standard: Worldwide Character Encoding, Version 1.0. Language. 69 (1): 225. doi:10.2307/416473. ISSN 0097-8507 — через JSTOR.
- ↑ Harbron, Thomas R. (1988). File Systems: Structures and Algorithms (англ.). Prentice Hall. ISBN 978-0-13-314709-4.
- ↑ ISO/IEC 26300-1:2015. ISO (англ.). Процитовано 18 грудня 2025.
- ↑ IEEE Standard Glossary of Software Engineering Terminology, IEEE, doi:10.1109/IEEESTD.1990.101064, процитовано 18 грудня 2025
- ↑ Bajcsy, Peter; Kooper, Rob; Marini, Luigi; McHenry, Kenton; Ondrejcek, Michal (29 березня 2010). A framework for understanding file format conversions (англ.). ACM: 1—7. doi:10.1145/2039274.2039284. ISBN 978-1-4503-0109-1.
- ↑ Перетворення даних з баз даних. Архів оригіналу за 10 червня 2015. Процитовано 18 листопада 2013.