Формат файлу

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Формат файлу (або тип файлу) в інформатиці - це усталений стандарт запису інформації у файлі даного типу. Спосіб кодування інформації або даних залежить від застосованої комп'ютерної програми. Часто формат файлу визначається його розширенням.

Загальноприйнята в обчислювальній техніці концепція файлу - неструктурована послідовність байтів. Комп'ютерні програми, що зберігають у файлах структуровані дані, повинні якось перетворювати їх в послідовність байтів і навпаки (в ООП ці операції називаються, відповідно , «серіалізацією » і «десеріалізацією» ; для текстової інформації останнє також називається «розбір» або «парсинг»). Алгоритм цього перетворення, а також угоди про те, як різні фрагменти інформації розташовуються усередині файлу, і складають його «формат».

Різні формати файлів можуть різнитися ступенем деталізації, один формат може бути «надбудовою» над іншим або використовувати елементи інших форматів. Наприклад, текстовий формат накладає лише загальні обмеження на структуру даних. Формат HTML встановлює додаткові правила на внутрішній устрій файлу, але при цьому будь-який HTML-файл є в той же час текстовим файлом.

Специфікації[ред.ред. код]

Для багатьох форматів файлів існують опубліковані специфікації, в яких детально описано структуру файлів даного формату, то, як програми повинні кодувати дані для запису в цей формат і як декодувати їх при читанні. Більшість таких специфікацій вільно доступні, деякі поширюються за плату.

Іноді компанії можуть вважати певні формати файлів своєю комерційною таємницею і не публікувати їх. Добре відомий приклад - формати файлів пакета Microsoft Office. У деяких випадках компанія, що випустила додаток, просто не вважає за потрібне витрачати час на написання докладної специфікації .

Якщо специфікація формату недоступна, то для забезпечення сумісності програми з даним форматом доводиться займатися зворотного розробкою. У більшості або в усіх країнах формати файлів не захищені законами про авторські права. Проте в деяких країнах патентами можуть бути захищені алгоритми, які використовуються для кодування даних у будь-який формат. Наприклад, у широко поширеному форматі GIF використовувався патентований алгоритм, що призвело до розробки альтернативного формату PNG.

Визначення типу файлу[ред.ред. код]

Тип файлу - це інформація для швидкої ідентифікації вмісту файлу операційною системою і користувачем без необхідності зчитування всього вмісту файлу. Завдяки цій інформації, користувач приблизно знає, тип інформації у файлі, а в операційній системі може бути знайдена програма для обробки файлів даного типу. Для того, щоб правильно працювати з файлами, програми повинні мати можливість визначати їх тип. З історичних причин, в різних операційних системах використовуються різні підходи для вирішення цього завдання.

Посилання[ред.ред. код]

Див. також[ред.ред. код]


Комп'ютер Це незавершена стаття про комп'ютери.
Ви можете допомогти проекту, виправивши або дописавши її.