Наши статьи
Формат файла

Формат файла – это структура, которая определяет способ хранения файла и отображение на экране либо при печати. Обычно формат файла указывают в его имени, как часть, которая отделена точкой (обычно данную часть называют расширением имени, но это неверно). К примеру, расширение – окончание имени «.txt» используют для обозначения типа файла, который имеет только текст, а «.doc» — содержит текст, структурированный со стандартами утилиты Microsoft Word. Одинаковое  содержимое файлов, соответствующие одному формату, зачастую называют файлами одного и того же типа.

Так как принятая в цифровой технике концепция файлов – неструктурированная последовательность определенного количества байтов, компьютерные утилиты, сохраняющие в файлах данные имеющие структуру, должны преобразовать их в структурированную последовательность байтов, и наоборот (в ООП данные операции называются «десериализацией» и «сериализацией»; для информации с текстом последнее также называется «парсинг» или «разбор»). Алгоритм данного преобразования составляют его «формат».

Для большого количества форматов файлов есть опубликованные спецификации. В них подробно описывается структура определенных файлов и их форматов. Программы должны декодировать эти форматы при чтении, и соответственно кодировать при записи. Большая часть таких спецификаций доступны для каждого пользователя, остальная часть распространяется за определенную плату.

Многие компании считают определенные форматы файлов своей тайной и не публикуют их. Хорошим примером является форматы файлов компании Microsoft Office. В редких случаях компания, которая выпустила приложение, просто не желает тратить свое время на написание более подробной и нужной обычному пользователю спецификации.

Если формат файла недоступен, то для того чтобы обеспечить совместимость программы с этим форматом приходится создавать обратную разработку. Почти во всех странах мира форматы файлов не имеют защиты закона авторских прав. Но в некоторых странах патентом могут защитить алгоритмы, которые используют для кодирования данных в другой формат.

Для того чтобы работа с файлами была правильной, программы должны быть с возможностью определять их тип. В истории изменения форматов файлов, в разных ОС используют разные подходы, чтобы решить эту задачу.

Операционные системы, такие как DOS, CP/M и Microsoft Windows для определения типа файла используют часть его имени, доступными словами «расширение имени файла». В ранних ОС расширение имени файла имело три символа, которые были отделены от имени точкой (в файловой системе с FAT семейством расширение и имя хранились отдельно, точка была добавлена уже на уровне операционной системы); в новых ОС расширение является частью имени файла.

Пользователь сам может с легкостью изменить расширение файла, так как большинство оболочек пользователя используют расширение для определения программы, с помощью которой необходимо открыть нужный файл. Помимо этого опытный пользователь может изменить стандартный тип файла, просто изменив расширение, чтобы открыть в определенной программе. Это будет полезно, если программа не предусматривает открытие файла с каким-либо расширением, а пользователь понимает, что формат этих файлов подходит для обработки в этой программе.

Просмотров: 450