No Image

Чем определяется порядок хранения файлов на диске

СОДЕРЖАНИЕ
5 просмотров
11 марта 2020

Если вы ищете информацию на тему «опишите систему хранения файлов на диске», то вы на правильном пути! Любые данные, которые есть на компьютере, должны быть доступными при последующем использовании. Но как реализован такой механизм? Сложен он или нет?

Что такое система хранения файлов

Протоколы

  1. Его работа обходится дешево, если вообще не бесплатно (условно).
  2. Программный модуль данного протокола может работать со всеми популярными операционными системами. В некоторых он является установленным по умолчанию, в других – его можно скачать и самому добавить в список протоколов компьютера.
  3. Эксплуатация возможна сразу же после завершения процесса монтирования.
  4. Поскольку данный протокол использует интернет-адрес, то он может передавать данные в любое место планеты, где есть покрытие.

Имеет он не только преимущества, но и недочеты. В целом, у него есть только один существенный недостаток: привязка к интернет-адресу и невозможность полноценного функционирования без него.

Виды систем

  1. DAS. Под нею понимают диски, непосредственно подключенные к вычислительной системе. Всё, что напрямую подсоединено к используемому компьютеру, использует данную систему.
  2. NAS. Эта система знакома любителям локальных сетей. Она предоставляет доступ к внутренним файлам и документам только тем устройствам, которые были опознаны как «свои».
  3. SAN. С точки зрения пользователя можно описать данную систему как локальный диск, к которому подключение осуществляется из сети при использовании протоколов удаленного доступа к файлам.
  4. CAS. Это архитектура хранения, в которой значительную роль играет образ хранимых данных. Он хэшируется и используется, чтобы найти информацию в системе хранения или отдельных устройствах. По сути, данную архитектуру можно сравнить со специальной базой, в которой вычисленный хэш – это инструмент быстрого поиска в содержимом. Данная система с легкостью поддаётся децентрализации, что существенно увеличивает стойкость и надежность. Но к недостаткам следует отнести небольшую скорость взаимодействия, что не позволяет широкомасштабно её использовать. Сейчас данная архитектура используется в качестве хранилища для архивных данных, или тех, что должны быть долговременными.

Технологии, используемые для хранения данных

  1. Резервное копирование. Представляет собой упреждающее создание копий информации, которая может быть удалена и которая может понадобиться опять. Важную роль играет размер файла. При полном резервировании затрагивает всю систему и файлы. При инкрементальном копировании сохраняется только часть. Выбор поиска осуществляется по тем, которые изменялись со времени прохождения последнего резервирования. Обычно сохранённые данные имеет диск С или специально созданное для этих целей хранилище.
  2. Репликация. Бывает синхронной и асинхронной. Под первой понимают размещение данных, которые находятся в разных системах хранения (хотя может быть и использование двух дисков в одной системе). При этом запись информации осуществляется одновременно. Асинхронной репликацией называется запись данных, которая осуществляется не в одно и то же время, а при удобном случае. Такой подход позволяет преодолевать разницу скоростей, но данные никогда не будут полностью идентичными. Хотя и будут к этому стремиться. В качестве попытки объединить была создана технология полусинхронной репликации. Её суть заключается в том, что запись начинает вестись одновременно, но используются каналы передачи на полную мощность. И если где-то процесс завершается, то в другом он продолжается до завершения. При этом данные разнятся по минимуму.
  3. Дедупликация. Специальный метод, который при сжатии массива данных исключает дублирующие копии всех повторяющихся файлов. Особенно важный метод, когда размер файла копии и их количество очень высоки. Используется для оптимизации используемого места.

Но это ещё пока не полный ответ на задачу «опишите систему хранения файлов на диске». Для полноценного разбирательства необходимо рассмотреть ещё память.

Постоянная память

Оперативная память

Есть оперативная, или энергозависимая память. Её особенность заключается в том, что необходимо постоянное обеспечения электричеством. Одновременно её размер обозначает возможность компьютера заниматься определённым количеством действий, и, по сути, от неё зависит его мощность. Именно она отвечает за диски, папки, файлы и документы, которые сейчас активны и работают. Следует отметить, что программное увеличение оперативной памяти без усовершенствования аппаратной части компьютера в большинстве случаев чревато нарушениями работоспособности всей системы (не только хранения данных).

Кэш-память

Также называется памятью быстрого доступа. В ней содержится информация, вызов которой наиболее вероятен. Особенность в том, что и постоянная, и кэш-память содержат одни и те же данные. Но ввиду того, что вторая более быстрая, сначала осуществляется поиск по ней. Если не было найдено совпадений, то компьютер будет искать уже в постоянной памяти. При обнаружении совпадений в кэш изменения будут внесены сначала сюда. А потом, по возможности, в постоянную память. Общим недостатком кэш является его относительно малый размер. Хранение файлов на дисках компьютера ограничено аппаратной составляющей для всех видов памяти. Поэтому при желании изменить размеры необходимо устанавливать что-то лучшее и одновременно совместимое с другими системами.

Все программы и данные хранятся в долговременной (внешней) памяти компьютера в виде файлов.

Файл– это определенное количество информа­ции (программа или данные), имеющее имя и хра­нящееся в долговременной (внешней) памяти.

Имя файла.Имя файла состоит из двух частей, разделен­ных точкой: собственно имя файла и расширение, определя­ющее его тип (программа, данные и так далее). Собственно имя файлу дает пользователь, а тип файла обычно задается программой автоматически при его создании.

Таблица 1. Типы файлов и расширений

Тип файла Расширения
Программы exe, com
Текстовые файлы txt, doc
Графические файлы bmp, д1Т,]рдидр
Звуковые файлы wav, mid
Видеофайлы avi
Программы на языках программирования bas, pas и др

Файловая система.На каждом носителе информации (гиб­ком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске опре­деляется используемой файловой системой.

Читайте также:  Мегафон принудительная смена тарифа

Каждый диск разбивается на две области: область хране­ния файлов и каталог. Каталог содержит имя файла и указание на начало его размещения на диске.

Для дисков с небольшим количеством файлов (до несколь­ких десятков) может использоваться одноуровневая файловая система, когда каталог (оглавление диска) представляет со­бой линейную последовательность имен файлов. Такой каталог можно сравнить с оглавлением детской книж­ки, которое содержит только названия отдельных рассказов.

Таблица 2.Одноуровневый каталог

Имя файла Номер начального сектора
Файл_1
Файл_2
…….
Файл_112

Если на диске хранятся сотни и тысячи файлов, то для удобства поиска используется многоуровневая иерархиче­ская файловая система, которая имеет древовидную струк­туру.

Начальный, корневой каталог содержит вложенные ката­логи 1-го уровня, в свою очередь, каждый из последних мо­жет содержать вложенные каталоги 2-го уровня и так далее. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы.

Файловая система— это система хранения фай­лов и организации каталогов.

Путь к файлу.Путь к файлу вместе с именем файла называют иногда полным именем файла.

Операции над файлами.В процессе работы на компьюте­ре наиболее часто над файлами производятся следующие операции:

• копирование (копия файла помещается в другой ката­лог);

• перемещение (сам файл перемещается в другой каталог);

• удаление (запись о файле удаляется из каталога);

• переименование (изменяется имя файла).

Форматирование дисков.Для того чтобы на диске можно было хранить информацию, диск должен быть отформатиро­ван, то есть должна быть создана физическая и логическая структура диска.

Формирование физической структуры диска состоит в со­здании на диске концентрических дорожек, которые, в свою очередь, делятся на секторы. Для этого в процессе формати­рования магнитная головка дисковода расставляет в опреде­ленных местах диска метки дорожек и секторов.

После форматирова­ния гибкого диска 3,5" его параметры будут сле­дующими:

• информационная ем­кость сектора — 512 байтов;

• количество секторов на дорожке — 18;

• дорожек на одной сто­роне — 80;

Логическая структура гибких дисков. Логическая струк­тура магнитного диска представляет собой совокупность секторов (емкостью 512 байтов), каждый из которых имеет свой порядковый номер (например, 100). Сектора нумеруют­ся в линейной последовательности от первого сектора нуле­вой дорожки до последнего сектора последней дорожки.

На гибком диске минимальным адресуемым элементом является сектор.

При записи файла на диск будет занято всегда целое ко­личество секторов, соответственно минимальный размер файла — это размер одного сектора, а максимальный соот­ветствует общему количеству секторов на диске.

Файл записывается в произвольные свободные сектора, которые могут находиться на различных дорожках. Напри­мер, Файл_1 объемом 2 Кбайта может занимать сектора 34, 35 и 47, 48, а Файл_2 объемом 1 Кбайт — сектора 36 и 49.

Таблица 3. Логическая структура гибкого диска формата 3,5" (2-я сторона)

№ дорожки № сектора
………………….

Для того чтобы можно было найти файл по его имени, на диске имеется каталог, представляющий собой базу данных.

Запись о файле содержит имя файла, адрес первого секто­ра, с которого начинается файл, объем файла, а также дату и время его создания.

Таблица 4. Структура записей в каталоге

Имя файла Адрес первого сектора Объем файла, Кбайт Дата создания Время создания
Файл 1 14 01 99 14 29
Файл 2 14 01 99 14 45

Полная информация о секторах, которые занимают фай­лы, содержится в таблице размещения файлов (FAT — File Allocation Table). Количество ячеек FAT соответствует коли­честву секторов на диске, а значениями ячеек являются це­почки размещения файлов, то есть последовательности ад­ресов секторов, в которых хранятся файлы.

Цепочка размещения для файла Файл_1 выглядит следую­щим образом: в начальном 34-м секторе хранится адрес 35, в 35-м секторе хранится адрес 47, в 47-м — 48, в 48-м — знак конца файла (К).

Для размещения каталога — базы данных и таблицы FAT на гибком диске отводятся секторы со 2 по 33. Первый сек­тор отводится для размещения загрузочной записи операци­онной системы. Сами файлы могут быть записаны, начиная с 34 сектора.

Виды форматирования. Существуют два различных вида форматирования дисков: полное и быстрое форматирование. Полное форматирование включает в себя как физическое форматирование (проверку качества магнитного покрытия дискеты и ее разметку на дорожки и секторы), так и логиче­ское форматирование (создание каталога и таблицы разме­щения файлов). После полного форматирования вся хранив­шаяся на диске информация будет уничтожена.

Быстрое форматирование производит лишь очистку кор­невого каталога и таблицы размещения файлов. Информа­ция, то есть сами файлы, сохраняется и в принципе возмож­но восстановление файловой системы.

Информационная емкость гибких дисков. Рассмотрим различие между емкостью неформатированного гибкого маг­нитного диска, его информационной емкостью после форма­тирования и информационной емкостью, доступной для за­писи данных.

Заявленная емкость неформатированного гибкого маг­нитного диска формата 3,5" составляет 1,44 Мбайт.

Рассчитаем общую информационную емкость отформати­рованного гибкого диска:

Количество секторов: N = 18 х 80 х 2 = 2880.

512 байт х N = 1 474 560 байт = 1 440 Кбайт -= 1,40625 Мбайт.

Однако для записи данных доступно только 2847 секто­ров, то есть информационная емкость, доступная для записи данных, составляет:

512 байт х 2847 = 1 457 664 байт = 1423,5 Кбайт = 1,39 Мбайт.

Логическая структура жестких дисков. Логическая структура жестких дисков несколько отличается от логической структуры гибких дисков. Минимальным адресуемым элементом жесткого диска является кластер, который может включать в себя не­сколько секторов. Размер кластера зависит от типа использу­емой таблицы FAT и от емкости жесткого диска.

Читайте также:  Intel core i7 5820k характеристики

На жестком диске минимальным адресуемым элементом является кластер, который содержит не сколько секторов.

Таблица FAT16 может адресовать 2 16 — 65 536 кластеров. Для дисков большой емкости размер кластера оказывается слишком большим, так как информационная емкость жест­ких дисков может достигать 150 Гбайт.

Например, для диска объемом 40 Гбайт размер кластера будет равен:

40 Гбайт/65536 = 655 360 байт = 640 Кбайт.

Файлу всегда выделяется целое число кластеров. При размещении на жестком диске большого количества небольших по размеру файлов они будут занимать кластеры лишь частично, что при­ведет к большим потерям свободного дискового пространства.

Эта проблема частично решается с помощью использова­ния таблицы FAT32, в которой объем кластера принят рав­ным 8 секторам или 4 килобайтам для диска любого объема.

В целях более надежного сохранения информации о раз­мещении файлов на диске хранятся две идентичные копии таблицы FAT.

Преобразование FAT16 в FAT32 можно осуществить с по­мощью служебной программы Преобразование диска в FAT32, которая входит в состав Windows.

Мы рассмотрели файловую систему, имеющую название FAT, од­нако в последнее время все большую популярность приобретает фай­ловая система NTFS (New Technology File System – файловая система операционных систем семейства Windows NT), которая, в частности, используется в Windows NT и Windows ХР.

Максимальный размер раздела NTFS в данный момент ограничен лишь размерами «жестких» дисков. Как и любая другая система, NTFS делит все полезное место на кластеры — блоки данных, используемые единовременно. NTFS поддерживает почти любые размеры кластеров — от 512 байт до 64 Кбайт, неким стандартом же считается кластер раз­мером 4 Кбайт. Диск NTFS условно делится на две части. Первые 12 % диска отводятся под так называемую зону MFT (Master File Table). Это БД, представляющая собой общую файловую таблицу, строки которой соответствуют файлам тома NTFS, а столбцы – атрибутам файлов. Запись каких-либо других данных в эту область невозможна. Остальные 88 % диска является обычным пространством для хранения файлов.

Зона MFT поделена на записи фиксированного размера (обычно 1 Кбайт), и каждая запись соответствует какому-либо файлу (в общем смысле этого слова). Первые 16 файлов носят служебный характер и недоступны ОС — они называются метафайлами, причем самый первый метафайл – сам MFT. Эти первые 16 элементов MFT – един­ственная часть диска, имеющая фиксированное положение. Интересно, что вторая копия первых трех записей для надежности — они очень важны – хранится ровно посередине диска. Остальной MFT-файл может располагаться, как и любой другой файл, в произвольных местах диска — восстановить его положение можно с помощью его самого, «зацепившись» за самую основу первый элемент MFT.

Дефрагментация дисков.Замедление скорости обмена данными может происходить в результате фрагментации файлов. Фрагментация файлов (фрагменты файлов хранятся в различных, удаленных друг от друга кластерах) возраста­ет с течением времени, в процессе удаления одних файлов и записи других.

Так как на диске могут храниться сотни и тысячи файлов в сотнях тысяч кластеров, то фрагментированность файлов будет существенно замедлять доступ к ним (магнитным го­ловкам придется постоянно перемещаться с дорожки на до­рожку) и в конечном итоге приводить к преждевременному износу жесткого диска. Рекомендуется периодически прово­дить дефрагментацию диска, в процессе которой файлы за­писываются в кластеры, последовательно идущие друг за другом.

Не нашли то, что искали? Воспользуйтесь поиском:

Все программы данные хранятся в долговременной (внешней) памяти компьютера в виде файла.

Файл –это определенное количество информации (программа или данные), имеющие имя и хранящееся в долговременной (внешней) памяти.

Имя файла. Полное имя файла состоит из двух частей, разделенных точкой: собственного имя файла и расширение, определяющее его тип (программа, данные и т.д.). Собственно имя файлу дает пользователь, а тип файла обычно задается программой автоматически при его создании.

В различных операционных системах существуют различные форматы имен файлов. В операционной системе МS-DOSсобственно имя файла должно содержать не более 8 букв латинского алфавита и цифр, а расширение состоит из трех латинских букв, например:proba.txt.

В операционной системе Windowsимя файла может иметь до 255 символов, причем можно использовать русский алфавит, например: Единицы измерения информации.Doc.

Файловая система. На каждом носителе информации (гибком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске определяется используемойфайловой системой

Таблица 1. Типы файловых расширений

.bmp, .gif, .jpg и др.

Программы на языке программирования

Каждый диск разбивается на две области: область хранения файлов и каталог. Каталог содержит название файла и указание на начало его размещения на диске. Если провести аналогию диска с книгой, то область хранения файлов соответствует тексту книги, а каталог – ее оглавлению. Причем книга состоит из страниц, а диск – из секторов.

Для дисков с небольшим количеством файлов (до нескольких десятков) может использоваться одноуровневая файловая система, когда каталог (оглавление диска) представляет собой линейную последовательность имен файлов. Такой каталог можно сравнить с оглавлением детской книжки, которое содержит только названия отдельных рассказов.

Таблица 2.Одноуровневый каталог

Номер начального сектора

Если на диске хранятся сотни и тысячи файлов, то для удобства поиска файлы хранятся в многоуровневой иерархической файловой системе, которая имеет “древовидную” структуру. Такую иерархическую систему можно сравнить, например, с оглавлением данного учебника, которое содержит иерархическую систему разделов, глав, параграфов и пунктов. Начальный, корневой, каталог содержит вложенные каталоги 1-го уровня, в свою очередь, каждый из них может содержать вложенные каталоги 2-го уровня и т.д. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы.

Читайте также:  Как добавить рамку в автокаде

Рис. 1. Иерархическая файловая система

Например, в корневом каталоге находятся два вложенных каталога 1-го уровня (Каталог_1, Каталог_2) и один файл (Файл_1). В свою очередь, в каталоге 1-го уровня (Каталог_1) находятся два вложенных каталога второго уровня (Каталог_1.1 и Каталог_1.2) и один файл (Файл_1.1).

Файловая система– это система хранения файлов и организации каталогов.

Рассмотрим иерархическую файловую систему на конкретном примере. Каждый диск имеет логическое имя (А,В – гибкие диски, С, D,Eи т.д. – жесткие и лазерные диски).

Пусть в корневом каталоге диска С: имеются два каталога 1-го уровня (GAMES,TEXT), а в каталогеGAMES– один каталог 2-го уровня (CHESS). При этом в каталогеTEXTимеется файлproba.txt, а в каталогеCHESS– файлchess.exe.

Рис. 2. Пример иерархической файловой системы

Путь к файлу. Как найти имеющиеся файлы (chess.exe,proba.txt) в данной иерархической файловой системе? Для этого необходимо указать путь к файлу. В путь к файлу входят имя диска, последовательность имен каталогов и имя файла, которые при записи разделяются обратной косой чертой (). Таким образом, пути к вышеперечисленным файлам можно записать следующим образом:

Операции над файлами. В процессе работы на компьютере наиболее часто над файлами производятся следующие операции:

копирование (копия файла помещается в другой каталог),

перемещение (сам файл перемещается в другой каталог),

удаление (файл удаляется из каталога).

В операционных системах с графическим интерфейсом иерархическая файловая система представляется в виде иерархической системы папок.

Имя файла обычно состоит из собственного имени и так называемого расширения, служащего для определения типа данных, хранящихся в файле (типа файла). Имя файла и его расширение разделяются точкой.

Кроме имени, файл имеет атрибуты(дата создания, дата изменения, пользователь прав доступа и т.д.).

Файловая система позволяет организовывать файлы в иерархические древовидные каталоги. Каталог самого верхнего уровня называетсякорневым каталогом. Во многих операционных системах корневой каталог обозначается именем логического источника данных – латинской буквой с двоеточием.

Остальные каталоги делятся на системные и пользовательские. Системные каталоги имеют служебные имена, назначенные операционной системой при установке. Имена пользовательских каталогов задаются пользователем по его усмотрению.

Тот каталог, в котором пользователь находится в настоящий момент, называется текущим каталогом.

Последовательность имен каталогов, проходимых от некоторого каталога до нужного файла, называется путем к этому файлу. Имена каталогов в этой последовательности принято разделять знаком «».

Абсолютное имяфайла складывается из пути к файлу от корневого каталога и имени файла.Относительное имя– из пути к файлу из текущего каталога и имени файла.

Пример. Пусть имя файла E:SCHOOLUSERDOCuser.txt

Это полное имя файла, поскольку оно начинается с имени корневого каталога E:. Путь к файлу – E:SCHOOLUSERDOC. Само имя файла – user.txt, гдеtxt– расширение, указывающее на то, что файл должен содержать текстовые данные.

Для групповых операций с файлами (поиск, удаление, перемещение) используются маски имен файлов. Маска представляет собой последовательность букв, цифр и прочих допустимых в именах файлов символов, в которых также могут встречаться следующие символы:

символ «?» означает ровно один произвольный символ;

символ «*» означает любую последовательность символов произвольной длины, может задавать и пустую последовательность.

Практические задания с решениями

Задание 1.Какие файлы будут выбраны из текущего каталога по маске d * c.?p ?

Решение. По указанной маске будут выбраны из текущего каталога все файлы, имена которых начинаются наdи заканчиваются на с , и одновременно имеют двухбуквенное расширение, заканчиваются на р.

Задание 2. Если каталог K на диске С: с единственным файлом F.txt перекопировали в каталог S каталога Т на диске D:, то к скопированному файлу можно обращаться по его новому полному имени:

Решение.Полное "старое" имя файла – C:KF.txt (этот подкаталог является "элементом" корневого каталога C:). "Новое место", куда "отправляется" каталог K с файлом – D:TS. Следовательно, полное "новое" имя файла – D:TSKF.txt. Ответ: 2.

Задание 3.Перемещаясь из одного каталога в другой, пользователь последовательно посетил каталогиDOC,USER,SCHOOL,A:,LETTER,INBOX. При каждом перемещении пользователь либо спускался в каталог на уровень ниже, либо поднимался на уровень выше. Каково полное имя каталога, из которого начал перемещение пользователь?

Решение.В задачах, где нужно определить полный адрес файла или каталога, нужно начинать с поиска имени диска, в данном случае каталог находится на дискеA:(так обозначается корневой каталог). Поскольку в списке посещенных каталогов передA:стоитSCHOOL, пользователь мог попасть в корень дискаA:только через каталогSCHOOL, поэтому адрес стартового каталога начинается сA:SCHOOL, т. к. среди предложенных вариантов только один удовлетворяет этому условию, можно остановиться (правильный ответ – 3), однако, давайте все же доведем процедуру до конца, это позволит выяснить некоторые интересные моменты, которые не сработали здесь, но могут сработать в других задачах.

Как пользователь попал в каталог SCHOOL? по условию он мог как подниматься, так и спускаться по дереву каталогов, явно он не мог спуститься из USER в SCHOOL, потому что SCHOOL находится в корневом каталоге и каждый каталог имеет только одного «родителя»; значит, пользователь поднялся из USER в SCHOOL, и начальная часть полного адреса А:SCHOOLUSER аналогично можно доказать, что пользователь поднялся в каталог USER из каталога DOC. Таким образом, мы доказали, что правильный ответ – 3.

Комментировать
5 просмотров
Комментариев нет, будьте первым кто его оставит

Это интересно
Adblock detector