Hệ thống tập tin hệ điều hành window

Định nghĩa của hệ thống tệp, những gì chúng cho, và các thông dụng được sử dụng hôm nay

Máy tính sử dụng các loại hệ thống tệp cụ thể (đôi khi viết tắt là FS ) để lưu trữ và sắp xếp dữ liệu trên phương tiện, chẳng hạn như ổ đĩa cứng , CD, DVD và BD trong ổ đĩa quang hoặc trên ổ đĩa flash .

Một hệ thống tệp có thể được coi là một chỉ mục hoặc cơ sở dữ liệu chứa vị trí vật lý của mọi phần dữ liệu trên ổ cứng hoặc thiết bị lưu trữ khác. Dữ liệu thường được tổ chức trong các thư mục được gọi là thư mục, có thể chứa các thư mục và tệp khác.

Bất kỳ nơi nào mà máy tính hoặc thiết bị điện tử khác lưu trữ dữ liệu đều sử dụng một số loại hệ thống tệp. Điều này bao gồm máy tính Windows, máy Mac, điện thoại thông minh, máy ATM của ngân hàng ... ngay cả trong máy tính của bạn!

Windows File Systems

Hệ điều hành Microsoft Windows luôn được hỗ trợ và vẫn hỗ trợ, các phiên bản khác nhau của hệ thống tệp FAT (File Allocation Table).

Ngoài FAT, tất cả các hệ điều hành Microsoft Windows vì Windows NT hỗ trợ hệ thống tệp mới hơn có tên NTFS (Hệ thống tệp công nghệ mới).

Tất cả các phiên bản Windows hiện đại cũng hỗ trợ exFAT , một hệ thống tệp được thiết kế cho các ổ đĩa flash .

Một hệ thống tập tin là một thiết lập trên một ổ đĩa trong một định dạng . Xem cách định dạng ổ đĩa cứng để biết thêm thông tin.

Tìm hiểu thêm về Hệ thống tệp

Các tập tin trên thiết bị lưu trữ được lưu giữ trong các lĩnh vực được gọi là. Các lĩnh vực được đánh dấu là không sử dụng có thể được sử dụng để lưu trữ dữ liệu, thường được thực hiện trong các nhóm các lĩnh vực được gọi là khối. Đó là hệ thống tập tin xác định kích thước và vị trí của các tập tin cũng như các lĩnh vực đã sẵn sàng để được sử dụng.

Mẹo: Theo thời gian, do cách hệ thống tệp lưu trữ dữ liệu, việc ghi vào và xóa khỏi thiết bị lưu trữ gây ra phân mảnh do các khoảng trống chắc chắn xảy ra giữa các phần khác nhau của tệp. Tiện ích chống phân mảnh miễn phí có thể giúp khắc phục điều đó.

Nếu không có cấu trúc để sắp xếp các tập tin, không chỉ có thể xóa các chương trình đã cài đặt và lấy các tệp cụ thể mà không có hai tệp có thể tồn tại cùng tên vì mọi thứ có thể nằm trong cùng một thư mục (đó là một thư mục lý do) hữu ích).

Lưu ý: Những gì tôi có nghĩa là bởi các tập tin có cùng tên giống như một hình ảnh, ví dụ. Tệp IMG123.jpg có thể tồn tại trong hàng trăm thư mục vì mỗi thư mục được sử dụng để tách tệp JPG , do đó không có xung đột. Tuy nhiên, các tệp không thể chứa cùng tên nếu chúng nằm trong cùng một thư mục.

Một hệ thống tệp không chỉ lưu trữ các tệp mà còn thông tin về chúng, như kích thước khối ngành, thông tin phân mảnh, kích thước tệp, thuộc tính , tên tệp, vị trí tệp và phân cấp thư mục.

Một số hệ điều hành khác ngoài Windows cũng tận dụng lợi thế của FAT và NTFS nhưng nhiều loại hệ thống tệp khác nhau tồn tại, như HFS + được sử dụng trong sản phẩm của Apple như iOS và macOS. Wikipedia có danh sách toàn diện các hệ thống tệp nếu bạn quan tâm nhiều hơn đến chủ đề này.

Đôi khi, thuật ngữ "hệ thống tệp" được sử dụng trong ngữ cảnh phân vùng . Ví dụ: nói "có hai hệ thống tệp trên ổ cứng của tôi" không có nghĩa là ổ đĩa được phân chia giữa NTFS và FAT, nhưng có hai phân vùng riêng biệt đang sử dụng hệ thống tệp.

Hầu hết các ứng dụng bạn tiếp xúc với yêu cầu hệ thống tệp để hoạt động, vì vậy mọi phân vùng phải có một. Ngoài ra, các chương trình phụ thuộc vào hệ thống tập tin, có nghĩa là bạn không thể sử dụng một chương trình trên Windows nếu nó được xây dựng để sử dụng trong macOS.

BỘ CÔNG THƢƠNG
TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN



BÀI TẬP LỚN
MÔN HỌC: NGUYÊN LÝ HỆ ĐIỀU HÀNH
ĐỀ TÀI: NGHIÊN CỨU TÌM HIỂU VỀ HỆ THÔNG TẬP TIN TRONG
HĐH WINDOWS

Nhóm sinh viên thực hiện: Nhóm số 9A
Lớp: ĐH KTPM1-K7
Sinh viên thực hiện:
1.

VŨ VĂN THÀNH

2.

LA VĂN DŨNG

3.

NGUYỄN QUANG LONG

4.

NGUYỄN VĂN QUẢNG

5.

ĐỖ VĂN QUẢNG

Hà Nội, 2013

MỤC LỤC
LỜI MỞ ĐẦU: ...............................................................................................................1
CHƢƠNG I: TỔNG QUAN VỀ HỆ THỐNG TẬP TIN TRONG HĐH WINDOWS ....... 2
1.1. Hệ điều hành window ..................................................................................................... 2
1.2. Hệ thống tập tin .............................................................................................................. 2
1.2.1. Khái niệm ................................................................................................................ 2
1.2.3. Không gian quản lý .................................................................................................... 3
1.2.4. Folder (máy tính) ........................................................................................................ 3
1.2.5. Các tiện ích ................................................................................................................. 3
1.2.6. File hệ thống và hệ điều hành.................................................................................... 3
CHƢƠNG II: CÁC HỆ THỐNG TẬP TIN TRONG HĐH WINDOWS............................ 4
I. HỆ THỐNG TẬP TIN FAT .............................................................................................. 4
1.1. Giới thiệu..................................................................................................................... 4
1.1.1. Các thuộc tính trên hệ thống tập tin FAT ................................................................ 4
1.1.2. Tên tập tin ................................................................................................................. 5
1.1.3. Các thí dụ về cấu trúc bit trong nội dung thông tin của tập tin ................................ 5
1.2. FAT ............................................................................................................................... 7
1.3. FAT12 ........................................................................................................................... 7
1.4. FAT16 ........................................................................................................................... 8
1.5. FAT32 ........................................................................................................................... 8
II.

HỆ THÔNG TẬP TIN NTFS ......................................................................................... 9

2.3. Các phiên bản ................................................................................................................ 9
2.4. Các đặc tính ................................................................................................................. 10
2.4.1. Bản ghi số thứ tự cập nhật (USN) .......................................................................... 10
2.4.2. Các liên kết cứng và viết tắt tên tập tin .................................................................. 11
2.4.3. Các dòng dữ liệu luân phiên (ADS) ....................................................................... 11
2.4.4. Các tập tin thƣa ...................................................................................................... 12
2.4.5. Tập tin nén ............................................................................................................. 12
2.4.5. Sao chép bóng ổ đĩa ............................................................................................... 13
2.4.6. Giao tác NTFS ....................................................................................................... 14
2.4.7. Hệ thống tập tin mã hóa (EFS - Encrypting File System) ..................................... 15
2.4.8. Cấp hạn ngạch ........................................................................................................ 16
2.4.9. Các điểm phân tích ................................................................................................ 16
2.5. Ƣu điểm và hạn chế..................................................................................................... 16
III. HỆ THỐNG TẬP TIN HPFS ....................................................................................... 18
IV. CDFS(ISO 9660)........................................................................................................... 19
V. UDF ............................................................................................................................... 19
VI. ReFS .............................................................................................................................. 20
CHƢƠNG III: TỔNG KẾT ................................................................................................... 21

Danh mục hình ảnh:
Hình 1.1: Hai tập tin văn bản dạnh đơn giản dùng mã ASCII ............................ 5
Hình 1.2: Cấu trúc bit của tập tin hình ảnh .......................................................... 6
Hình 1.3: So sánh giữa FAT12, FAT16 và FAT32 .............................................. 7
Hình 2.1: Tập tin NTFS có nhiều cải tiến hơn so với FAT .................................. 9
Hình 2.2: ADS giúp kiểm tra các tập tin và yêu cầu xác nhận ........................... 11
Hình 2.3: Quá trình nén tập tin của NTFS ........................................................ 12
Hình 2.4: Sao chép bóng ổ đĩa với hệ thong tập tin NTFS ................................. 13
Hình 2.5: Sơ đồ giao tác NTFS ........................................................................... 14

Lời nói đầu
Trong cuộc sống, đôi lúc chúng ta cảm thấy việc tiêu xài của mình chưa hợp lý
dẫn đến lãng phí tiền bạc cũng như thời gian.Và ước gì mình có một người giúp mình
quản lý việc đấy! Máy tính cũng vậy. Nó cũng có tài nguyên và cần có chương trình
quản lý hợp lý việc sử dụng tài nguyên đó một cách tối ưu.
Tài nguyên máy tính mà điển hình là hệ cơ sở dữ liệu (Database System) có ảnh
hưởng rất nhiều tới tính hiệu quả của việc sử dụng máy tính. Mà trong đó hệ thống
các file là hệ thống chủ yếu. Bởi vậy quản lí hệ thống file như thế nào có ảnh hưởng
lớn và trực tiếp tới hiệu quả sử dụng máy tính. Việc quản lí hệ thống file được xây
dựng và tổ chức tùy thuộc vào từng hệ điều hành. Và trong bài tiểu luân này chúng ta
sẽ tìm hiểu về hệ thống tập tin đó trong hệ điều hành phổ biến nhất hiện nay – hệ điều
hành Windows
Trong quá trình thực hiện đề tài chúng tôi đã gặp không ít khó khăn và khúc mắc.
Cũng rất may mắn khi được thấy giáo hướng dẫn Th. Vương Quốc Dũng đã nhiệt tình
giải đáp thắc mắc và hướng dẫn một cách chi tiết. Cộng với sự cố gắng của các thành
viên nhờ đó chúng tôi đã hoàn thành được tài liệu này. Mặc dù vậy khi làm một bài
tập cần tính công phu và tập trung cao thì sai sót là không thể tránh khỏi. Chúng tôi
mong nhận đượ những lời đóng góp của thầy giáo và bạn đọc để tài liệu này hoàn
thiện hơn nữa.
Chúng tôi xin chân thành cảm ơn!

Nhóm tác giả: nhóm 9A-ktpm1_k7

1

Chƣơng I:
TỔNG QUAN VỀ HỆ THỐNG TẬP TIN TRONG
HĐH WINDOWS
1.1. Hệ điều hành window
Hệ điều hành window là một hệ điều hành đa nhiệm (multi tasking) có thể xử lý
nhiều chƣơng trình cùng một lúc
Giao diệnNền(Desktop) là đặt các biểu tƣợng để khi nhấp chuột lên một biểu
tƣợng bất kỳ này, ngƣời dùng sẽ chạy đƣợc một ứng dụng mặc định gán cho biểu
tƣợng ấy.
Chức năng là : quản lý tiến trình, quản lý bộ nhớ trong, quản lý bộ nhớ ngoài,
quản lý hệ thống vào/ra, quản lý file, hệ thống bảo vệ, lập mạng, hệ thống giải thích
lệnh (thông dịch lệnh).
Các chƣơng trình hệ thống cung cấp công cụ cho ngƣời sử dụng thực hiện các
thao tác quản lý và điều khiển hệ thống.
Các chƣơng trình ứng dụng đi kèm hệ điều hành nhằm mục đích hỗ trợ cho ngƣời sử
dụng thực hiện các thao tác ứng dụng cơ bản nhƣ: các chƣơng trình soạn thỏa văn bản,
các trình duyệt Web, các chƣơng trình trò chơi giải trí....
Hộp thoại khởi động: Dùng một dòng lịnh trong hộp thoại khởi động (Run) để thực thi
một công việc, địa chỉ trang mạng (ví dụ: http://www.yahoo.com), khởi động một
trình. Trong hộp thoại của run gõ: calc để mở máy tính.
1.2. Hệ thống tập tin
1.2.1. Khái niệm
Tập tin là dữ liệu máy tính đƣợc lƣu trữ trên các thiết bị nhớ ngoài nhƣ: băng từ,
đĩa từ, đĩa quang...và đƣợc tập hợp một cách có tổ chức theo đơn vị lƣu trữ gọi là file.
Nhƣ vậy, file là đơn vị logic để hệ điều hành quản lý thông tin trên đĩa. File có thể là
một chƣơng trình của ngƣời sử dụng, một chƣơng trình của hệ thống hoặc một tập hợp
dữ liệu của ngƣời sử dụng.

2

Hệ thống tệp tin :là một phƣơng tiện để tổ chức các dữ liệu dự kiến sẽ đƣợc giữ lại
sau khi một chƣơng trình chấm dứt bằng cách cung cấp các thủ tục để lƣu trữ, truy
xuất và cập nhật dữ liệu cũng nhƣ quản lý không gian có sẵn trên thiết bị có chứa nó.
1.2.2. Phân loại
Các loại hệ thống tập tin của window: Windows cho phép làm việc với hệ thống tập tin
FAT(FAT,FAT12,FAT16,FAT32), NTFS, ISO9660(CDFS), UDF(định dạng đĩa phổ
quát), HPFS và gần đây nhất là ReFS. FAT,FAT12,FAT16 đƣợc hộ trợ ở mọi phiên
bản của Windows;NTFS đƣợc hộ trợ bời mọi phiên bản của Windows NT. Tuy nhiên
các hệ thống tập tin khác chỉ đƣợc hộ trợ ở những phiên bản nhất định
1.2.3. Không gian quản lý
Hệ thống tập tin phân bổ không gian một cách dạng hạt, thƣờng là nhiều đơn vị
vật lý trên thiết bị.
Hệ thống tập tin chịu trách nhiệm tổ chức các tập tin và thƣ mục, và theo dõi
trong đó khu vực của các phƣơng tiện truyền thông thuộc tập tin đó và không đƣợc sử
dụng.
1.2.4. Folder (máy tính)
Trong máy tính, các tập tin đƣợc lƣu giữ tổ chức lƣu trữ các tập tin có liên quan
trong cùng thƣ mục. Trong một phân cấp hệ thống tập tin (có nghĩa là, một trong các
tập tin và thƣ mục đƣợc tổ chức một cách tƣơng tự nhƣ một đảo cây), một thƣ mục
chứa bên trong thƣ mục khác đƣợc gọi là một thƣ mục con. Các thƣ mục đầu tiên trong
một hệ thống tập tin nhƣ vậy đƣợc gọi là thƣ mục gốc.
1.2.5. Các tiện ích
Hệ thống tập tin bao gồm các tiện ích để khởi tạo, thay đổi thông số của và loại
bỏ một thể hiện của hệ thống tập tin. Một số bao gồm khả năng mở rộng hoặc cắt ngắn
không gian đƣợc phân bổ cho hệ thống tập tin.
1.2.6.

File hệ thống và hệ điều hành

Nhiều hệ điều hành bao gồm hỗ trợ cho nhiều hơn một hệ thống tập tin. Đôi khi hệ
điều hành và hệ thống tập tin đƣợc đan kết chặt chẽ nhƣ vậy rất khó để tách ra các
chức năng hệ thống tập tin.

3

Chƣơng II:
CÁC HỆ THỐNG TẬP TIN TRONG
HĐH WINDOWS
I. HỆ THỐNG TẬP TIN FAT
1.1. Giới thiệu
FAT là viết tắt của "File Allocation Table" tạm dịch là "Bảng cấp phát tập tin".
FAT đƣợc giới thiệu lần đầu tiên vào năm 1977 với phiên bản FAT12. Sau đó là các
phiên bản FAT16 và FAT32.
FAT hệ thống tập tin đƣợc hỗ trợ bởi hầu nhƣ tất cả các hệ điều hành cho máy
tính cá nhân, bao gồm tất cả các phiên bản của Windows và MS-DOS / PC
DOS và DR-DOS. (PC DOS là một phiên bản OEM của MS-DOS, MS-DOS ban đầu
đƣợc dựa trên SCP 's 86-DOS. DR-DOS đƣợc dựa trên kỹ thuật số nghiên cứu đồng
thời hệ điều hành DOS, một kế thừa của CP/M-86.)
1.1.1. Các thuộc tính trên hệ thống tập tin FAT
 Archive (lƣu trữ): Trên các hệ điều hành DOS thì thuộc tính này đƣợc định
khi mỗi khi tập tin bị thay đổi, và bị xóa khi thực hiện lệnh backup để sao lƣu dữ
liệu.
 Hidden (ẩn): Khi một tập tin có thuộc tính này thì các chƣơng trình liệt kê các
tập tin theo mặc định sẽ bỏ qua, không liệt kê tập tin này. Ngƣời sử dụng vẫn có thể
làm việc trên tập tin này nhƣ bình thƣờng.
 Read-only (chỉ đọc): Khi một tập tin có thuộc tính này thì các chƣơng trình xử
lý tập tin theo mặc định sẽ không cho phép xóa, di chuyển tập tin hoặc thay đổi nội
dung tập tin. Còn các thao tác khác nhƣ đổi tên tập tin, đọc nội dung tập tin vẫn đƣợc
cho phép.
 System (thuộc về hệ thống): Một tập tin có thuộc tính này sẽ chịu các hạn chế
bao gồm các hạn chế của thuộc tính Hidden và các hạn chế của thuộc tính Read-only,
4

nghĩa là không bị liệt kê, không thể xóa, di chuyển, thay đổi nội dung. Thuộc tính
này chủ yếu dùng cho các tập tin quan trọng của hệ điều hành.
 Sub-directory (hay directory): thƣ mục con. Những tập tin có thuộc tính này
đƣợc xử lý nhƣ là thƣ mục. Thƣ mục là tập tin ở dạng đặc biệt, nội dung không chứa
dữ liệu thông thƣờng mà chứa các tập tin và các thƣ mục khác.
1.1.2. Tên tập tin
 Tùy theo hệ điều hành mà có thể có các qui ƣớc về tên tập tin.
 Độ dài của tên tập tin tùy thuộc vào hệ thống tập tin.
 Tùy thuộc vào hệ thống tập tin và hệ điều hành mà sẽ có một số ký tự
không đƣợc dùng cho tên tập tin.
Thí dụ: Trên hệ điều hành Microsoft Windows, không đƣợc dùng các ký tự sau
trong tên tập tin: \ / : * ? " < > | , tên tệp không quá 255 ký tự thƣờng
Theo truyền thống cũ của hệ thống DOS và Windows, tên tập tin thƣờng bao
gồm hai phần: phần tên và phần mở rộng (còn gọi là phần đuôi). Tuy nhiên, tên của
một tập tin không nhất thiết phải có phần mở rộng này.
1.1.3. Các thí dụ về cấu trúc bit trong nội dung thông tin của tập tin
Thí dụ về cấu trúc bit của tập tin ASCII

Hình 1.1: Hai tập tin văn bản dạnh đơn giản dùng mã ASCII

5

Trong hình trên là hai tập tin văn bản dạng đơn giản dùng mã ASCII. Tập tin
"hoso.txt" là tập tin soạn ra bằng lệnh edit của hệ điều hành Windows. Tập tin thứ nhì,
"hoso2.txt", lại đƣợc soạn thảo bằng lệnh vi trong hệ điều hành Linux. Hãy lƣu ý qui
ƣớc xuống hàng của tập tin trong Windows sẽ bao gồm hai byte: dấu CR (cariage
return) có giá trị ASCII là 0x0D và dấu LF (line feed) có giá trị 0x0A; trong khi đó,
Linux chỉ cần dấu LF là đủ. Điều này cho thấy sự khác nhau về định dạng.

Hình 1.2: Cấu trúc bit của tập tin hình ảnh

Thí dụ về cấu trúc bit của tập tin hình ảnh
Ý nghĩa

Bit
(Hệ thập lục)
00-01

Tên nhận dạng “BM” (viết tắt của “bitmap”)

02-05

Cở của tập tin

0A- 0D Địa chỉ bắt đầu của các Bit màu
0E-11

Cở của phần đầu (thông tin về bitmap) thƣờng là 40 byte
12-15
ngang = 5)

Chiều ngang của bitmap (đơn vị pixel --hình này có chiều

16-19 Chiều cao của bitmap (đơn vi pixel – hình này có chiều cao
= 10 (0x0A))
1C-1D

Số bit cho một điểm màu (hình này dùng 4 bit tức 2^4 =16 màu)
22-25

Cơ sở của bitmap
6

1.2.

FAT
Bảng FAT gồm nhiều phần tử. Chiều dài mỗi phần tử đƣợc tính bằng số bit,

biểu thị số đếm của bảng FAT.

Hình 1.3: So sánh giữa FAT12, FAT16 và FAT32

Trong những năm qua, hệ thống tập tin đã đƣợc mở rộng từ FAT12 đến
FAT16 và FAT32. Tính năng khác nhau đã đƣợc thêm vào hệ thống tập tin bao gồm
cả thƣ mục con, hỗ trợ bảng mã, các thuộc tính mở rộng, và tên tập tin dài.
1.3. FAT12
FAT12 đƣợc dùng cho ổ đĩa mềm, ổ đĩa có dung lƣợng từ 32MB trở xuống.
FAT12 sử dụng 12 bit để đếm nên chỉ có khả năng quản lý các ổ đĩa có dung lƣợng
7

thấp hơn 32Mb với số lƣợng cluster thấp.( CLUSTER (liên cung) là một đơn vị lƣu trữ
gồm một hoặc nhiều sector. Khi HĐH lƣu trữ một tập tin vào đĩa, nó ghi tập tin đó vào
hàng chục, có khi hàng trăm cluster liền nhau. Nếu không sẵn cluster liền nhau, HĐH
sẽ tìm kiếm cluster còn trống ở kế đó và ghi tiếp tập tin lên đĩa. Quá trình cứ thế tiếp
tục nhƣ vậy cho đến khi toàn bộ dữ liệu đƣợc cất giữ hết.)
1.4. FAT16
Với hệ điều hành MS-DOS, hệ thống tập tin FAT (FAT16 – để phân biệt với
FAT32) đƣợc công bố vào năm 1981 đƣa ra một cách thức mới về việc tổ chức và
quản lý tập tin trên đĩa cứng, đĩa mềm. Tuy nhiên, khi dung lƣợng đĩa cứng ngày càng
tăng nhanh, FAT16 đã bộc lộ nhiều hạn chế. Với không gian địa chỉ 16 bit, FAT16 chỉ
hỗ trợ đến 65.536 liên cung (cluster) trên một partition, gây ra sự lãng phí dung lƣợng
đáng kể (đến 50% dung lƣợng đối với những ổ đĩa cứng trên 2 GB).
FAT12 và FAT16 hệ thống tập tin có một giới hạn về số lƣợng các mục
trong thƣ mục gốc của hệ thống tập tin và có hạn chế về kích thƣớc tối đa của đĩa
hoặc phân vùng định dạng FAT.
1.5. FAT32
Để giải quyết những hạn chế trong FAT12 và FAT16, ngoại trừ giới hạn kích
thƣớc tập tin của gần 4 GB, nhƣng nó vẫn còn hạn chế so với NTFS. Đƣợc giới thiệu
trong phiên bản Windows 95 Service Pack 2 (OSR 2), đƣợc xem là phiên bản mở rộng
của FAT16. Do sử dụng không gian địa chỉ 32 bit nên FAT32 hỗ trợ nhiều cluster trên
một partition hơn, do vậy không gian đĩa cứng đƣợc tận dụng nhiều hơn. Ngoài ra với
khả năng hỗ trợ kích thƣớc của phân vùng từ 2GB lên 2000GB và chiều dài tối đa của
tên tập tin đƣợc mở rộng đến 255 ký tự đã làm cho FAT16 nhanh chóng bị lãng quên.
Tuy nhiên, nhƣợc điểm của FAT32 là tính bảo mật và khả năng chịu lỗi (Fault
Tolerance) không cao.
FAT12, FAT16 và FAT32 cũng có một giới hạn của tám ký tự cho tên tập tin,
và ba ký tự cho phần mở rộng (nhƣ exe) Thƣờng đƣợc gọi là tên tập tin 8,3 giới hạn.

8

II.

HỆ THÔNG TẬP TIN NTFS
2.1. Giới thiệu

NTFS (New Technology File System: Hệ thống tập tin công nghệ mới) là hệ
thống tập tin tiêu chuẩn của Windows NT, bao gồm cả các phiên bản sau này của
Windows nhƣ Windows 2000, Windows XP, Windows Server 2003, Windows Server
2008, Windows Vista, và Windows 7.
NTFS thay thế hệ thống tập tin FAT vốn là hệ thống tập tin ƣa thích cho các hệ
điều hành Windows của Microsoft. NTFS có nhiều cải tiến hơn FAT và HPFS (High
Performance File System - Hệ thống tập tin hiệu năng cao) nhƣ hỗ trợ cải tiến cho các
siêu dữ liệu và sử dụng các cấu trúc dữ liệu tiên tiến để cải thiện hiệu suất, độ tin cậy,
và sử dụng không gian ổ đĩa, cộng thêm phần mở rộng nhƣ các danh sách kiểm soát
truy cập bảo mật (access control list-ACL) và bản ghi hệ thống tập tin.

Hình 2.1: Tập tin NTFS có nhiều cải tiến hơn so với FAT

2.3. Các phiên bản
NTFS có 5 phiên bản đƣợc phát hành:

Phiên bản 1.0 (v1.0) với NT 3.1, phát hành giữa năm 1993

Phiên bản 1.1 (v1.1) với NT 3.5, phát hành cuối năm 1994

9

Phiên bản 1.2 (v1.2) với NT 3.51 (giữa năm 1995) và NT 4 (giữa năm 1996)
(đôi khi còn gọi là "NTFS 4.0", vì phiên bản OS là 4.0)

Phiên bản 3.0 (v3.0) của Windows 2000 ("NTFS V5.0")

Phiên bản 3.1 (v3.1) của Windows XP (mùa thu 2001; "NTFS V5.1"),
Windows Server 2003 (mùa xuân 2003; đôi khi còn gọi là "NTFS V5.2"),
Windows Vista (giữa năm 2005) (đôi khi còn gọi là "NTFS V6.0") và Windows
Server 2008

V1.0 và V1.1 (và các phiên bản mới hơn) không tƣơng thích: vì các đĩa đƣợc ghi bằng
NT 3.5x không thể đọc đƣợc bằng NT 3.1 cho đến khi một bản cập nhật trên đĩa CD
có NT 3.5x đƣợc áp dụng cho NT 3.1, bản cập nhật cũng thêm vài hỗ trợ tên tập tin dài
FAT. V1.2 hỗ trợ các tập tin nén, các dòng dữ liệu đƣợc đặt tên, bảo mật dựa trên
ACL…
2.4. Các đặc tính
NTFS v3.0 bao gồm vài đặc tính mới so với FAT, đó là: hỗ trợ tập tin rải, cấp
hạn ngạch sử dụng ổ đĩa, các điểm phân tích kiểm tra, theo dõi liên kết phân phối, và
mã hóa các mức tập tin, cũng còn gọi là Hệ thống tập tin mã hóa (EFS).
2.4.1. Bản ghi số thứ tự cập nhật (USN)
Đây là một đặc tính quản lý hệ thống ghi các thay đổi của tất cả các tập tin, dòng
dữ liệu và thƣ mục trong đĩa, cũng nhƣ các đặc tính khác của tập tin, thƣ mục và các
thiết lập bảo mật. Đây là một chức năng quan trọng của NTFS (một tính năng mà
FAT/FAT32 không có) để bảo đảm rằng các cấu trúc dữ liệu phức tạp bên trong của
nó và các chỉ số (cho các thƣ mục và ký hiệu bảo mật) sẽ còn phù hợp trong mọi
trƣờng hợp hệ thống bị hƣ hỏng, và cho phép dễ dàng hủy các thay đổi không ràng
buộc với các cấu trúc dữ liệu quan trọng đó khi ổ đĩa sẽ bị cài đặc lại. Trong các phiên
bản mới của Window, bản ghi số thứ tự cập nhật đã mở rộng để truy theo trạng thái
của các hoạt động giao tác khác trên các phần khác của hệ thống tập tin NTFS, chẳng
hạn nhƣ các bản sao bóng VSS của các tập tin hệ thống với các ngữ nghĩa copy-onwrite (Copy-on-Write (COW) cho phép tiến trình cha và con dùng chung trang trong
bộ nhớ khi mới khởi tạo tiến trình con), hoặc thực hiện các Giao tác NTFS và các hệ
thống tập tin phân phối.
10

2.4.2. Các liên kết cứng và viết tắt tên tập tin
Ban đầu gồm hỗ trợ hệ thống con POSIX trong Windows NT, các liên kết cứng
tƣơng tự nhƣ các nút thƣ mục, nhƣng đƣợc sử dụng cho các tập tin thay vì các thƣ
mục. Các liên kết cứng chỉ có thể đƣợc áp dụng cho các tập tin trên cùng một ổ đĩa từ
một bản ghi tên tập tin phụ đƣợc thêm vào bản ghi MFT của tập tin. Viết ngắn tên tập
tin cũng đƣợc thực hiện nhƣ các bản ghi tên tập tin phụ, nó không có các danh sách
thƣ mục riêng biệt.
2.4.3. Các dòng dữ liệu luân phiên (ADS)
Các dòng dữ liệu luân phiên cho phép nhiều hơn một dòng dữ liệu đƣợc liên kết
với một tên tập tin, sử dụng định dạng tên tập tin là "filename:streamname" (ví dụ
"text.txt:extrastream). Các dòng luân phiên không đƣợc liệt kê trong Windows
Explorer, và kích thƣớc của chúng không bao gồm cả kích thƣớc của tập tin. Chỉ có
dòng chính của một tập tin đƣợc duy trì khi nó đƣợc sao chép vào một mạng chia sẻ
hoặc ổ đĩa USB định dạng FAT, gắn với một e-mail, hay tải lên một website. Do đó,
sử dụng các dòng luân phiên cho dữ liệu quan trọng có thể gây ra các vấn đề. Các
dòng NTFS đƣợc giới thiệu trong Windows NT 3.1, để kích hoạt Các dịch vụ cho
Macintosh (SFM) nhằm lƣu trữ các nhánh tài nguyên Macintosh. Mặc dù các phiên
bản hiện hành của Windows Server không còn gồm SFM.

Hình 2.2: ADS giúp kiểm tra các tập tin và yêu cầu xác nhận

ADS rất nhỏ cũng đƣợc thêm vào trong chƣơng trình Internet Explorer (và cả các
trình duyệt khác hiện nay) để đánh dấu các tập tin đã đƣợc tải về từ các trang bên
11

ngoài: chúng có thể không an toàn để chạy cục bộ và tiện ích cục bộ sẽ yêu cầu xác
nhận từ ngƣời dùng trƣớc khi mở chúng. Khi ngƣời dùng không muốn xác nhận yêu
cầu này, ADS chỉ đơn giản giảm xuống từ danh mục MFT cho các tập tin đƣợc
download.
Một số trình ứng dụng media cũng đã cố gắng sử dụng ADS để lƣu trữ siêu dữ
liệu cho các tập tin media, để tổ chức sắp xếp, mà không sửa đổi nội dung dữ liệu có
ích của bản thân các tập tin media (sử dụng các các thẻ nhúng khi chúng đƣợc hỗ trợ
bởi các đinh dạng tập tin media nhƣ MPEG và OGG).
2.4.4. Các tập tin thƣa
Các tập tin thƣa là các tập tin chứa các tập hợp dữ liệu thƣa thớt, dữ liệu chủ yếu
đƣợc làm đầy bằng các số 0. Các ứng dụng cơ sở dữ liệu, đôi khi sử dụng các tập tin
thƣa. Vì điều này, Microsoft đã triển khai thực hiện hỗ trợ cho việc lƣu trữ hiệu quả
của các tập tin thƣa bằng cách cho phép một ứng dụng chỉ rõ các vùng dữ liệu rỗng
(vùng toàn số 0). Một ứng dụng đọc một tập tin thƣa theo kiểu bình thƣớng với hệ
thống tập tin tính toán những gì dữ liệu cần phải trả lại dựa trên khoảng trống tập tin.
Cũng nhƣ với các tập tin nén, kích thƣớc thực tế của các tập tin thƣa không đƣợc đƣa
vào bản kê khai khi xác định các giới hạn hạn ngạch.
2.4.5. Tập tin nén
NTFS nén các tập tin bắng cách sử dụng một biến thể của thật toán LZ77. Mặc

12tin của NTFS
Hình 2.3: Quá trình nén tập

dù truy cập đọc-ghi vào các tập tin nén đƣợc rõ ràng, Microsoft khuyến cáo tránh nén
trên các hệ thống server và/hoặc mạng chia sẻ giữ hồ sơ chuyển vùng vì nó nạp một
lƣợng đáng kể thông tin cần xử lý vào bộ xử lý.
2.4.5. Sao chép bóng ổ đĩa
Dịch vụ sao chép bóng ổ đĩa (Volume Shadow Copy Service - VSS) giữ lại các
phiên bản cũ của các tập tin và thƣ mục trong các ổ đĩa NTFS bằng cách sao chép dữ
liệu ghi đè mới, cũ (copy-on-write). Dữ liệu tập tin cũ che dữ liệu mới khi ngƣời dùng
yêu cầu hoàn nguyên một phiên bản trƣớc đó. Điều này cho phép các chƣơng trình sao
lƣu dữ liệu lƣu trữ các tập tin hiện thời đang đƣợc sử dụng bởi hệ thống tập tin. Trên
các hệ thống xử lý nhiều, Microsoft khuyến cáo thiếp lập một ổ sao lƣu bóng trên một
ổ đĩa riêng.

Hình 2.4: Sao chép bóng ổ đĩa với hệ thong tập tin NTFS

Để đảm bảo phục hồi trong trƣờng hợp hệ thống hƣ hỏng, VSS cũng sử dụng bản
ghi USN để đánh dấu các giao tác cục bộ và đảm bảo các thay đổi hệ thống tập tin sẽ
đƣợc phục hồi hiệu quả sau khi hệ thống khởi động lại khi ổ đĩa NTFS sẽ đƣợc cài đặt
lại, hoặc giảm xuống an toàn đến một phiên bản cũ nếu phiên bản mới không đƣợc ghi
đầy đủ trƣớc khi xác nhận thực sự trƣớc lúc đóng tập tin sửa đổi. Tuy nhiên, các bóng
VSS này không đƣợc phối hợp tổng thể trên nhiều tập tin hay ổ đĩa, trừ khi sử dụng
một ngƣời phối hợp giao tác. Họ chỉ có thể đƣợc sử dụng để đảm bảo răng các phiên
13

bản cũ sẽ vẫn có thể truy cập trong các hoạt động sao lƣu, để nhận đƣợc hình ảnh hệ
thống phù hợp.
2.4.6. Giao tác NTFS
Nhƣ với Windows Vista, các ứng dụng có thể sử dụng Giao tác NTFS để thay
đổi nhóm các tập tin với nhau trong một giao tác. Giao tác sẽ đảm bảo tất cả thay đổi
đƣợc diễn ra, hoặc không một ứng dụng nào trong tất cả đƣợc chạy, và nó sẽ đảm bảo
các ứng dụng bên ngoài giao tác sẽ không nhìn thấy nhƣng thay đổi cho đến khi chúng
đƣợc thỏa hiệp thực hiện chính xác tức thì. Nó sử dụng các kỹ thuật tƣơng tự nhƣ đƣợc
sử dụng cho sao chép bóng ổ đĩa (ví dụ nhƣ copy-on-write) để đảm bảo dữ liệu ghi đè
một cách an toàn, và các bản ghi UFS đánh dấu các giao tác vẫn chƣa đƣợc thỏa hiệp,
hay những giao tác đã đƣợc xác nhận nhƣn chƣa đƣợc áp dụng hoàn toàn (trong trƣờng
hợp hệ thống hƣ hỏng trong một thỏa hiệp bởi một trong những bên tham gia).
Tuy nhiên, trong một hệ thống tập tin cho phép giao tác, điều này có thể đƣợc sử
dụng tạm thời cho tất cả tập tin khác cần thiết cho bất kỳ loại phân vùng, miễn là giao
tác không phải thỏa hiệp, so với các tập tin hệ thống chỉ đƣợc đánh dấu cố định và
đƣợc sửa đổi hoàn toàn trong các giao tác cục bộ ngầm riêng.

Hình 2.5: Sơ đồ giao tác NTFS

Giao tác NTFS không hạn chế các giao tác để chỉ ổ đĩa NTFS cục bộ, nhƣng
cũng bao gồm các dữ liệu khác hoặc các hoạt động ở các điểm khác nhƣ lƣu trữ dữ
14

liệu trong các ổ đĩa riêng biệt, thanh ghi cục bộ, hay các cơ sở dữ liệu SQL, hoặc các
trạng thái hiện tại của các dịch vụ hệ thống hay các dịch vụ từ xa.
Các giao tác là mạng rộng đƣợc điều phối với tất cả ngƣời tham gia bằng cách sử
dụng một dịch vụ cụ thể. Distributed Transactions Coordinator (DTC) đảm bảo rằng
tất cả ngƣời tham gia sẽ nhận đƣợc cùng trạng thái thỏa hiệp, và để vận chuyển các
thay đổi đã đƣợc xác nhận bởi bất kỳ ngƣời tham gia nào. Giao tác NTFS cho phép tạo
ra mạng rộng phù hợp các hệ thống tập tin đƣợc phân phối, bao gồm với cả tập tin cục
bộ hay trong các bộ nhớ đệm ngoại tuyến.
2.4.7.

Hệ thống tập tin mã hóa (EFS - Encrypting File System)

EFS cung cấp khả năng mã hóa mạnh và rõ ràng đối với ngƣời dùng cho bất kỳ
tập tin hay thƣ mục nào trên một ổ đĩa NTFS. EFS làm việc chung với dịch vụ EFS,
CryptoAPI của Microsoft và Thƣ viện thực thi hệ thống tập tin EFS (FSRTL). EFS
hoạt động bằng cách mã hóa một tập tin với một khóa đối xứng khối (còn đƣợc gọi là
Khóa mã hóa tập tin hay FEK), khóa này đƣợc sử dụng vì nó cần một khoảng thời gian
nhỏ tƣơng đối để mã hóa và giải mã số lƣợng lớn của dữ liệu, hơn là nếu một mã khóa
không đối xứng đƣợc sử dụng. Khóa đối xứng đƣợc sử dụng để mã hóa tập tin sau đó
sẽ đƣợc mã hóa với một khóa dùng chung, tiếp theo kết hợp với ngƣời dùng đã mã hóa
tập tin, và dữ liệu đƣợc mã hóa này đƣợc lƣu trữ trong một dòng dữ liệu luân phiên
của tập tin đƣợc mã hóa. Để giải mã tập tin, hệ thống tập tin sử dụng khóa riêng của
ngƣời sử dụng để giải mã khóa đối xứng mà đƣợc lƣu trữ trong phần mào đầu của tập
tin. Sau đó sử dụng khóa đối xứng để giải mã tập tin. Vì điều này đƣợc thực hiện ở
mức độ hệ thống tập tin, nó đƣợc minh bạch đối với ngƣời sử dụng. Ngoài ra, trong
trƣờng hợp một ngƣời dùng bị mất quyền truy cập vào chính khóa của mình, các khóa
giải mã thêm vào nhằm hỗ trợ cũng đƣợc tạo ra trong hệ thống EFS, để một tác nhân
khôi phục vẫn có thể truy cập các tập tin nếu cần. Việc nén và mã hóa do NTFS cung
cấp loại trừ lẫn nhau - NTFS có thể đƣợc sử dụng cho một và công cụ của bên thứ ba
dành cho hãng khác. Sự hỗ trợ của EFS không có sẵn trong các phiên bản Basic, Home
và MediaCenter của Windows, và nó phải đƣợc kích hoạt sau khi cài đặt các phiên bản
Professional, Ultimate và Server của Windows hay bằng cách sử dụng các công cụ đặc
biệt.

15

2.4.8. Cấp hạn ngạch
Cấp hạn ngạch cho ổ đĩa đƣợc giới thiệu trong NTFS v3. Chúng cho phép ngƣời
quản trị máy tính chạy một phiên bản của Windows có hỗ trợ NTFS để thiết lập một
ngƣỡng của không gian ổ đĩa mà những ngƣời dùng có thể sử dụng. Nó cũng cho phép
những ngƣời quản trị duy trì kiểm tra không gian ổ đĩa mà mỗi ngƣời dùng đã sử dụng.
Cấp hạn ngạch ổ đĩa không dùng cho trƣơng mục tập tin nén minh bạch của NTFS,
điều này sẽ đƣợc kích hoạt. Các ứng dụng truy vấn dung lƣợng không gian ổ đĩa trống
cũng sẽ thấy dung lƣợng không gian ổ đĩa còn trông mà ngƣời dùng đƣợc cấp.
Sự hỗ trợ của cấp hạn ngạch ổ đĩa không có sẵn trong các phiên bản Basic, Home
và MediaCenter của Windows, và phải đƣợc kích hoạt sau khi cài đặt các phiên bản
Professional, Ultimate và Server của Windows hay bằng cách sử dụng các công cụ đặc
biệt.
2.4.9. Các điểm phân tích
Tính năng này đƣợc giới thiệu trong NTFS v3. Tính năng này đƣợc sử dụng kết
hợp một thẻ phân tích trong các thuộc tính không gian ngƣời dùng của một tập tin hay
thƣ mục. Khi trình quản lý đối tƣợng phân tích một quá trình tra cứu tên hệ thống tập
tin và gặp một thuộc tính phân tích, nó biết phải phân tích tra cứu tên, qua ngƣời sử
dụng điều khiển dữ liệu phân tích đến tất cả trình điều khiển lọc hệ thống tập tin mà đã
đƣợc nạp vào Windows 2000. Điểm phân tích đƣợc sử dụng để thực hiện Các điểm cài
ổ đĩa, Liên kết thƣ mục, Quản lý lƣu trữ phân bậc, Lƣu trữ cấu trúc tự nhiên, Lƣu trữ
trƣờng hợp riêng và Các liên kết biểu tƣợng.
2.5. Ƣu điểm và hạn chế
Ƣu điểm:
 Hệ thống file NTFS có khả năng hoạt động cao và có chức năng tự sửa
chữa. Nhờ có tính năng lƣu giữ lại các thông tin xử lý, NTFS có khả năng
phục hồi file cao hơn trong những trƣờng hợp ổ đĩa có sự cố. Nó hỗ trợ chế
độ bảo mật ở mức độ file, nén và kiểm định. Nó cũng hỗ trợ các ổ đĩa lớn và
các giải pháp lƣu trữ mạnh mẽ nhƣ RAID.
16

 NTFS sử dụng bảng quản lý tập tin MFT (Master File Table) thay cho bảng
FAT (File Allocation Table) quen thuộc nhằm tăng cƣờng khả năng lƣu trữ,
tính bảo mật cho tập tin và thƣ mục, khả năng mã hóa dữ liệu đến từng tập
tin. Ngoài ra, NTFS có khả năng chịu lỗi cao, cho phép ngƣời dùng đóng
một ứng dụng “chết” (not responding) mà không làm ảnh hƣởng đến những
ứng dụng khác.
 NTFS có một số tính năng cao cấp nhƣ bảo mật các file/directory, cấp hạn
ngạch cho đĩa, nén file, mã hoá file, …

Một trong những tính năng quan trọng của NTFS là khả năng phục hồi lỗi.
Nếu hệ thống bị dừng một cách đột ngột, thì metadata của ổ đĩa FAT sẽ rơi
vào tình trạng xung khắc dẫn đến làm sai lệch một lƣợng lớn dữ liệu tập tin
và thƣ mục. Nhƣng trên NTFS thì điều này không thể xảy ra, tức là cấu trúc
của file/ Directory không bị thay đổi.

Hạn chế:

Tên tập tin dành riêng: Mặc dù hệ thống tập tin hỗ trợ đƣờng dẫn lên đến
khoảng 32.767 ký tự Unicode với mỗi thành phần đƣờng dẫn (thƣ mục hoặc tên
tập tin) có tới 255 ký tự chiều dài, nhƣ vậy sẽ có tên nào đó không sử dụng
đƣợc, theo đó ngƣời dùng không thể sử dụng các tên này. Những tập tin này tất
cả đều có trong thƣ mục gốc của một ổ đĩa (và chỉ dành riêng cho thƣ mục đó).
Các tên: $MFT, $MFTMirr, $LogFile, $Volume, $AttrDef, . (dấu chấm),
$Bitmap, $Boot, $BadClus, $Secure, $Upcase, và $Extend; . (dấu chấm) và
$Extend đều lƣu trong cả các thƣ mục và các tập tin khác.

Kích thƣớc ổ đĩa tối đa: Theo lý thuyết, ổ đĩa NTFS tối đa có 264−1 cluster. Tuy
nhiên, kích thƣớc ổ đĩa NTFS tối đa trên Windows XP Professional là 232−1
cluster.

Các dòng dữ liệu luân phiên: Các lệnh hệ thống Windows có thể xử lý các dòng
dữ liệu luân phiên. Tùy thuộc vào hệ điều hành, tiện ích và hệ thống tập tin xa,
một chuyển giao tập tin có thể âm thầm tách các dòng dữ liệu

17