Bài giảng Nguyên lý hệ điều hành (Phần 2)
Chương 3: QUẢN LÝ LƯU TRỮ
3.1Quản lý bộ nhớ
3.1.1 Cơ sở
Trong chương này chúng ta sẽ thảo luận các cách khác nhau để quản lý bộ
nhớ. Các giải thuật quản lý bộ nhớ từ tiếp cận máy trơ cơ bản (primitive bare-
machine) là chiến lược phân trang và phân đoạn. Mỗi tiếp cận có lợi điểm và nhược
của nó. Chọn phương pháp quản lý bộ nhớ cho một hệ thống xác định phụ thuộc vào
nhiều yếu tố, đặc biệt trên thiết kế phần cứng của hệ thống. Chúng ta sẽ thấy nhiều
giải thuật yêu cầu hỗ trợ phần cứng mặc dù các thiết kế gần đây đã tích hợp phần
cứng và hệ điều hành.
Bộ nhớ là trung tâm để điều hành hệ thống máy tính hiện đại. Bộ nhớ chứa
một mảng lớn các từ (words) hay các bytes, mỗi phần tử với địa chỉ của nó. CPU lấy
các chỉ thị từ bộ nhớ dựa theo giá trị của thanh đếm chương trình. Các chỉ thị này có
thể gây việc nạp bổ sung các từ và lưu trữ tới các địa chỉ bộ nhớ xác định.
1) Liên kết địa chỉ
Thông thường, một chương trình nằm trên đĩa như một tập tin có thể thực thi
dạng nhị phân. Chương trình này được mang vào trong bộ nhớ và được đặt trong một
quá trình để nó được thực thi. Phụ thuộc vào việc quản lý bộ nhớ đang dùng, quá
trình có thể được di chuyển giữa đĩa và bộ nhớ trong khi thực thi. Tập hợp các quá
trình trên đĩa đang chờ được mang vào bộ nhớ để thực thi hình thành một hàng đợi
nhập (input queue).
Thủ tục thông thường là chọn một trong những quá trình trong hàng đợi nhập
và nạp quá trình đó vào trong bộ nhớ. Khi một quá trình được thực thi, nó truy xuất
các chỉ thị và dữ liệu từ bộ nhớ. Cuối cùng, một quá trình kết thúc và không gian bộ
nhớ của nó được xác định là trống.
Hầu hết các hệ thống cho phép một quá trình người dùng nằm ở bất cứ phần
nào của bộ nhớ vật lý. Do đó, mặc dù không gian địa chỉ của máy tính bắt đầu tại
00000, nhưng địa chỉ đầu tiên của quá trình người dùng không cần tại 00000. Sắp xếp
này ảnh hưởng đến địa chỉ mà chương trình người dùng có thể dùng. Trong hầu hết
các trường hợp, một chương trình người dùng sẽ đi qua một số bước, một vài trong
chúng có thể là tuỳ chọn, trước khi được thực thi (Hình 3.1). Các địa chỉ có thể được
155
hiện diện trong những cách khác trong những bước này. Các địa chỉ trong chương
trình nguồn thường là những danh biểu. Một trình biên dịch sẽ liên kết các địa chỉ
danh biểu tới các địa chỉ có thể tái định vị (chẳng hạn như 14 bytes từ vị trí bắt đầu
của module này). Bộ soạn thảo liên kết hay bộ nạp sẽ liên kết các địa chỉ có thể tái
định vị tới địa chỉ tuyệt đối (chẳng hạn 74014). Mỗi liên kết là một ánh xạ từ một
không gian địa chỉ này tới một không gian địa chỉ khác
Về truyền thống, liên kết các chỉ thị và dữ liệu tới các địa chỉ có thể được thực
hiện tại bất cứ bước nào theo cách sau đây:
- Thời gian biên dịch: nếu tại thời điểm biên dịch có thể biết quá trình nằm ở
đâu trong bộ nhớ thì mã tuyệt đối có thể được phát sinh. Thí dụ, nếu biết trước quá
trình người dùng nằm tại vị trí R thì mã trình biên dịch được phát sinh sẽ bắt đầu tại
vị trí đó và mở rộng từ đó. Nếu tại thời điểm sau đó, vị trí bắt đầu thay đổi thì sẽ cần
biên dịch lại mã này. Các chương trình định dạng .COM của MS-DOS là mã tuyệt đối
giới hạn tại thời điểm biên dịch.
- Thời điểm nạp: nếu tại thời điểm biên dịch chưa biết nơi quá trình sẽ nằm ở
đâu trong bộ nhớ thì trình biên dịch phải phát sinh mã có thể tái định vị. Trong trường
hợp này, liên kết cuối cùng được trì hoãn cho tới thời điểm nạp. Nếu địa chỉ bắt đầu
thay đổi, chúng ta chỉ cần nạp lại mã người dùng để hợp nhất giá trị được thay đổi
này.
- Thời gian thực thi: nếu quá trình có thể được di chuyển trong thời gian thực
thi từ một phân đoạn bộ nhớ này tới một phân đoạn bộ nhớ khác thì việc liên kết phải
bị trì hoãn cho tới thời gian chạy. Phần cứng đặc biệt phải sẳn dùng cho cơ chế này để
thực hiện công việc. Hầu hết những hệ điều hành này dùng phương pháp này.
156
Hình 3.1 Xử lý nhiều bước của chương trình người dùng
Phần chủ yếu của chương này được dành hết để hiển thị các liên kết khác nhau
có thể được cài đặt hữu hiệu trong một hệ thống máy tính và thảo luận sự hỗ trợ phần
cứng tương ứng.
2) Nạp động (Dynamic Loading)
Trong thảo luận của chúng ta gần đây, toàn bộ chương trình và dữ liệu của một
quá trình phải ở trong bộ nhớ vật lý để quá trình thực thi. Kích thước của quá trình bị
giới hạn bởi kích thước của bộ nhớ vật lý. Để đạt được việc sử dụng không gian bộ
nhớ tốt hơn, chúng ta có thể sử dụng nạp động (dynamic loading). Với nạp động, một
thủ tục không được nạp cho tới khi nó được gọi. Tất cả thủ tục được giữ trên đĩa trong
định dạng nạp có thể tái định vị. Chương trình chính được nạp vào bộ nhớ và được
thực thi. Khi một thủ tục cần gọi một thủ tục khác, thủ tục gọi trước hết kiểm tra để
thấy thủ tục khác được nạp hay không. Nếu không, bộ nạp liên kết có thể tái định vị
được gọi để nạp thủ tục mong muốn vào bộ nhớ và cập nhật các bảng địa chỉ của
157
chương trình để phản ánh thay đổi này. Sau đó, điều khiển này được truyền tới thủ tục
mới được nạp.
Thuận lợi của nạp động là ở đó một thủ tục không được dùng thì không bao
giờ được nạp. Phương pháp này đặc biệt có ích khi lượng lớn mã được yêu cầu quản
lý các trường hợp xảy ra không thường xuyên, chẳng hạn như các thủ tục lỗi. Trong
trường hợp này, mặc dù kích thước toàn bộ chương trình có thể lớn, nhưng phần được
dùng (và do đó được nạp) có thể nhỏ hơn nhiều.
Nạp động không yêu cầu hỗ trợ đặc biệt từ hệ điều hành. Nhiệm vụ của người
dùng là thiết kế các chương trình của họ để đạt được sự thuận lợi đó. Tuy nhiên, hệ
điều hành có thể giúp người lập trình bằng cách cung cấp các thủ tục thư viện để cài
đặt nạp tự động.
3) Liên kết động (Dynamic Linking)
Trong hình 3.1 cũng hiển thị thư viện được liên kết động. Một số hệ điều hành
hỗ trợ chỉ liên kết tĩnh mà trong đó các thư viện ngôn ngữ hệ thống được đối xử như
bất kỳ module đối tượng khác và được kết hợp bởi bộ nạp thành hình ảnh chương
trình nhị phân. Khái niệm liên kết động là tương tự như khái niệm nạp động. Liên kết
bị trì hoãn hơn là việc nạp bị trì hoãn cho tới thời điểm thực thi. Đặc điểm này thường
được dùng với các thư viện hệ thống như các thư viện chương trình con của các ngôn
ngữ. Không có tiện ích này, tất cả chương trình trên một hệ thống cần có một bản sao
thư viện của ngôn ngữ của chúng (hay ít nhất thư viện được tham chiếu bởi chương
trình) được chứa trong hình ảnh có thể thực thi. Yêu cầu này làm lãng phí cả không
gian đĩa và bộ nhớ chính. Với liên kết động, một stub là một đoạn mã hiển thị cách
định vị chương trình con trong thư viện cư trú trong bộ nhớ hay cách nạp thư viện nếu
chương trình con chưa hiện diện.
Khi stub này được thực thi, nó kiểm tra để thấy chương trình con được yêu cầu
đã ở trong bộ nhớ hay chưa. Nếu chưa, chương trình này sẽ nạp chương trình con vào
trong bộ nhớ. Dù là cách nào, stub thay thế chính nó với địa chỉ của chương trình con
và thực thi chương trình con đó. Do đó, thời điểm tiếp theo phân đoạn mã đạt được,
chương trình con trong thư viện được thực thi trực tiếp mà không gây ra bất kỳ chi
phí cho việc liên kết động. Dưới cơ chế này, tất cả các quá trình sử dụng một thư viện
ngôn ngữ thực thi chỉ một bản sao của mã thư viện.
158
4) Phủ lấp (Overlay)
Để cho phép một quá trình lớn hơn lượng bộ nhớ được cấp phát cho nó, chúng
ta sử dụng cơ chế phủ lấp (overlays). Ý tưởng phủ lấp là giữ trong bộ nhớ những chỉ
thị và dữ liệu được yêu cầu tại bất kỳ thời điểm nào được cho. Khi những chỉ thị đó
được yêu cầu, chúng được nạp vào không gian được chiếm trước đó bởi các chỉ thị
mà chúng không còn cần nữa.
Thí dụ, xét trình dịch hợp ngữ hai lần (two-pass assembler). Trong suốt lần thứ
1, nó xây dựng bảng danh biểu; sau đó, trong lần thứ 2, nó tạo ra mã máy. Chúng ta
có thể phân chia trình dịch hợp ngữ thành mã lần 1, mã lần 2, bảng danh biểu, và
những thủ tục hỗ trợ chung được dùng bởi lần 1 và lần 2. Giả sử kích thước của các
thành phần này như sau:
Lần 1 70 KB
Lần 2 80 KB
Bảng danh biểu 20 KB
Các thủ tục chung 30 KB
Để nạp mọi thứ một lần, chúng ta cần 200KB bộ nhớ. Nếu chỉ có 150KB sẵn
có, chúng ta không thể chạy quá trình của chúng ta. Tuy nhiên, chú ý rằng lần 1 và
lần 2 không cần ở trong bộ nhớ cùng một lúc. Do đó, chúng ta định nghĩa hai phủ lấp.
Phủ lấp A là bảng danh biểu, các thủ tục chung, lần 1, và phủ lắp B là bảng biểu
tượng, các thủ tục chung và lần 2.
Chúng ta bổ sung trình điều khiển phủ lấp (10 KB) và bắt đầu với phủ lấp A
trong bộ nhớ. Khi chúng ta kết thúc lần 1, chúng ta nhảy tới trình điều khiển phủ lấp,
trình điều khiển này sẽ đọc phủ lấp B vào trong bộ nhớ, viết chồng lên phủ lấp B và
sau đó chuyển điều khiển tới lần 2. Phủ lấp A chỉ cần 120KB, ngược lại phủ lấp B cần
130KB (Hình 3.2). Bây giờ chúng ta có thể chạy trình hợp ngữ trong 150KB bộ nhớ.
Nó sẽ nạp nhanh hơn vì rất ít dữ liệu cần được chuyển trước khi việc thực thi bắt đầu.
Tuy nhiên, nó sẽ chạy chậm hơn do nhập/xuất phụ đọc mã mã cho phủ lấp A qua mã
cho phủ lấp B.
159
Hình 3.2 Các phủ lấp cho một bộ hợp ngữ dịch hai lần
3.1.2 Bộ nhớ vật lý và bộ nhớ logic
Một địa chỉ được tạo ra bởi CPU thường được gọi là địa chỉ luận lý (logical
address), ngược lại một địa chỉ được xem bởi đơn vị bộ nhớ nghĩa là, một địa chỉ
được nạp vào thanh ghi địa chỉ bộ nhớ thường được gọi là địa chỉ vật lý (physical
address).
Các phương pháp liên kết địa chỉ thời điểm biên dịch và thời điểm nạp tạo ra
địa chỉ luận lý và địa chỉ vật lý xác định. Tuy nhiên, cơ chế liên kết địa chỉ tại thời
điểm thực thi dẫn đến sự khác nhau giữa địa chỉ luận lý và địa chỉ vật lý. Trong
trường hợp này, chúng ta thường gọi địa chỉ luận lý như là địa chỉ ảo (virtual
address). Tập hợp tất cả địa chỉ luận lý được tạo ra bởi chương trình là không gian địa
chỉ luận lý; tập hợp tất cả địa chỉ vật lý tương ứng địa chỉ luận lý này là không gian
địa chỉ vật lý. Do đó, trong cơ chế liên kết địa chỉ tại thời điểm thực thi, không gian
địa chỉ luận lý và không gian địa chỉ vật lý là khác nhau.
Việc ánh xạ tại thời điểm thực thi từ địa chỉ ảo tới địa chỉ vật lý được thực hiện
bởi một thiết bị phần cứng được gọi là bộ quản lý bộ nhớ MMU (Memory
Management Unit). Chúng ta có thể chọn giữa những phương pháp khác nhau để thực
hiện việc ánh xạ.
Như được hiển thị trong hình 3.3, phương pháp này yêu cầu sự hỗ trợ phần
cứng. Thanh ghi nền bây giờ được gọi là thanh ghi tái định vị. Giá trị trong thanh ghi
tái định vị được cộng vào mỗi địa chỉ được tạo ra bởi quá trình người dùng tại thời
160
điểm nó được gởi tới bộ nhớ. Thí dụ, nếu giá trị nền là 14000, thì việc cố gắng bởi
người dùng để xác định vị trí 0 được tự động tái định vị tới vị trí 14000; một truy xuất
tới địa chỉ 346 được ánh xạ tới vị trí 14346.
Hình 3.3 Định vị tự động dùng thanh ghi tái định vị
3.1.3 Hoán vị (Swap)
Một quá trình cần ở trong bộ nhớ để được thực thi. Tuy nhiên, một quá trình có
thể được hoán vị (swapped) tạm thời khỏi bộ nhớ tới vùng lưu trữ phụ (backing
store), sau đó mang trở lại bộ nhớ để việc thực thi được tiếp tục. Thí dụ, giả sử một
môi trường đa chương với giải thuật lập thời biểu CPU round-robin. Khi định mức
thời gian hết, bộ quản lý bộ nhớ sẽ bắt đầu hoán vị ra (swap out) vùng lưu trữ phụ quá
trình vừa mới kết thúc và hoán vị vào (swap in) một quá trình khác tới không gian bộ
nhớ được trống (Hình 3.4). Do đó, bộ định thời biểu CPU sẽ cấp những phần thời
gian tới những quá trình khác trong bộ nhớ. Lý tưởng, bộ quản lý sẽ hoán vị các quá
trình đủ nhanh để một vài quá trình sẽ ở trong bộ nhớ, sẳn sàng thực thi, khi bộ định
thời CPU muốn định thời lại CPU. Định mức cũng phải đủ lớn để phù hợp lượng tính
toán được thực hiện giữa các hoán vị.
Hình 3.4 Hoán vị hai quá trình dùng đĩa như là backing store
161
Một biến thể của chính sách hoán vị này được dùng cho các giải thuật định
thời trên cơ sở ưu tiên. Nếu một quá trình có độ ưu tiên cao hơn đến và muốn phụ vụ,
bộ quản lý bộ nhớ có thể hoán vị ra quá trình có độ ưu tiên thấp hơn để nó có thể nạp
và thực thi quá trình có độ ưu tiên cao hơn. Khi quá trình có độ ưu tiên cao hơn kết
thúc, quá trình có độ ưu tiên thấp hơn có thể được hoán vị vào trở lại và được tiếp tục.
Biến thể của hoán vị này thường được gọi là cuộn ra (roll out), và cuộn vào (roll in).
Thông thường, một quá trình được hoán vị ra sẽ được hoán vị trở lại vào cùng
không gian bộ nhớ mà nó đã chiếm trước đó. Sự giới hạn này được sai khiến bởi
phương pháp liên kết địa chỉ. Nếu liên kết địa chỉ được thực hiện tại thời điểm hợp
dịch hay nạp thì quá trình không thể được di chuyển vào không gian bộ nhớ khác vì
các địa chỉ vật lý được tính trong thời gian thực thi. Hoán vị yêu cầu một vùng lưu trữ
phụ (backing store). Vùng lưu trữ phụ này thường là một đĩa tốc độ cao. Nó phải đủ
lớn để chứa các bản sao của tất cả hình ảnh bộ nhớ cho tất cả người dùng, và nó phải
cung cấp truy xuất trực tiếp tới các hình ảnh bộ nhớ này. Hệ thống này duy trì một
hàng đợi sẳn sàng chứa tất cả quá trình mà các hình ảnh bộ nhớ của nó ở trong vùng
lưu trữ phụ hay trong bộ nhớ và sẳn sàng để thực thi. Bất cứ khi nào bộ định thời
CPU quyết định thực thi một quá trình, nó gọi bộ phân phát (dispacher). Bộ phân phát
kiểm tra để thấy quá trình tiếp theo trong hàng đợi ở trong bộ nhớ không. Nếu không,
và không có vùng bộ nhớ trống, bộ phân phát hoán vị ra một quá trình hiện hành
trong bộ nhớ và hoán vị vào một quá trình mong muốn. Sau đó, nó nạp lại các thanh
ghi và chuyển điều khiển tới quá trình được chọn.
Trong các hệ hoán vị, thời gian chuyển đổi giữa các tác vụ cần được quan tâm.
Mỗi quá trình cần được phân chia một khoảng thời gian sử dụng CPU đủ lớn để
không thấy rõ sự chậm trễ do các thao tác hoán vị gây ra. Nếu không, hệ thống sẽ
dùng phần lớn thời gian để hoán vị các quá trình vào ra bộ nhớ chính, CPU như vậy
sẽ không sử dụng hiệu quả.
Hoán vị cũng bị ràng buộc bởi yếu tố khác. Nếu chúng ta muốn hoán vị một
quá trình, chúng ta phải đảm bảo rằng nó hoàn toàn rỗi. Quan tâm đặc biệt là việc chờ
nhập/xuất. Một quá trình có thể đang chờ thao tác nhập/xuất khi chúng ta hoán vị quá
trình đó tới nơi trống bộ nhớ của nó. Tuy nhiên, nếu nhập/xuất đang truy xuất không
đồng bộ bộ nhớ người dùng cho nhập/xuất vùng đệm, thì quá trình không thể được
162
hoán vị. Giả sử rằng thao tác nhập/xuất đang xếp hàng chờ vì thiết bị đang bận. Sau
đó, nếu chúng ta hoán vị quá trình P1 ra và hoán vị P2 vào thì thao tác nhập/xuất có
thể cố gắng sử dụng bộ nhớ hiện thuộc về quá trình P2. Hai giải pháp chủ yếu cho quá
trình này là không bao giờ hoán vị quá trình đang chờ nhập/xuất hay thực thi các thao
tác nhập/xuất chỉ ở trong vùng đệm của hệ điều hành. Chuyển giữa các vùng đệm của
hệ điều hành và bộ nhớ quá trình thì chỉ xảy ra khi quá trình được hoán vị vào.
3.1.4 Cấp phát liên tục
Bộ nhớ chính phải cung cấp cho cả hệ điều hành và các quá trình người dùng
khác nhau. Do đó, chúng ta cần cấp phát những phần khác nhau của bộ nhớ chính
trong những cách hiệu quả nhất có thể. Phần này chúng ta giải thích một phương pháp
thông dụng, cấp phát bộ nhớ liên tục.
Bộ nhớ thường được phân chia thành hai phân khu, một cho hệ điều hành định
vị và một cho các quá trình người dùng. Chúng ta có thể đặt hệ điều hành ở bộ nhớ
cao hay bộ nhớ thấp. Yếu tố quan trọng ảnh hưởng tới quyết định này là vị trí của
vector ngắt. Vì vector ngắt thường ở trong bộ nhớ thấp nên các lập trình viên thường
cũng đặt hệ điều hành trong bộ nhớ thấp. Do đó, trong giáo trình này chúng ta sẽ thảo
luận chỉ trường hợp hệ điều hành định vị trong bộ nhớ thấp. Phát triển của trường hợp
khác là tương tự.
Chúng ta thường muốn nhiều quá trình người dùng định vị trong bộ nhớ tại
cùng thời điểm. Do đó, chúng ta cần xem xét cách cấp phát bộ nhớ trống tới những
quá trình ở trong hàng đợi nhập đang chờ được mang vào bộ nhớ. Trong cấp phát bộ
nhớ liên tục, mỗi quá trình được chứa trong một phần bộ nhớ liên tục.
Hình 3.5 Phân vùng bộ nhớ
163
1) Hệ thống đơn chương
Trong phương pháp này bộ nhớ được chia sẻ cho hệ điều hành và một chương
trình duy nhất của người sử dụng. Tại một thời điểm, một phần của bộ nhớ sẽ do hệ
điều hành chiếm giữ, phần còn lại thuộc về quá trình người dùng duy nhất trong hệ
thống (Hình 3.6). Quá trình này được toàn quyền sử dụng bộ nhớ dành cho nó. User
process Operating system 0xFFF… 0
Hình 3.6 Tổ chức bộ nhớ trong hệ thống đơn chương
Khi bộ nhớ được tổ chức theo cách thức này, chỉ có thể xử lý một chương trình
tại một thời điểm. Quan sát hoạt động của các quá trình, có thể nhận thấy rất nhiều
tiến trình trải qua phần lớn thời gian để chờ các thao tác nhập/xuất hoàn thành. Trong
suốt thời gian này, CPU ở trạng thái rỗi. Trong trường hợp như thế, hệ thống đơn
chương không cho phép sử dụng hiệu quả CPU. Ngoài ra, sự đơn chương không cho
phép nhiều người sử dụng làm việc đồng thời theo cơ chế tương tác. Để nâng cao hiệu
suất sử dụng CPU, cần cho phép chế độ đa chương mà trong đó các quá trình chia sẻ
CPU với nhau để hoạt động đồng hành.
2) Hệ thống đa chương với phân khu cố định
Một trong những phương pháp đơn giản nhất để cấp phát bộ nhớ là chia bộ
nhớ thành những phân khu có kích thước cố định. Mỗi phân khu có thể chứa chính
xác một quá trình. Do đó, cấp độ đa chương được giới hạn bởi số lượng phân khu.
Trong phương pháp đa phân khu, khi một phân khu rảnh, một quá trình được chọn từ
hàng đợi nhập và được nạp vào phân khu trống. Khi quá trình kết thúc, phân khu trở
nên sẳn dùng cho một quá trình khác. Có hai tiếp cận để tổ chức hàng đợi:
164
- Sử dụng nhiều hàng đợi: mỗi phân khu sẽ có một hàng đợi tương ứng (Hình
3.7 a). Khi một quá trình mới được tạo ra, nó được đưa vào hàng đợi của phân khu có
kích thước nhỏ nhất thoả nhu cầu chứa nó. Cách tổ chức này có khuyết điểm trong
trường hợp các hàng đợi của một số phân khu trống trong khi các hàng đợi của các
phân khu khác lại đầy, buộc các quá trình trong những hàng đợi này phải chờ được
cấp phát bộ nhớ.
- Sử dụng một hàng đợi: tất cả các quá trình được đặt trong hàng đợi duy nhất
(Hình 3.7b). Khi có một phân khu trống, quá trình đầu tiên trong hàng đợi có kích
thước phù hợp sẽ được đặt vào phân khu và cho xử lý.
Hình 3.7 Cấp phát phân khu có kích thước cố định
Khi sử dụng giải thuật này người ta muốn tránh sự hao phí một phân khu lớn
cho một công việc nhỏ, nhưng lại xảy ra bất bình đẳng, bất lợi đối với các công việc
nhỏ. Để giải quyết người ta thêm vào qui luật là một công việc sẽ không bị bỏ qua
nữa nếu nó đã bị bỏ qua k lần qui định. Mỗi lần một công việc bị bỏ qua nó được
đánh dấu một điểm. Khi đạt được số điểm qui định, nó sẽ không bị bỏ qua nữa, sẽ
được nạp vào và thực hiện mặc dầu có thể trên một phân khu lớn hơn.
Phương pháp này ban đầu được sử dụng bởi hệ điều hành IBM OS/360, nó
được gọi là MFT (Multiprogramming with Fixed number of Tasks). Hiện nay nó
không còn sử dụng nữa.
165
3) Hệ thống đa chương với phân khu động
Cơ chế này là tổng quát của cơ chế phân khu cố định. Nó được dùng chủ yếu
trong môi trường xử lý theo lô. Nhiều ý tưởng được trình bày ở đây cũng có thể áp
dụng tới môi trường chia thời mà trong đó phân đoạn thuần được dùng cho việc quản
lý bộ nhớ.
Hệ điều hành giữ một bảng hiển thị những phần nào của bộ nhớ là sẳn dùng và
phần nào đang bận. Ban đầu, tất cả bộ nhớ là sẳn dùng cho quá trình người dùng, và
được xem như một khối lớn bộ nhớ sẳn dùng hay một lỗ. Khi một quá trình đến và
cần bộ nhớ, chúng ta tìm kiếm một lỗ trống đủ lớn cho quá trình này. Nếu chúng ta
tìm thấy, chúng ta cấp phát chỉ phần bộ nhớ nhiều bằng lượng được yêu cầu, phần còn
lại sẳn dùng để thoả mãn những yêu cầu tương lai (Hình 3.8).
Hình 3.8 Cấp phát các phân khu có kích thước thay đổi
Khi các quá trình đi vào hệ thống, chúng được đặt vào hàng đợi nhập. Hệ điều
hành xem xét yêu cầu bộ nhớ của mỗi quá trình và lượng không gian bộ nhớ sẳn có
để xác định các quá trình nào được cấp phát bộ nhớ. Khi một quá trình được cấp
không gian, nó được nạp vào bộ nhớ và sau đó nó có thể cạnh tranh CPU. Khi một
quá trình kết thúc, nó giải phóng bộ nhớ của nó, sau đó hệ điều hành có thể đặt một
quá trình khác từ hàng đợi nhập.
Tại bất cứ thời điểm được cho, chúng ta có một danh sách kích thước khối
trống và hàng đợi nhập. Hệ điều hành có thể xếp hàng đợi nhập dựa theo giải thuật
định thời. Bộ nhớ được cấp phát tới quá trình cho đến khi các yêu cầu bộ nhớ của quá
trình kế tiếp không thể được thoả; không có khối bộ nhớ trống đủ lớn để quản lý quá
trình đó. Sau đó, hệ điều hành có thể chờ cho đến khi khối đủ lớn sẳn dùng hay nó có
166
thể di chuyển xuống hàng đợi nhập để xem các yêu cầu bộ nhớ nhỏ hơn của các quá
trình khác có thể được thoả hay không.
Thông thường, một tập hợp các lỗ có kích thước khác nhau được phân tán
khắp bộ nhớ tại bất cứ thời điểm được cho. Khi một quá trình đến và yêu cầu bộ nhớ,
hệ thống tìm tập hợp này một lỗ trống đủ lớn cho quá trình này. Nếu lỗ trống quá lớn,
nó được chia làm hai: một phần được cấp tới quá trình đến; phần còn lại được trả về
tập hợp các lỗ. Nếu lỗ mới nằm kề với các lỗ khác, các lỗ nằm kề này được gom lại
để tạo thành một lỗ lớn hơn. Tại thời điểm này, hệ thống cần kiểm tra có quá trình
nào đang chờ bộ nhớ và bộ nhớ trống mới hay bộ nhớ vừa được kết hợp lại có thể
thoả yêu cầu của bất cứ quá trình đang chờ này không.
Thủ tục này là một trường hợp đặc biệt của vấn đề cấp phát lưu trữ động là làm
cách nào để thoả mãn một yêu cầu có kích thước n từ danh sách lỗ trống. Có hai giải
pháp chủ yếu cho vấn đề này.
a) Quản lý bằng bản đồ bit: bộ nhớ được chia thành các đơn vị cấp phát, mỗi
đơn vị được ánh xạ tới một bit trong bản đồ bit (Hình 3.9). Giá trị bit này xác định
trạng thái của đơn vị bộ nhớ đó: 0 đang tự do, 1 đã được cấp phát. Khi cần nạp một
quá trình có kích thước k đơn vị, hệ thống sẽ tìm trong bản đồ bit một dãy k bit có giá
trị 0.
Kích thước của đơn vị cấp phát là vấn đề lớn trong thiết kế. Nếu kích thước
đơn vị cấp phát nhỏ sẽ làm tăng kích thước của bản đồ bit. Ngược lạ, nếu kích thước
đơn vị cấp phát lớn có thể gây hao phí cho đơn vị cấp phát sau cùng. Đây là giải pháp
đơn giản nhưng thực hiện chậm nên ít được dùng.
Hình 3.9 Quản lý bộ nhớ bằng bản đồ bit
167
b) Quản lý bằng danh sách liên kết: dùng một danh sách liên kết để quản lý
các phân đoạn bộ nhớ đã cấp phát và phân đoạn tự do, một phân đoạn có thể là một
quá trình hay một vùng nhớ trống giữa hai quá trình. Danh sách liên kết gồm nhiều
mục từ liên tiếp. Mỗi mục từ gồm 1 bit đầu để xác định phân đoạn đó là lỗ trống (H)
hay một quá trình (P), sau đó là 3 từ để chỉ địa chỉ bắt đầu, chiều dài và chỉ điểm tới
mục kế tiếp. Việc sắp xếp các phân đoạn theo địa chỉ hay theo kích thước tuỳ thuộc
vào giải thuật quản lý bộ nhớ. Sơ đồ quản lý bằng danh sách liên kết tương ứng với sơ
đồ quản lý bằng bản đồ bit được minh hoạ trong hình 3.10.
Hình 3.10 Quản lý bộ nhớ bằng danh sách liên kết
Tập hợp các lỗ trống được tìm thấy để xác định lỗ nào là tốt nhất để cấp phát.
Các chiến lược first-fit, best-fit, worst-fit là những chiến lược phổ biến nhất được
dùng để chọn một lỗ trống từ tập hợp các lỗ trống.
- First-fit: cấp phát lỗ trống đầu tiên đủ lớn. Tìm kiếm có thể bắt đầu tại đầu
tập hợp các lỗ trống hay tại điểm kết thúc của tìm kiếm first-fit trước đó. Chúng ta
dừng tìm kiếm ngay khi chúng ta tìm thấy một lỗ trống đủ lớn.
- Best-fit: cấp phát lỗ trống nhỏ nhất đủ lớn. Chúng ta phải tìm toàn bộ danh
sách, trừ khi danh sách được xếp thứ tự theo kích thước. Chiến lược này tạo ra lỗ
trống nhỏ nhất còn thừa lại.
- Worst-fit: cấp phát lỗ trống lớn nhất. Chúng ta phải tìm toàn danh sách trừ
khi nó được xếp theo thứ tự kích thước. Chiến lược này tạo ra lỗ trống còn lại lớn
nhất mà có thể có ích hơn lỗ trống nhỏ từ tiếp cận best-fit.
Các mô phỏng hiển thị rằng cả first-fit và best-fit là tốt hơn worst-fit về việc
giảm thời gian và sử dụng lưu trữ. Giữa first-fit và best-fit không thể xác định rõ
chiến lược nào tốt hơn về sử dụng lưu trữ, nhưng first-fit có tốc độ nhanh hơn.
Tuy nhiên, các giải thuật này gặp phải vấn đề phân mảnh ngoài (external
fragmentation). Khi các quá trình được nạp và được xoá khỏi bộ nhớ, không gian bộ
168
nhớ trống bị phân rã thành những mảnh nhỏ. Phân mảnh ngoài tồn tại khi tổng không
gian bộ nhớ đủ để thoả mãn một yêu cầu, nhưng nó không liên tục; vùng lưu trữ bị
phân mảnh thành một số lượng lớn các lỗ nhỏ. Vấn đề phân mảnh này có thể rất lớn.
Trong trường hợp xấu nhất, chúng có thể có một khối bộ nhớ trống nằm giữa mỗi hai
quá trình. Nếu tất cả bộ nhớ này nằm trong một khối trống lớn, chúng ta có thể chạy
nhiều quá trình hơn.
Chọn lựa first-fit so với best-fit có thể ảnh hưởng tới lượng phân mảnh. (First-
fit là tốt hơn đối với một số hệ thống, ngược lại best fit là tốt hơn cho một số hệ thống
khác). Một yếu tố khác là phần cuối của khối trống nào được cấp phát. (phần còn dư
nào-phần trên đỉnh, hay phần ở dưới đây?). Vấn đề không do giải thuật nào được
dùng mà do phân mảnh ngoài.
4) Quản lý bộ nhớ với hệ thống bạn thân
Như ta đã thấy trong phần trước, việc quản lý các lỗ hổng trên những bảng liệt
kê được sắp xếp theo kích thước làm cho việc cấp phát bộ nhớ rất nhanh, nhưng lại
làm chậm cho việc ngưng cấp phát bởi vì ta phải chú ý đến các láng giềng. Hệ thống
bạn thân (Buddy System) là một giải thuật quản lý bộ nhớ tận dụng thuận lợi của việc
máy tính dùng những số nhị phân cho việc đánh địa chỉ để tăng tốc độ kết hợp những
lỗ hổng sát nhau khi một quá trình hoàn thành hoặc được hoán vị ra ngoài.
Với phương pháp này, bộ quản lý bộ nhớ sẽ có một bảng liệt kê những khối
còn tự do có kích thước 1, 2, 4, 16 ... bytes đến kích thước của bộ nhớ, tức là có kích
thước bằng lũy thừa của 2. Khi có một quá trình cần cấp phát bộ nhớ, một lỗ hổng có
kích thước bằng lũy thừa của 2 đủ chứa quá trình sẽ được cấp phát. Nếu không có lỗ
hổng yêu cầu, các lỗ hổng sẽ được phân đôi cho đến khi có được lỗ hỗng cần thiết.
Khi một quá trình chấm dứt, các lỗ hổng kế nhau có kích thước bằng nhau sẽ được
nhập lại để tạo thành lỗ hổng lớn hơn. Do đó, giải thuật này được gọi là hệ thống bạn
thân.
Thí du: với bộ nhớ 1M, cần phải có 21 bảng liệt kê như thế sắp từ 1 bytes (20)
đến 1 byte (220). Khởi đầu toàn bộ bộ nhớ còn tự do và bảng liệt kê 1M có một mục từ
độc nhất chứa đựng một lỗ hổng 1M, tất cả các bảng liệt kê khác đều rỗng. Cấu hình
bộ nhớ lúc khởi đầu được chỉ ra trong hình 3.11.
169
Hình 3.11 Hệ thống bạn thân với kích thước 1MB
Bây giờ chúng ta hãy xem cách hệ thống buddy làm việc khi một quá trình
70K được hoán vị vào bộ nhớ trống 1M. Do những lỗ hổng chỉ có thể có kích thước
là lũy thừa của 2, 128K sẽ được yêu cầu, bởi vì đó chính là lũy thừa nhỏ nhất của 2 đủ
lớn. Không có khối 128K sẵn, cũng không có các khối 256K và 512K. Vì vậy khối
1M sẽ được chia làm hai khối 512K, được gọi là những bạn thân; một tại địa chỉ 0 và
một tại địa chỉ 512K. Sau đó khối tại địa chỉ thấp hơn, chính là khối tại 0 lại được
phân làm hai khối bạn thân 256K, một tại 0 và một tại 256K. Cái thấp hơn của chúng
lại được phân làm hai khối 128K, và khối tại 0, đánh dấu là A trong hình được cấp
phát cho quá trình.
Kế đến, một quá trình 35K được hoán vị vào. Khi đó ta cần khối 64K, nhưng
cũng không có sẵn, vì thế phải phân phối khối 128K thành hai khối bạn thân 64K,
một tại địa chỉ 128K, một tại 192K. Khối tại 128K được cấp cho quá trình, trong hình
là B. Yêu cầu thứ ba là 80K.
Bây giờ ta hãy xem những gì xảy ra khi một khối được trả lại. Giả sử tại thời
điểm này khối 128K (mà chỉ dùng có 70K) được tự do. Khi đó khối 128K sẽ được
đưa vào bảng tự do. Bây giờ cần một khối 60K. Sau khi kiểm tra, khối 64K tại 192K
được cấp phát và nó được đánh dấu là C.
Bây giờ khối B được trả lại. Tại thời điểm này có hai khối 128K tự do nhưng
chúng không được kết hợp lại. Chú ý rằng ngay cả khi khối 128K tại 0 được phân ra
làm 2, khối tại 9 được dùng và khối tại 84K còn tự do, sự kết hợp cũng không xảy ra.
170
Khi D được trả lại, sẽ có sự kết hợp lại thành khối 256K tại 0. Cuối cùng, khi C được
trả lại, sẽ có kết hợp tạo thành 1 lỗ hổng 1M như ban đầu.
Hệ thống bạn thân có sự thuận lợi so với những giải thuật cùng sắp xếp theo
kích thước của khối. Sự thuận lợi này là khi có một khối 2K bytes tự do, bộ quản lý
bộ nhớ chỉ cần tìm trong bảng liệt kê lỗ hổng có kích thước 2K để xem chúng có khả
năng kết hợp được hay không. Với những giải thuật khác mà trong đó cho phép các
khối bộ nhớ được phân chia một cách tùy ý, việc tìm kiếm phải diễn ra trên tất cả các
bảng liệt kê. Do dó, hệ thống bạn thân làm việc nhanh hơn.
Đáng tiếc, nó lại cực kỳ kém hiệu quả trong việc sử dụng bộ nhớ. Một quá
trình 35K phải được cấp phát đến 64K, hao phí đến 29K. Sự hao phí này được gọi là
sự phân mảnh trong (internal fragmentation), bởi vì phần bộ nhớ hao phí nằm bên
trong đoạn được cấp phát. Còn trong các phần trước ta thấy những lỗ hổng ở giữa các
đoạn, nhưng không có sự hao phí bên trong các đoạn, do đó kiểu này được coi là sự
phân mảnh ngoài.
Phân mảnh: Phân mảnh bộ nhớ có thể là phân mảnh trong hoặc phân
mảnh ngoài. Xét cơ chế cấp phát nhiều phân khu với một lỗ trống có kích thước
18,464 bytes. Giả sử rằng quá trình tiếp theo yêu cầu 18,462 bytes. Nếu chúng
ta cấp phát chính xác khối được yêu cầu, chúng ta để lại một lỗ trống có kích
thước 2 bytes. Chi phí để giữ vết của lỗ này sẽ lớn hơn kích thước của lỗ trống.
Tiếp cận thông thường là chia bộ nhớ vật lý thành những khối có kích thước cố
định, và cấp phát bộ nhớ dựa theo đơn vị của kích thước khối. Với tiếp cận này,
bộ nhớ được cấp phát tới một quá trình có thể là lớn hơn một chút so với khối
được yêu cầu. Sự chênh lệnh giữa hai số này là phân mảnh trong-bộ nhớ bị
phân mảnh trong đối với một phân khu thì không thể được dùng.
Một giải pháp đối với phân mảnh ngoài là kết lại thành khối (compaction).
Mục tiêu là di chuyển nội dung bộ nhớ để đặt tất cả bộ nhớ trống với nhau trong một
khối lớn. Kết khối không phải luôn thực hiện được. Nếu việc tái định vị là tĩnh và
được thực hiện tại thời điểm hợp dịch và nạp thì việc kết khối là không thể thực hiện
được. Kết khối chỉ có thể thực hiện được chỉ nếu tái định vị là động và được thực hiện
tại thời điểm thực thi. Nếu địa chỉ được tái định vị động, tái định vị yêu cầu chỉ di
171
chuyển chương trình và dữ liệu, sau đó thay đổi thanh ghi nền để phản ánh địa chỉ nền
mới. Khi kết khối là có thể, chúng ta phải xác định chi phí của nó. Giải thuật kết khối
đơn giản nhất là di chuyển tất cả quá trình tới cuối bộ nhớ; tất cả lỗ trống di chuyển
theo hướng ngược lại, tạo ra một lỗ trống lớn của bộ nhớ sẳn dùng. Cơ chế này có thể
đắt.
Một giải pháp khác cho vấn đề phân mảnh ngoài là cho phép không gian địa
chỉ luận lý của một quá trình là không liên tục, do đó cho phép một quá trình được
cấp phát bộ nhớ vật lý bất cứ đâu sau khi sẳn dùng. Hai kỹ thuật bù trừ để đạt giải
pháp này là phân trang và phân đoạn.
3.1.5 Phân trang
Phân trang là cơ chế quản lý bộ nhớ cho phép không gian địa chỉ vật lý của
quá trình là không kề nhau. Phân trang tránh vấn đề đặt vừa khít nhóm bộ nhớ có kích
thước thay đổi vào vùng lưu trữ phụ (backing store) mà hầu hết các cơ chế quản lý bộ
nhớ trước đó gặp phải. Khi phân đoạn mã và dữ liệu nằm trong bộ nhớ được hoán vị
ra, không gian phải được tìm thấy trên vùng lưu trữ phụ. Vấn đề phân mảnh được
thảo luận trong sự kết nối với bộ nhớ chính cũng thông dụng như với vùng lưu trữ
phụ, ngoại trừ truy xuất thấp hơn nhiều, vì thế kết khối là không thể. Vì lợi điểm của
nó so với các phương pháp trước đó nên phân trang trong những dạng khác nhau
được dùng phổ biến trong hầu hết các hệ điều hành.
Về truyền thống, hỗ trợ phân trang được quản lý bởi phần cứng. Tuy nhiên,
những thiết kế gần đây cài đặt phân trang bằng cách tích hợp chặt chẻ phần cứng và
hệ điều hành, đặc biệt trên các bộ vi xử lý 64-bit.
1) Phương pháp cơ bản
Bộ nhớ vật lý được chia thành các khối có kích thước cố định được gọi là các
khung (frames). Bộ nhớ luận lý cũng được chia thành các khối có cùng kích thước
được gọi là các trang (pages). Khi một quá trình được thực thi, các trang của nó được
nạp vào các khung bộ nhớ sẳn dùng từ vùng lưu trữ phụ. Vùng lưu trữ phụ được chia
thành các khối có kích thước cố định và có cùng kích thước như các khung bộ nhớ.
Hỗ trợ phần cứng cho phân trang được hiển thị trong hình 3.12. Mỗi địa chỉ
được tạo ra bởi CPU được chia thành hai phần: số trang (p) và độ dời trang (d). Số
trang được dùng như chỉ mục vào bảng trang. Bảng trang chứa địa chỉ nền của mỗi
172
trang trong bộ nhớ vật lý. Địa chỉ nền này được kết hợp với độ dời trang để định
nghĩa địa chỉ bộ nhớ vật lý mà nó được gởi đến đơn vị bộ nhớ. Mô hình phân trang bộ
nhớ được hiển thị như hình 3.13.
Hình 3.12 Phần cứng phân trang
Kích thước trang (giống như kích thước khung) được định nghĩa bởi phần
cứng. Kích thước của một trang điển hình là luỹ thừa của 2, từ 512 bytes đến 16MB
trên trang, phụ thuộc vào kiến trúc máy tính. Chọn luỹ thừa 2 cho kích thước trang
thực hiện việc dịch địa chỉ luận lý thành số trang và độ dời trang rất dễ dàng. Nếu
kích thước không gian địa chỉ là 2m, và kích thước trang là 2n đơn vị địa chỉ (byte hay
từ) thì m-n bits cao của địa chỉ luận lý chỉ số trang, n bits thấp chỉ độ dời trang. Do
đó, địa chỉ luận lý như sau:
ở đây p là chỉ mục trong bảng trang và d là độ dời trong trang.
Hình 3.13 Mô hình phân trang của bộ nhớ luận lý và vật lý
173
Thí dụ: xét bộ nhớ trong hình 3.14. Sử dụng kích thước trang 4 bytes và bộ
nhớ vật lý 32 bytes (có 8 trang), chúng ta hiển thị cách nhìn bộ nhớ của người dùng
có thể được ánh xạ tới bộ nhớ vật lý như thế nào. Địa chỉ luận lý 0 là trang 0, độ dời
0. Chỉ mục trong bảng trang, chúng ta thấy rằng trang 0 ở trong khung 5. Do đó, địa
chỉ luận lý 0 ánh xạ tới địa chỉ vật lý 20 (=(5x4)+0). Địa chỉ luận lý 3 (trang 0, độ dời
3) ánh xạ tới địa chỉ vật lý 23 (=(5x4)+3). Địa chỉ luận lý 4 ở trang 1, độ dời 0; dựa
theo bảng trang, trang 1 được ánh xạ tới khung 6. Do đó, địa chỉ luận lý 4 ánh xạ tới
địa chỉ 24(=(6x4)+0). Địa chỉ luận lý 13 ánh xạ tới địa chỉ vật lý 9.
Có thể chú ý rằng phân trang là một dạng của tái định vị động. Mỗi địa chỉ
luận lý được giới hạn bởi phần cứng phân trang tới địa chỉ vật lý. Sử dụng phân trang
tương tự sử dụng một bảng các thanh ghi nền (hay tái định vị), một thanh ghi cho mỗi
khung bộ nhớ.
Khi chúng ta sử dụng một cơ chế phân trang, chúng ta không có phân mảnh
bên ngoài: bất kỳ khung trống có thể được cấp phát tới một quá trình cần nó. Tuy
nhiên, chúng ta có thể có phân mảnh trong. Chú ý rằng các khung được cấp phát như
các đơn vị. Nếu các yêu cầu bộ nhớ của một quá trình không xảy ra để rơi trên giới
hạn của trang, thì khung cuối cùng được cấp phát có thể không đầy hoàn toàn. Thí dụ,
nếu các trang là 2048 bytes, một quá trình 72,766 bytes sẽ cần 35 trang cộng với 1086
bytes. Nó được cấp phát 36 khung, do đó phân mảnh trong là 2048 - 1086 = 962
bytes. Trong trường hợp xấu nhất, một quá trình cần n trang cộng với 1 byte. Nó sẽ
được cấp phát n+1 khung, dẫn đến phân mảnh trong gần như toàn bộ khung.
Nếu kích thước quá trình độc lập với kích thước của trang, thì chúng ta mong
muốn phân mảnh trong trung bình là ½ trang trên một quá trình. Xem xét này đề nghị
rằng kích thước trang nhỏ là mong muốn. Tuy nhiên, chi phí liên quan tới mỗi mục từ
bảng trang và chi phí này giảm khi kích thước trang tăng. Vì thế nhập/xuất đĩa là hiệu
quả hơn khi số lượng dữ liệu được truyền lớn hơn. Thường thì kích thước trang lớn
lên theo thời gian khi các quá trình, tập hợp dữ liệu, bộ nhớ chính trở nên lớn hơn.
Ngày nay, các trang điển hình nằm trong khoảng 4 KB tới 8 KB, và một số hệ thống
hỗ trợ kích thước trang lớn hơn. CPU và nhân thậm chí hỗ trợ nhiều kích thước khác
nhau. Thí dụ, Solaris dùng 8 KB và 4 MB kích thước trang, phụ thuộc dữ liệu được
174
Tải về để xem bản đầy đủ
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nguyên lý hệ điều hành (Phần 2)", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
File đính kèm:
- bai_giang_nguyen_ly_he_dieu_hanh_phan_2.pdf