Bài giảng Nguyên lý hệ điều hành (Phần 2)

Chương 3: QUẢN LÝ LƯU TRỮ

3.1Quản lý bộ nhớ

3.1.1 Cơ sở

Trong chương này chúng ta sẽ thảo luận các cách khác nhau để quản lý bộ

nhớ. Các giải thuật quản lý bộ nhớ từ tiếp cận máy trơ cơ bản (primitive bare-

machine) là chiến lược phân trang và phân đoạn. Mỗi tiếp cận có lợi điểm và nhược

của nó. Chọn phương pháp quản lý bộ nhớ cho một hệ thống xác định phụ thuộc vào

nhiều yếu tố, đặc biệt trên thiết kế phần cứng của hệ thống. Chúng ta sẽ thấy nhiều

giải thuật yêu cầu hỗ trợ phần cứng mặc dù các thiết kế gần đây đã tích hợp phần

cứng và hệ điều hành.

Bộ nhớ là trung tâm để điều hành hệ thống máy tính hiện đại. Bộ nhớ chứa

một mảng lớn các từ (words) hay các bytes, mỗi phần tử với địa chỉ của nó. CPU lấy

các chỉ thị từ bộ nhớ dựa theo giá trị của thanh đếm chương trình. Các chỉ thị này có

thể gây việc nạp bổ sung các từ và lưu trữ tới các địa chỉ bộ nhớ xác định.

1) Liên kết địa chỉ

Thông thường, một chương trình nằm trên đĩa như một tập tin có thể thực thi

dạng nhị phân. Chương trình này được mang vào trong bộ nhớ và được đặt trong một

quá trình để nó được thực thi. Phụ thuộc vào việc quản lý bộ nhớ đang dùng, quá

trình có thể được di chuyển giữa đĩa và bộ nhớ trong khi thực thi. Tập hợp các quá

trình trên đĩa đang chờ được mang vào bộ nhớ để thực thi hình thành một hàng đợi

nhập (input queue).

Thủ tục thông thường là chọn một trong những quá trình trong hàng đợi nhập

và nạp quá trình đó vào trong bộ nhớ. Khi một quá trình được thực thi, nó truy xuất

các chỉ thị và dữ liệu từ bộ nhớ. Cuối cùng, một quá trình kết thúc và không gian bộ

nhớ của nó được xác định là trống.

Hầu hết các hệ thống cho phép một quá trình người dùng nằm ở bất cứ phần

nào của bộ nhớ vật lý. Do đó, mặc dù không gian địa chỉ của máy tính bắt đầu tại

00000, nhưng địa chỉ đầu tiên của quá trình người dùng không cần tại 00000. Sắp xếp

này ảnh hưởng đến địa chỉ mà chương trình người dùng có thể dùng. Trong hầu hết

các trường hợp, một chương trình người dùng sẽ đi qua một số bước, một vài trong

chúng có thể là tuỳ chọn, trước khi được thực thi (Hình 3.1). Các địa chỉ có thể được

155

hiện diện trong những cách khác trong những bước này. Các địa chỉ trong chương

trình nguồn thường là những danh biểu. Một trình biên dịch sẽ liên kết các địa chỉ

danh biểu tới các địa chỉ có thể tái định vị (chẳng hạn như 14 bytes từ vị trí bắt đầu

của module này). Bộ soạn thảo liên kết hay bộ nạp sẽ liên kết các địa chỉ có thể tái

định vị tới địa chỉ tuyệt đối (chẳng hạn 74014). Mỗi liên kết là một ánh xạ từ một

không gian địa chỉ này tới một không gian địa chỉ khác

Về truyền thống, liên kết các chỉ thị và dữ liệu tới các địa chỉ có thể được thực

hiện tại bất cứ bước nào theo cách sau đây:

- Thời gian biên dịch: nếu tại thời điểm biên dịch có thể biết quá trình nằm ở

đâu trong bộ nhớ thì mã tuyệt đối có thể được phát sinh. Thí dụ, nếu biết trước quá

trình người dùng nằm tại vị trí R thì mã trình biên dịch được phát sinh sẽ bắt đầu tại

vị trí đó và mở rộng từ đó. Nếu tại thời điểm sau đó, vị trí bắt đầu thay đổi thì sẽ cần

biên dịch lại mã này. Các chương trình định dạng .COM của MS-DOS là mã tuyệt đối

giới hạn tại thời điểm biên dịch.

- Thời điểm nạp: nếu tại thời điểm biên dịch chưa biết nơi quá trình sẽ nằm ở

đâu trong bộ nhớ thì trình biên dịch phải phát sinh mã có thể tái định vị. Trong trường

hợp này, liên kết cuối cùng được trì hoãn cho tới thời điểm nạp. Nếu địa chỉ bắt đầu

thay đổi, chúng ta chỉ cần nạp lại mã người dùng để hợp nhất giá trị được thay đổi

này.

- Thời gian thực thi: nếu quá trình có thể được di chuyển trong thời gian thực

thi từ một phân đoạn bộ nhớ này tới một phân đoạn bộ nhớ khác thì việc liên kết phải

bị trì hoãn cho tới thời gian chạy. Phần cứng đặc biệt phải sẳn dùng cho cơ chế này để

thực hiện công việc. Hầu hết những hệ điều hành này dùng phương pháp này.

156

Hình 3.1 Xử lý nhiều bước của chương trình người dùng

Phần chủ yếu của chương này được dành hết để hiển thị các liên kết khác nhau

có thể được cài đặt hữu hiệu trong một hệ thống máy tính và thảo luận sự hỗ trợ phần

cứng tương ứng.

2) Nạp động (Dynamic Loading)

Trong thảo luận của chúng ta gần đây, toàn bộ chương trình và dữ liệu của một

quá trình phải ở trong bộ nhớ vật lý để quá trình thực thi. Kích thước của quá trình bị

giới hạn bởi kích thước của bộ nhớ vật lý. Để đạt được việc sử dụng không gian bộ

nhớ tốt hơn, chúng ta có thể sử dụng nạp động (dynamic loading). Với nạp động, một

thủ tục không được nạp cho tới khi nó được gọi. Tất cả thủ tục được giữ trên đĩa trong

định dạng nạp có thể tái định vị. Chương trình chính được nạp vào bộ nhớ và được

thực thi. Khi một thủ tục cần gọi một thủ tục khác, thủ tục gọi trước hết kiểm tra để

thấy thủ tục khác được nạp hay không. Nếu không, bộ nạp liên kết có thể tái định vị

được gọi để nạp thủ tục mong muốn vào bộ nhớ và cập nhật các bảng địa chỉ của

157

chương trình để phản ánh thay đổi này. Sau đó, điều khiển này được truyền tới thủ tục

mới được nạp.

Thuận lợi của nạp động là ở đó một thủ tục không được dùng thì không bao

giờ được nạp. Phương pháp này đặc biệt có ích khi lượng lớn mã được yêu cầu quản

lý các trường hợp xảy ra không thường xuyên, chẳng hạn như các thủ tục lỗi. Trong

trường hợp này, mặc dù kích thước toàn bộ chương trình có thể lớn, nhưng phần được

dùng (và do đó được nạp) có thể nhỏ hơn nhiều.

Nạp động không yêu cầu hỗ trợ đặc biệt từ hệ điều hành. Nhiệm vụ của người

dùng là thiết kế các chương trình của họ để đạt được sự thuận lợi đó. Tuy nhiên, hệ

điều hành có thể giúp người lập trình bằng cách cung cấp các thủ tục thư viện để cài

đặt nạp tự động.

3) Liên kết động (Dynamic Linking)

Trong hình 3.1 cũng hiển thị thư viện được liên kết động. Một số hệ điều hành

hỗ trợ chỉ liên kết tĩnh mà trong đó các thư viện ngôn ngữ hệ thống được đối xử như

bất kỳ module đối tượng khác và được kết hợp bởi bộ nạp thành hình ảnh chương

trình nhị phân. Khái niệm liên kết động là tương tự như khái niệm nạp động. Liên kết

bị trì hoãn hơn là việc nạp bị trì hoãn cho tới thời điểm thực thi. Đặc điểm này thường

được dùng với các thư viện hệ thống như các thư viện chương trình con của các ngôn

ngữ. Không có tiện ích này, tất cả chương trình trên một hệ thống cần có một bản sao

thư viện của ngôn ngữ của chúng (hay ít nhất thư viện được tham chiếu bởi chương

trình) được chứa trong hình ảnh có thể thực thi. Yêu cầu này làm lãng phí cả không

gian đĩa và bộ nhớ chính. Với liên kết động, một stub là một đoạn mã hiển thị cách

định vị chương trình con trong thư viện cư trú trong bộ nhớ hay cách nạp thư viện nếu

chương trình con chưa hiện diện.

Khi stub này được thực thi, nó kiểm tra để thấy chương trình con được yêu cầu

đã ở trong bộ nhớ hay chưa. Nếu chưa, chương trình này sẽ nạp chương trình con vào

trong bộ nhớ. Dù là cách nào, stub thay thế chính nó với địa chỉ của chương trình con

và thực thi chương trình con đó. Do đó, thời điểm tiếp theo phân đoạn mã đạt được,

chương trình con trong thư viện được thực thi trực tiếp mà không gây ra bất kỳ chi

phí cho việc liên kết động. Dưới cơ chế này, tất cả các quá trình sử dụng một thư viện

ngôn ngữ thực thi chỉ một bản sao của mã thư viện.

158

4) Phủ lấp (Overlay)

Để cho phép một quá trình lớn hơn lượng bộ nhớ được cấp phát cho nó, chúng

ta sử dụng cơ chế phủ lấp (overlays). Ý tưởng phủ lấp là giữ trong bộ nhớ những chỉ

thị và dữ liệu được yêu cầu tại bất kỳ thời điểm nào được cho. Khi những chỉ thị đó

được yêu cầu, chúng được nạp vào không gian được chiếm trước đó bởi các chỉ thị

mà chúng không còn cần nữa.

Thí dụ, xét trình dịch hợp ngữ hai lần (two-pass assembler). Trong suốt lần thứ

1, nó xây dựng bảng danh biểu; sau đó, trong lần thứ 2, nó tạo ra mã máy. Chúng ta

có thể phân chia trình dịch hợp ngữ thành mã lần 1, mã lần 2, bảng danh biểu, và

những thủ tục hỗ trợ chung được dùng bởi lần 1 và lần 2. Giả sử kích thước của các

thành phần này như sau:

Lần 1 70 KB

Lần 2 80 KB

Bảng danh biểu 20 KB

Các thủ tục chung 30 KB

Để nạp mọi thứ một lần, chúng ta cần 200KB bộ nhớ. Nếu chỉ có 150KB sẵn

có, chúng ta không thể chạy quá trình của chúng ta. Tuy nhiên, chú ý rằng lần 1 và

lần 2 không cần ở trong bộ nhớ cùng một lúc. Do đó, chúng ta định nghĩa hai phủ lấp.

Phủ lấp A là bảng danh biểu, các thủ tục chung, lần 1, và phủ lắp B là bảng biểu

tượng, các thủ tục chung và lần 2.

Chúng ta bổ sung trình điều khiển phủ lấp (10 KB) và bắt đầu với phủ lấp A

trong bộ nhớ. Khi chúng ta kết thúc lần 1, chúng ta nhảy tới trình điều khiển phủ lấp,

trình điều khiển này sẽ đọc phủ lấp B vào trong bộ nhớ, viết chồng lên phủ lấp B và

sau đó chuyển điều khiển tới lần 2. Phủ lấp A chỉ cần 120KB, ngược lại phủ lấp B cần

130KB (Hình 3.2). Bây giờ chúng ta có thể chạy trình hợp ngữ trong 150KB bộ nhớ.

Nó sẽ nạp nhanh hơn vì rất ít dữ liệu cần được chuyển trước khi việc thực thi bắt đầu.

Tuy nhiên, nó sẽ chạy chậm hơn do nhập/xuất phụ đọc mã mã cho phủ lấp A qua mã

cho phủ lấp B.

159

Hình 3.2 Các phủ lấp cho một bộ hợp ngữ dịch hai lần

3.1.2 Bộ nhớ vật lý và bộ nhớ logic

Một địa chỉ được tạo ra bởi CPU thường được gọi là địa chỉ luận lý (logical

address), ngược lại một địa chỉ được xem bởi đơn vị bộ nhớ nghĩa là, một địa chỉ

được nạp vào thanh ghi địa chỉ bộ nhớ thường được gọi là địa chỉ vật lý (physical

address).

Các phương pháp liên kết địa chỉ thời điểm biên dịch và thời điểm nạp tạo ra

địa chỉ luận lý và địa chỉ vật lý xác định. Tuy nhiên, cơ chế liên kết địa chỉ tại thời

điểm thực thi dẫn đến sự khác nhau giữa địa chỉ luận lý và địa chỉ vật lý. Trong

trường hợp này, chúng ta thường gọi địa chỉ luận lý như là địa chỉ ảo (virtual

address). Tập hợp tất cả địa chỉ luận lý được tạo ra bởi chương trình là không gian địa

chỉ luận lý; tập hợp tất cả địa chỉ vật lý tương ứng địa chỉ luận lý này là không gian

địa chỉ vật lý. Do đó, trong cơ chế liên kết địa chỉ tại thời điểm thực thi, không gian

địa chỉ luận lý và không gian địa chỉ vật lý là khác nhau.

Việc ánh xạ tại thời điểm thực thi từ địa chỉ ảo tới địa chỉ vật lý được thực hiện

bởi một thiết bị phần cứng được gọi là bộ quản lý bộ nhớ MMU (Memory

Management Unit). Chúng ta có thể chọn giữa những phương pháp khác nhau để thực

hiện việc ánh xạ.

Như được hiển thị trong hình 3.3, phương pháp này yêu cầu sự hỗ trợ phần

cứng. Thanh ghi nền bây giờ được gọi là thanh ghi tái định vị. Giá trị trong thanh ghi

tái định vị được cộng vào mỗi địa chỉ được tạo ra bởi quá trình người dùng tại thời

160

điểm nó được gởi tới bộ nhớ. Thí dụ, nếu giá trị nền là 14000, thì việc cố gắng bởi

người dùng để xác định vị trí 0 được tự động tái định vị tới vị trí 14000; một truy xuất

tới địa chỉ 346 được ánh xạ tới vị trí 14346.

Hình 3.3 Định vị tự động dùng thanh ghi tái định vị

3.1.3 Hoán vị (Swap)

Một quá trình cần ở trong bộ nhớ để được thực thi. Tuy nhiên, một quá trình có

thể được hoán vị (swapped) tạm thời khỏi bộ nhớ tới vùng lưu trữ phụ (backing

store), sau đó mang trở lại bộ nhớ để việc thực thi được tiếp tục. Thí dụ, giả sử một

môi trường đa chương với giải thuật lập thời biểu CPU round-robin. Khi định mức

thời gian hết, bộ quản lý bộ nhớ sẽ bắt đầu hoán vị ra (swap out) vùng lưu trữ phụ quá

trình vừa mới kết thúc và hoán vị vào (swap in) một quá trình khác tới không gian bộ

nhớ được trống (Hình 3.4). Do đó, bộ định thời biểu CPU sẽ cấp những phần thời

gian tới những quá trình khác trong bộ nhớ. Lý tưởng, bộ quản lý sẽ hoán vị các quá

trình đủ nhanh để một vài quá trình sẽ ở trong bộ nhớ, sẳn sàng thực thi, khi bộ định

thời CPU muốn định thời lại CPU. Định mức cũng phải đủ lớn để phù hợp lượng tính

toán được thực hiện giữa các hoán vị.

Hình 3.4 Hoán vị hai quá trình dùng đĩa như là backing store

161

Một biến thể của chính sách hoán vị này được dùng cho các giải thuật định

thời trên cơ sở ưu tiên. Nếu một quá trình có độ ưu tiên cao hơn đến và muốn phụ vụ,

bộ quản lý bộ nhớ có thể hoán vị ra quá trình có độ ưu tiên thấp hơn để nó có thể nạp

và thực thi quá trình có độ ưu tiên cao hơn. Khi quá trình có độ ưu tiên cao hơn kết

thúc, quá trình có độ ưu tiên thấp hơn có thể được hoán vị vào trở lại và được tiếp tục.

Biến thể của hoán vị này thường được gọi là cuộn ra (roll out), và cuộn vào (roll in).

Thông thường, một quá trình được hoán vị ra sẽ được hoán vị trở lại vào cùng

không gian bộ nhớ mà nó đã chiếm trước đó. Sự giới hạn này được sai khiến bởi

phương pháp liên kết địa chỉ. Nếu liên kết địa chỉ được thực hiện tại thời điểm hợp

dịch hay nạp thì quá trình không thể được di chuyển vào không gian bộ nhớ khác vì

các địa chỉ vật lý được tính trong thời gian thực thi. Hoán vị yêu cầu một vùng lưu trữ

phụ (backing store). Vùng lưu trữ phụ này thường là một đĩa tốc độ cao. Nó phải đủ

lớn để chứa các bản sao của tất cả hình ảnh bộ nhớ cho tất cả người dùng, và nó phải

cung cấp truy xuất trực tiếp tới các hình ảnh bộ nhớ này. Hệ thống này duy trì một

hàng đợi sẳn sàng chứa tất cả quá trình mà các hình ảnh bộ nhớ của nó ở trong vùng

lưu trữ phụ hay trong bộ nhớ và sẳn sàng để thực thi. Bất cứ khi nào bộ định thời

CPU quyết định thực thi một quá trình, nó gọi bộ phân phát (dispacher). Bộ phân phát

kiểm tra để thấy quá trình tiếp theo trong hàng đợi ở trong bộ nhớ không. Nếu không,

và không có vùng bộ nhớ trống, bộ phân phát hoán vị ra một quá trình hiện hành

trong bộ nhớ và hoán vị vào một quá trình mong muốn. Sau đó, nó nạp lại các thanh

ghi và chuyển điều khiển tới quá trình được chọn.

Trong các hệ hoán vị, thời gian chuyển đổi giữa các tác vụ cần được quan tâm.

Mỗi quá trình cần được phân chia một khoảng thời gian sử dụng CPU đủ lớn để

không thấy rõ sự chậm trễ do các thao tác hoán vị gây ra. Nếu không, hệ thống sẽ

dùng phần lớn thời gian để hoán vị các quá trình vào ra bộ nhớ chính, CPU như vậy

sẽ không sử dụng hiệu quả.

Hoán vị cũng bị ràng buộc bởi yếu tố khác. Nếu chúng ta muốn hoán vị một

quá trình, chúng ta phải đảm bảo rằng nó hoàn toàn rỗi. Quan tâm đặc biệt là việc chờ

nhập/xuất. Một quá trình có thể đang chờ thao tác nhập/xuất khi chúng ta hoán vị quá

trình đó tới nơi trống bộ nhớ của nó. Tuy nhiên, nếu nhập/xuất đang truy xuất không

đồng bộ bộ nhớ người dùng cho nhập/xuất vùng đệm, thì quá trình không thể được

162

hoán vị. Giả sử rằng thao tác nhập/xuất đang xếp hàng chờ vì thiết bị đang bận. Sau

đó, nếu chúng ta hoán vị quá trình P1 ra và hoán vị P2 vào thì thao tác nhập/xuất có

thể cố gắng sử dụng bộ nhớ hiện thuộc về quá trình P2. Hai giải pháp chủ yếu cho quá

trình này là không bao giờ hoán vị quá trình đang chờ nhập/xuất hay thực thi các thao

tác nhập/xuất chỉ ở trong vùng đệm của hệ điều hành. Chuyển giữa các vùng đệm của

hệ điều hành và bộ nhớ quá trình thì chỉ xảy ra khi quá trình được hoán vị vào.

3.1.4 Cấp phát liên tục

Bộ nhớ chính phải cung cấp cho cả hệ điều hành và các quá trình người dùng

khác nhau. Do đó, chúng ta cần cấp phát những phần khác nhau của bộ nhớ chính

trong những cách hiệu quả nhất có thể. Phần này chúng ta giải thích một phương pháp

thông dụng, cấp phát bộ nhớ liên tục.

Bộ nhớ thường được phân chia thành hai phân khu, một cho hệ điều hành định

vị và một cho các quá trình người dùng. Chúng ta có thể đặt hệ điều hành ở bộ nhớ

cao hay bộ nhớ thấp. Yếu tố quan trọng ảnh hưởng tới quyết định này là vị trí của

vector ngắt. Vì vector ngắt thường ở trong bộ nhớ thấp nên các lập trình viên thường

cũng đặt hệ điều hành trong bộ nhớ thấp. Do đó, trong giáo trình này chúng ta sẽ thảo

luận chỉ trường hợp hệ điều hành định vị trong bộ nhớ thấp. Phát triển của trường hợp

khác là tương tự.

Chúng ta thường muốn nhiều quá trình người dùng định vị trong bộ nhớ tại

cùng thời điểm. Do đó, chúng ta cần xem xét cách cấp phát bộ nhớ trống tới những

quá trình ở trong hàng đợi nhập đang chờ được mang vào bộ nhớ. Trong cấp phát bộ

nhớ liên tục, mỗi quá trình được chứa trong một phần bộ nhớ liên tục.

Hình 3.5 Phân vùng bộ nhớ

163

1) Hệ thống đơn chương

Trong phương pháp này bộ nhớ được chia sẻ cho hệ điều hành và một chương

trình duy nhất của người sử dụng. Tại một thời điểm, một phần của bộ nhớ sẽ do hệ

điều hành chiếm giữ, phần còn lại thuộc về quá trình người dùng duy nhất trong hệ

thống (Hình 3.6). Quá trình này được toàn quyền sử dụng bộ nhớ dành cho nó. User

process Operating system 0xFFF… 0

Hình 3.6 Tổ chức bộ nhớ trong hệ thống đơn chương

Khi bộ nhớ được tổ chức theo cách thức này, chỉ có thể xử lý một chương trình

tại một thời điểm. Quan sát hoạt động của các quá trình, có thể nhận thấy rất nhiều

tiến trình trải qua phần lớn thời gian để chờ các thao tác nhập/xuất hoàn thành. Trong

suốt thời gian này, CPU ở trạng thái rỗi. Trong trường hợp như thế, hệ thống đơn

chương không cho phép sử dụng hiệu quả CPU. Ngoài ra, sự đơn chương không cho

phép nhiều người sử dụng làm việc đồng thời theo cơ chế tương tác. Để nâng cao hiệu

suất sử dụng CPU, cần cho phép chế độ đa chương mà trong đó các quá trình chia sẻ

CPU với nhau để hoạt động đồng hành.

2) Hệ thống đa chương với phân khu cố định

Một trong những phương pháp đơn giản nhất để cấp phát bộ nhớ là chia bộ

nhớ thành những phân khu có kích thước cố định. Mỗi phân khu có thể chứa chính

xác một quá trình. Do đó, cấp độ đa chương được giới hạn bởi số lượng phân khu.

Trong phương pháp đa phân khu, khi một phân khu rảnh, một quá trình được chọn từ

hàng đợi nhập và được nạp vào phân khu trống. Khi quá trình kết thúc, phân khu trở

nên sẳn dùng cho một quá trình khác. Có hai tiếp cận để tổ chức hàng đợi:

164

- Sử dụng nhiều hàng đợi: mỗi phân khu sẽ có một hàng đợi tương ứng (Hình

3.7 a). Khi một quá trình mới được tạo ra, nó được đưa vào hàng đợi của phân khu có

kích thước nhỏ nhất thoả nhu cầu chứa nó. Cách tổ chức này có khuyết điểm trong

trường hợp các hàng đợi của một số phân khu trống trong khi các hàng đợi của các

phân khu khác lại đầy, buộc các quá trình trong những hàng đợi này phải chờ được

cấp phát bộ nhớ.

- Sử dụng một hàng đợi: tất cả các quá trình được đặt trong hàng đợi duy nhất

(Hình 3.7b). Khi có một phân khu trống, quá trình đầu tiên trong hàng đợi có kích

thước phù hợp sẽ được đặt vào phân khu và cho xử lý.

Hình 3.7 Cấp phát phân khu có kích thước cố định

Khi sử dụng giải thuật này người ta muốn tránh sự hao phí một phân khu lớn

cho một công việc nhỏ, nhưng lại xảy ra bất bình đẳng, bất lợi đối với các công việc

nhỏ. Để giải quyết người ta thêm vào qui luật là một công việc sẽ không bị bỏ qua

nữa nếu nó đã bị bỏ qua k lần qui định. Mỗi lần một công việc bị bỏ qua nó được

đánh dấu một điểm. Khi đạt được số điểm qui định, nó sẽ không bị bỏ qua nữa, sẽ

được nạp vào và thực hiện mặc dầu có thể trên một phân khu lớn hơn.

Phương pháp này ban đầu được sử dụng bởi hệ điều hành IBM OS/360, nó

được gọi là MFT (Multiprogramming with Fixed number of Tasks). Hiện nay nó

không còn sử dụng nữa.

165

3) Hệ thống đa chương với phân khu động

Cơ chế này là tổng quát của cơ chế phân khu cố định. Nó được dùng chủ yếu

trong môi trường xử lý theo lô. Nhiều ý tưởng được trình bày ở đây cũng có thể áp

dụng tới môi trường chia thời mà trong đó phân đoạn thuần được dùng cho việc quản

lý bộ nhớ.

Hệ điều hành giữ một bảng hiển thị những phần nào của bộ nhớ là sẳn dùng và

phần nào đang bận. Ban đầu, tất cả bộ nhớ là sẳn dùng cho quá trình người dùng, và

được xem như một khối lớn bộ nhớ sẳn dùng hay một lỗ. Khi một quá trình đến và

cần bộ nhớ, chúng ta tìm kiếm một lỗ trống đủ lớn cho quá trình này. Nếu chúng ta

tìm thấy, chúng ta cấp phát chỉ phần bộ nhớ nhiều bằng lượng được yêu cầu, phần còn

lại sẳn dùng để thoả mãn những yêu cầu tương lai (Hình 3.8).

Hình 3.8 Cấp phát các phân khu có kích thước thay đổi

Khi các quá trình đi vào hệ thống, chúng được đặt vào hàng đợi nhập. Hệ điều

hành xem xét yêu cầu bộ nhớ của mỗi quá trình và lượng không gian bộ nhớ sẳn có

để xác định các quá trình nào được cấp phát bộ nhớ. Khi một quá trình được cấp

không gian, nó được nạp vào bộ nhớ và sau đó nó có thể cạnh tranh CPU. Khi một

quá trình kết thúc, nó giải phóng bộ nhớ của nó, sau đó hệ điều hành có thể đặt một

quá trình khác từ hàng đợi nhập.

Tại bất cứ thời điểm được cho, chúng ta có một danh sách kích thước khối

trống và hàng đợi nhập. Hệ điều hành có thể xếp hàng đợi nhập dựa theo giải thuật

định thời. Bộ nhớ được cấp phát tới quá trình cho đến khi các yêu cầu bộ nhớ của quá

trình kế tiếp không thể được thoả; không có khối bộ nhớ trống đủ lớn để quản lý quá

trình đó. Sau đó, hệ điều hành có thể chờ cho đến khi khối đủ lớn sẳn dùng hay nó có

166

thể di chuyển xuống hàng đợi nhập để xem các yêu cầu bộ nhớ nhỏ hơn của các quá

trình khác có thể được thoả hay không.

Thông thường, một tập hợp các lỗ có kích thước khác nhau được phân tán

khắp bộ nhớ tại bất cứ thời điểm được cho. Khi một quá trình đến và yêu cầu bộ nhớ,

hệ thống tìm tập hợp này một lỗ trống đủ lớn cho quá trình này. Nếu lỗ trống quá lớn,

nó được chia làm hai: một phần được cấp tới quá trình đến; phần còn lại được trả về

tập hợp các lỗ. Nếu lỗ mới nằm kề với các lỗ khác, các lỗ nằm kề này được gom lại

để tạo thành một lỗ lớn hơn. Tại thời điểm này, hệ thống cần kiểm tra có quá trình

nào đang chờ bộ nhớ và bộ nhớ trống mới hay bộ nhớ vừa được kết hợp lại có thể

thoả yêu cầu của bất cứ quá trình đang chờ này không.

Thủ tục này là một trường hợp đặc biệt của vấn đề cấp phát lưu trữ động là làm

cách nào để thoả mãn một yêu cầu có kích thước n từ danh sách lỗ trống. Có hai giải

pháp chủ yếu cho vấn đề này.

a) Quản lý bằng bản đồ bit: bộ nhớ được chia thành các đơn vị cấp phát, mỗi

đơn vị được ánh xạ tới một bit trong bản đồ bit (Hình 3.9). Giá trị bit này xác định

trạng thái của đơn vị bộ nhớ đó: 0 đang tự do, 1 đã được cấp phát. Khi cần nạp một

quá trình có kích thước k đơn vị, hệ thống sẽ tìm trong bản đồ bit một dãy k bit có giá

trị 0.

Kích thước của đơn vị cấp phát là vấn đề lớn trong thiết kế. Nếu kích thước

đơn vị cấp phát nhỏ sẽ làm tăng kích thước của bản đồ bit. Ngược lạ, nếu kích thước

đơn vị cấp phát lớn có thể gây hao phí cho đơn vị cấp phát sau cùng. Đây là giải pháp

đơn giản nhưng thực hiện chậm nên ít được dùng.

Hình 3.9 Quản lý bộ nhớ bằng bản đồ bit

167

b) Quản lý bằng danh sách liên kết: dùng một danh sách liên kết để quản lý

các phân đoạn bộ nhớ đã cấp phát và phân đoạn tự do, một phân đoạn có thể là một

quá trình hay một vùng nhớ trống giữa hai quá trình. Danh sách liên kết gồm nhiều

mục từ liên tiếp. Mỗi mục từ gồm 1 bit đầu để xác định phân đoạn đó là lỗ trống (H)

hay một quá trình (P), sau đó là 3 từ để chỉ địa chỉ bắt đầu, chiều dài và chỉ điểm tới

mục kế tiếp. Việc sắp xếp các phân đoạn theo địa chỉ hay theo kích thước tuỳ thuộc

vào giải thuật quản lý bộ nhớ. Sơ đồ quản lý bằng danh sách liên kết tương ứng với sơ

đồ quản lý bằng bản đồ bit được minh hoạ trong hình 3.10.

Hình 3.10 Quản lý bộ nhớ bằng danh sách liên kết

Tập hợp các lỗ trống được tìm thấy để xác định lỗ nào là tốt nhất để cấp phát.

Các chiến lược first-fit, best-fit, worst-fit là những chiến lược phổ biến nhất được

dùng để chọn một lỗ trống từ tập hợp các lỗ trống.

- First-fit: cấp phát lỗ trống đầu tiên đủ lớn. Tìm kiếm có thể bắt đầu tại đầu

tập hợp các lỗ trống hay tại điểm kết thúc của tìm kiếm first-fit trước đó. Chúng ta

dừng tìm kiếm ngay khi chúng ta tìm thấy một lỗ trống đủ lớn.

- Best-fit: cấp phát lỗ trống nhỏ nhất đủ lớn. Chúng ta phải tìm toàn bộ danh

sách, trừ khi danh sách được xếp thứ tự theo kích thước. Chiến lược này tạo ra lỗ

trống nhỏ nhất còn thừa lại.

- Worst-fit: cấp phát lỗ trống lớn nhất. Chúng ta phải tìm toàn danh sách trừ

khi nó được xếp theo thứ tự kích thước. Chiến lược này tạo ra lỗ trống còn lại lớn

nhất mà có thể có ích hơn lỗ trống nhỏ từ tiếp cận best-fit.

Các mô phỏng hiển thị rằng cả first-fit và best-fit là tốt hơn worst-fit về việc

giảm thời gian và sử dụng lưu trữ. Giữa first-fit và best-fit không thể xác định rõ

chiến lược nào tốt hơn về sử dụng lưu trữ, nhưng first-fit có tốc độ nhanh hơn.

Tuy nhiên, các giải thuật này gặp phải vấn đề phân mảnh ngoài (external

fragmentation). Khi các quá trình được nạp và được xoá khỏi bộ nhớ, không gian bộ

168

nhớ trống bị phân rã thành những mảnh nhỏ. Phân mảnh ngoài tồn tại khi tổng không

gian bộ nhớ đủ để thoả mãn một yêu cầu, nhưng nó không liên tục; vùng lưu trữ bị

phân mảnh thành một số lượng lớn các lỗ nhỏ. Vấn đề phân mảnh này có thể rất lớn.

Trong trường hợp xấu nhất, chúng có thể có một khối bộ nhớ trống nằm giữa mỗi hai

quá trình. Nếu tất cả bộ nhớ này nằm trong một khối trống lớn, chúng ta có thể chạy

nhiều quá trình hơn.

Chọn lựa first-fit so với best-fit có thể ảnh hưởng tới lượng phân mảnh. (First-

fit là tốt hơn đối với một số hệ thống, ngược lại best fit là tốt hơn cho một số hệ thống

khác). Một yếu tố khác là phần cuối của khối trống nào được cấp phát. (phần còn dư

nào-phần trên đỉnh, hay phần ở dưới đây?). Vấn đề không do giải thuật nào được

dùng mà do phân mảnh ngoài.

4) Quản lý bộ nhớ với hệ thống bạn thân

Như ta đã thấy trong phần trước, việc quản lý các lỗ hổng trên những bảng liệt

kê được sắp xếp theo kích thước làm cho việc cấp phát bộ nhớ rất nhanh, nhưng lại

làm chậm cho việc ngưng cấp phát bởi vì ta phải chú ý đến các láng giềng. Hệ thống

bạn thân (Buddy System) là một giải thuật quản lý bộ nhớ tận dụng thuận lợi của việc

máy tính dùng những số nhị phân cho việc đánh địa chỉ để tăng tốc độ kết hợp những

lỗ hổng sát nhau khi một quá trình hoàn thành hoặc được hoán vị ra ngoài.

Với phương pháp này, bộ quản lý bộ nhớ sẽ có một bảng liệt kê những khối

còn tự do có kích thước 1, 2, 4, 16 ... bytes đến kích thước của bộ nhớ, tức là có kích

thước bằng lũy thừa của 2. Khi có một quá trình cần cấp phát bộ nhớ, một lỗ hổng có

kích thước bằng lũy thừa của 2 đủ chứa quá trình sẽ được cấp phát. Nếu không có lỗ

hổng yêu cầu, các lỗ hổng sẽ được phân đôi cho đến khi có được lỗ hỗng cần thiết.

Khi một quá trình chấm dứt, các lỗ hổng kế nhau có kích thước bằng nhau sẽ được

nhập lại để tạo thành lỗ hổng lớn hơn. Do đó, giải thuật này được gọi là hệ thống bạn

thân.

Thí du: với bộ nhớ 1M, cần phải có 21 bảng liệt kê như thế sắp từ 1 bytes (2⁰)

đến 1 byte (2²⁰). Khởi đầu toàn bộ bộ nhớ còn tự do và bảng liệt kê 1M có một mục từ

độc nhất chứa đựng một lỗ hổng 1M, tất cả các bảng liệt kê khác đều rỗng. Cấu hình

bộ nhớ lúc khởi đầu được chỉ ra trong hình 3.11.

169

Hình 3.11 Hệ thống bạn thân với kích thước 1MB

Bây giờ chúng ta hãy xem cách hệ thống buddy làm việc khi một quá trình

70K được hoán vị vào bộ nhớ trống 1M. Do những lỗ hổng chỉ có thể có kích thước

là lũy thừa của 2, 128K sẽ được yêu cầu, bởi vì đó chính là lũy thừa nhỏ nhất của 2 đủ

lớn. Không có khối 128K sẵn, cũng không có các khối 256K và 512K. Vì vậy khối

1M sẽ được chia làm hai khối 512K, được gọi là những bạn thân; một tại địa chỉ 0 và

một tại địa chỉ 512K. Sau đó khối tại địa chỉ thấp hơn, chính là khối tại 0 lại được

phân làm hai khối bạn thân 256K, một tại 0 và một tại 256K. Cái thấp hơn của chúng

lại được phân làm hai khối 128K, và khối tại 0, đánh dấu là A trong hình được cấp

phát cho quá trình.

Kế đến, một quá trình 35K được hoán vị vào. Khi đó ta cần khối 64K, nhưng

cũng không có sẵn, vì thế phải phân phối khối 128K thành hai khối bạn thân 64K,

một tại địa chỉ 128K, một tại 192K. Khối tại 128K được cấp cho quá trình, trong hình

là B. Yêu cầu thứ ba là 80K.

Bây giờ ta hãy xem những gì xảy ra khi một khối được trả lại. Giả sử tại thời

điểm này khối 128K (mà chỉ dùng có 70K) được tự do. Khi đó khối 128K sẽ được

đưa vào bảng tự do. Bây giờ cần một khối 60K. Sau khi kiểm tra, khối 64K tại 192K

được cấp phát và nó được đánh dấu là C.

Bây giờ khối B được trả lại. Tại thời điểm này có hai khối 128K tự do nhưng

chúng không được kết hợp lại. Chú ý rằng ngay cả khi khối 128K tại 0 được phân ra

làm 2, khối tại 9 được dùng và khối tại 84K còn tự do, sự kết hợp cũng không xảy ra.

170

Khi D được trả lại, sẽ có sự kết hợp lại thành khối 256K tại 0. Cuối cùng, khi C được

trả lại, sẽ có kết hợp tạo thành 1 lỗ hổng 1M như ban đầu.

Hệ thống bạn thân có sự thuận lợi so với những giải thuật cùng sắp xếp theo

kích thước của khối. Sự thuận lợi này là khi có một khối 2K bytes tự do, bộ quản lý

bộ nhớ chỉ cần tìm trong bảng liệt kê lỗ hổng có kích thước 2K để xem chúng có khả

năng kết hợp được hay không. Với những giải thuật khác mà trong đó cho phép các

khối bộ nhớ được phân chia một cách tùy ý, việc tìm kiếm phải diễn ra trên tất cả các

bảng liệt kê. Do dó, hệ thống bạn thân làm việc nhanh hơn.

Đáng tiếc, nó lại cực kỳ kém hiệu quả trong việc sử dụng bộ nhớ. Một quá

trình 35K phải được cấp phát đến 64K, hao phí đến 29K. Sự hao phí này được gọi là

sự phân mảnh trong (internal fragmentation), bởi vì phần bộ nhớ hao phí nằm bên

trong đoạn được cấp phát. Còn trong các phần trước ta thấy những lỗ hổng ở giữa các

đoạn, nhưng không có sự hao phí bên trong các đoạn, do đó kiểu này được coi là sự

phân mảnh ngoài.

Phân mảnh: Phân mảnh bộ nhớ có thể là phân mảnh trong hoặc phân

mảnh ngoài. Xét cơ chế cấp phát nhiều phân khu với một lỗ trống có kích thước

18,464 bytes. Giả sử rằng quá trình tiếp theo yêu cầu 18,462 bytes. Nếu chúng

ta cấp phát chính xác khối được yêu cầu, chúng ta để lại một lỗ trống có kích

thước 2 bytes. Chi phí để giữ vết của lỗ này sẽ lớn hơn kích thước của lỗ trống.

Tiếp cận thông thường là chia bộ nhớ vật lý thành những khối có kích thước cố

định, và cấp phát bộ nhớ dựa theo đơn vị của kích thước khối. Với tiếp cận này,

bộ nhớ được cấp phát tới một quá trình có thể là lớn hơn một chút so với khối

được yêu cầu. Sự chênh lệnh giữa hai số này là phân mảnh trong-bộ nhớ bị

phân mảnh trong đối với một phân khu thì không thể được dùng.

Một giải pháp đối với phân mảnh ngoài là kết lại thành khối (compaction).

Mục tiêu là di chuyển nội dung bộ nhớ để đặt tất cả bộ nhớ trống với nhau trong một

khối lớn. Kết khối không phải luôn thực hiện được. Nếu việc tái định vị là tĩnh và

được thực hiện tại thời điểm hợp dịch và nạp thì việc kết khối là không thể thực hiện

được. Kết khối chỉ có thể thực hiện được chỉ nếu tái định vị là động và được thực hiện

tại thời điểm thực thi. Nếu địa chỉ được tái định vị động, tái định vị yêu cầu chỉ di

171

chuyển chương trình và dữ liệu, sau đó thay đổi thanh ghi nền để phản ánh địa chỉ nền

mới. Khi kết khối là có thể, chúng ta phải xác định chi phí của nó. Giải thuật kết khối

đơn giản nhất là di chuyển tất cả quá trình tới cuối bộ nhớ; tất cả lỗ trống di chuyển

theo hướng ngược lại, tạo ra một lỗ trống lớn của bộ nhớ sẳn dùng. Cơ chế này có thể

đắt.

Một giải pháp khác cho vấn đề phân mảnh ngoài là cho phép không gian địa

chỉ luận lý của một quá trình là không liên tục, do đó cho phép một quá trình được

cấp phát bộ nhớ vật lý bất cứ đâu sau khi sẳn dùng. Hai kỹ thuật bù trừ để đạt giải

pháp này là phân trang và phân đoạn.

3.1.5 Phân trang

Phân trang là cơ chế quản lý bộ nhớ cho phép không gian địa chỉ vật lý của

quá trình là không kề nhau. Phân trang tránh vấn đề đặt vừa khít nhóm bộ nhớ có kích

thước thay đổi vào vùng lưu trữ phụ (backing store) mà hầu hết các cơ chế quản lý bộ

nhớ trước đó gặp phải. Khi phân đoạn mã và dữ liệu nằm trong bộ nhớ được hoán vị

ra, không gian phải được tìm thấy trên vùng lưu trữ phụ. Vấn đề phân mảnh được

thảo luận trong sự kết nối với bộ nhớ chính cũng thông dụng như với vùng lưu trữ

phụ, ngoại trừ truy xuất thấp hơn nhiều, vì thế kết khối là không thể. Vì lợi điểm của

nó so với các phương pháp trước đó nên phân trang trong những dạng khác nhau

được dùng phổ biến trong hầu hết các hệ điều hành.

Về truyền thống, hỗ trợ phân trang được quản lý bởi phần cứng. Tuy nhiên,

những thiết kế gần đây cài đặt phân trang bằng cách tích hợp chặt chẻ phần cứng và

hệ điều hành, đặc biệt trên các bộ vi xử lý 64-bit.

1) Phương pháp cơ bản

Bộ nhớ vật lý được chia thành các khối có kích thước cố định được gọi là các

khung (frames). Bộ nhớ luận lý cũng được chia thành các khối có cùng kích thước

được gọi là các trang (pages). Khi một quá trình được thực thi, các trang của nó được

nạp vào các khung bộ nhớ sẳn dùng từ vùng lưu trữ phụ. Vùng lưu trữ phụ được chia

thành các khối có kích thước cố định và có cùng kích thước như các khung bộ nhớ.

Hỗ trợ phần cứng cho phân trang được hiển thị trong hình 3.12. Mỗi địa chỉ

được tạo ra bởi CPU được chia thành hai phần: số trang (p) và độ dời trang (d). Số

trang được dùng như chỉ mục vào bảng trang. Bảng trang chứa địa chỉ nền của mỗi

172

trang trong bộ nhớ vật lý. Địa chỉ nền này được kết hợp với độ dời trang để định

nghĩa địa chỉ bộ nhớ vật lý mà nó được gởi đến đơn vị bộ nhớ. Mô hình phân trang bộ

nhớ được hiển thị như hình 3.13.

Hình 3.12 Phần cứng phân trang

Kích thước trang (giống như kích thước khung) được định nghĩa bởi phần

cứng. Kích thước của một trang điển hình là luỹ thừa của 2, từ 512 bytes đến 16MB

trên trang, phụ thuộc vào kiến trúc máy tính. Chọn luỹ thừa 2 cho kích thước trang

thực hiện việc dịch địa chỉ luận lý thành số trang và độ dời trang rất dễ dàng. Nếu

kích thước không gian địa chỉ là 2^m, và kích thước trang là 2ⁿđơn vị địa chỉ (byte hay

từ) thì m-n bits cao của địa chỉ luận lý chỉ số trang, n bits thấp chỉ độ dời trang. Do

đó, địa chỉ luận lý như sau:

ở đây p là chỉ mục trong bảng trang và d là độ dời trong trang.

Hình 3.13 Mô hình phân trang của bộ nhớ luận lý và vật lý

173

Thí dụ: xét bộ nhớ trong hình 3.14. Sử dụng kích thước trang 4 bytes và bộ

nhớ vật lý 32 bytes (có 8 trang), chúng ta hiển thị cách nhìn bộ nhớ của người dùng

có thể được ánh xạ tới bộ nhớ vật lý như thế nào. Địa chỉ luận lý 0 là trang 0, độ dời

0. Chỉ mục trong bảng trang, chúng ta thấy rằng trang 0 ở trong khung 5. Do đó, địa

chỉ luận lý 0 ánh xạ tới địa chỉ vật lý 20 (=(5x4)+0). Địa chỉ luận lý 3 (trang 0, độ dời

3) ánh xạ tới địa chỉ vật lý 23 (=(5x4)+3). Địa chỉ luận lý 4 ở trang 1, độ dời 0; dựa

theo bảng trang, trang 1 được ánh xạ tới khung 6. Do đó, địa chỉ luận lý 4 ánh xạ tới

địa chỉ 24(=(6x4)+0). Địa chỉ luận lý 13 ánh xạ tới địa chỉ vật lý 9.

Có thể chú ý rằng phân trang là một dạng của tái định vị động. Mỗi địa chỉ

luận lý được giới hạn bởi phần cứng phân trang tới địa chỉ vật lý. Sử dụng phân trang

tương tự sử dụng một bảng các thanh ghi nền (hay tái định vị), một thanh ghi cho mỗi

khung bộ nhớ.

Khi chúng ta sử dụng một cơ chế phân trang, chúng ta không có phân mảnh

bên ngoài: bất kỳ khung trống có thể được cấp phát tới một quá trình cần nó. Tuy

nhiên, chúng ta có thể có phân mảnh trong. Chú ý rằng các khung được cấp phát như

các đơn vị. Nếu các yêu cầu bộ nhớ của một quá trình không xảy ra để rơi trên giới

hạn của trang, thì khung cuối cùng được cấp phát có thể không đầy hoàn toàn. Thí dụ,

nếu các trang là 2048 bytes, một quá trình 72,766 bytes sẽ cần 35 trang cộng với 1086

bytes. Nó được cấp phát 36 khung, do đó phân mảnh trong là 2048 - 1086 = 962

bytes. Trong trường hợp xấu nhất, một quá trình cần n trang cộng với 1 byte. Nó sẽ

được cấp phát n+1 khung, dẫn đến phân mảnh trong gần như toàn bộ khung.

Nếu kích thước quá trình độc lập với kích thước của trang, thì chúng ta mong

muốn phân mảnh trong trung bình là ½ trang trên một quá trình. Xem xét này đề nghị

rằng kích thước trang nhỏ là mong muốn. Tuy nhiên, chi phí liên quan tới mỗi mục từ

bảng trang và chi phí này giảm khi kích thước trang tăng. Vì thế nhập/xuất đĩa là hiệu

quả hơn khi số lượng dữ liệu được truyền lớn hơn. Thường thì kích thước trang lớn

lên theo thời gian khi các quá trình, tập hợp dữ liệu, bộ nhớ chính trở nên lớn hơn.

Ngày nay, các trang điển hình nằm trong khoảng 4 KB tới 8 KB, và một số hệ thống

hỗ trợ kích thước trang lớn hơn. CPU và nhân thậm chí hỗ trợ nhiều kích thước khác

nhau. Thí dụ, Solaris dùng 8 KB và 4 MB kích thước trang, phụ thuộc dữ liệu được

174