Sunday, November 29, 2009

Kiến trúc Unix/Linux

I. Tổng quan về Hệ Điều Hành
An Operating System is a group of programs that provide basic functionality on a computer. This functionality is called services. Other word an Operating System can be seen as a set of functionality building blocks upon which other programs depend. It also manages computer resources and resolves resource conflicts, so OS abstracts the real hardware of the system and presents the system’s users and its applications with a virtual machine.

1. Phần mềm máy tính


Phần mềm máy tính được chia ra làm hai loại:
  • các phần mềm hệ thống, quản lí hoạt động của bản thân máy tính
  • các chương trình ứng dụng, giải quyết các yêu cầu của người dùng.
Phần cơ bản nhất của tất cả các phần mềm hệ thống, gọi là Hệ điều hành, mà chức năng cơ bản là kiểm soát tất cả nguồn tài nguyên, cung cấp nền tảng (các hàm chức năng, các dịch vụ hệ thống) để trên đó các chương trình ứng dụng được viết ra sẽ sử dụng. Mô hình một máy tính như sau:



Hình trên cho ta một phần gọi là kernel, hay nhân của HĐH, kernel hổ trợ HĐH thực hiện chức năng quản lí các thành phần sau đây:
  1. Thiết bị (devices), cho một giao tiếp để các chương trình người dùng “ nói chuyện” với thiết bị.
  2. Bộ nhớ (memory), cấp bộ nhớ cho các chương trình (tiến trình) đang chạy.
  3. Các Tiến trình (process), tạo, giám sát hoạt động của các tiến trình.
  4. Liên lạc (communication) giữa các TT.
Nguồn tài nguyên máy tính có nhiều, như (CPU(s), bộ nhớ, các thiết bị ngoại vi ghép nối vào máy tính…) tạo thành một hệ thống rất phức tạp. Viết các chương trình để theo dõi tất cả các thành phần, khai thác chúng chính xác và để chúng chạy độc lập một cách tối ưu, là việc rất khó. Và nếu điều này lại để cho từng người dùng quan tâm, thì sẽ có vô số các chương trình được viết và nếu hệ là loại nhiều người dùng thì, hãy thử tưởng tượng … Như vậy rỏ ràng cần tách người dùng ra khỏi sự phức tạp của phần cứng. Cách có thể đảm bảo là đặt phần mềm (hay lớp phần mềm) lên trên đỉnh của phần cứng và nó quản lí tất cả các phần của máy tính, trong khi trao cho người dùng một giao diện (interface) hay một máy tính ảo (virtual machine) dễ hiểu hơn và dễ lập trình ứng dụng hơn. Lớp phần mềm đó gọi là HĐH.

Từ đây xuất hiện một quan niệm mới, đó là sự phân biệt chế độ chạy máy, nó bao gồm:
  • kernel mode
  • user mode
HĐH chạy trong một môi trường đặc biệt, gọi là chế độ nhân (kernel mode hay supervisor mode). Chế độ này được hổ trợ bởi kiến trúc của CPU ( bởi các lệnh máy đặc biệt) và nó ngăn người dùng truy nhập vào phần cứng (quản lí phần cứng chuẩn xác cho nhiều người dùng đồng thời, còn gọi là chế độ được bảo vệ (protected mode)). Thuật ngữ kernel đề cập đến phần mã cốt yếu nhất của các chương trình hệ thống, nó kiểm soát các tệp, khởi động và cho chạy các chương trình ứng dụng đồng thời, phân chia thời gian sử dụng CPU cho các chương trình, cấp bộ nhớ cũng như các tài nguyên khác cho các chương trình của người dùng. Bản thân kernel không làm gì nhiều nhưng cung cấp các công cụ nguyên thuỷ (primitive functions) mà các tiện ích khác, các dịch vụ khác của HĐH được xây dựng. Do đó các chương trình hệ thống, các trình ứng dụng sử dụng các dịch vụ của HĐH, chạy trong user mode. Tuy nhiên có sự khác biệt là các trình ứng dụng thì tận dụng những tiện ích hệ thống cho, còn các trình hệ thống là cần thiết để máy tính chạy được. Các trình ứng dụng chạy trong chế độ người dùng (user mode), các primitive functions chạy trong kernel . Việc kết nối giữa hai chế độ chạy trình được thực hiện bởi gọi hệ thống (system call).

Gọi hệ thống (hay gọi các dịch vụ của hệ thống, GHT), là một giao diện lập trình giữa HĐH và ứng dụng. Nó được thực hiện bằng cách đặt các thông số vào những chổ được định nghĩa rỏ ràng (vào các thanh ghi của CPU hay đặt vào stack) và sau đó thực hiện một lệnh bẩy đặt biệt (trap intruction) của CPU. Lệnh này chuyển chế độ chạy máy từ user mode vào kernel mode và từ đó điều khiển chuyển cho HĐH (1). Tiếp theo HĐH kiểm tra số hiệu và các thông số của GHT để xác định GHT nào sẽ thực hiện (2). Từ trong bảng với chỉ số (số hiệu của GHT), HĐH lấy ra con trỏ trỏ đến qui trình (procedure) thực hiện GHT đó (3). Khi thực hiện xong GHT, điều khiển chuyển trả lại cho chương trình của người dùng.



Từ đây có thể thấy cấu trúc cơ bản của GHT như sau:
  1. Một chương trình chính kích hoạt dịch vụ hệ thống bằng một GHT.
  2. Bẩy (TRAP) chuyển GHT vào nhân HĐH, nhân xác định số hiệu của dịch vụ.
  3. Thực hiện dịch vụ.
  4. Kết thúc dịch vụ và trở về nơi phát sinh GHT.
Hình sau cho các bước theo trình tự từ lập trình đến thực thi GHT read():



Khi nhìn cách thực thi một chương trình, phần mã chương trình người dùng được kết hợp với mã của kernel (khi thực hiện các primitive functions qua GHT), tạo ra toàn bộ mã chương trình. Nói cách khác vào thời điểm chạy trình, phần mã của kernel thực hiện bởi GHT là mã của chương trình người dùng, chỉ khác ở chế độ thực hiện.

2. Trên cơ sở định nghĩa kernel mode và user mode, kiến trúc của các HĐH có thể khác nhau:
a. Loại đơn thể (monolitic OS):



HĐH kiểu đơn thể (monolitic OS)
Các trình ứng dụng chạy ở user mode khi thực hiện gọi một dịch vụ của Hệ thống, HĐH sẽ chuyển việc thực hiện dịch vụ vào kernel mode. Khi dịch vụ hoàn tất HĐH chuyển việc thực hiện chương trình đã phát sinh gọi dịch vụ trở lại user mode, chương trình này tiếp tục chạy. PC DOS là một ví dụ. Đặc điểm chung của loại này là kernel là một thực thể đơn, một chương trình rất lớn, mà các thành phần chức năng truy nhập tới tất cả các cấu trúc dữ liệu và thủ tục của hệ thống.
b. Mô hình Client/Server:
Chia OS ra thành nhiều tiến trình (TT), mỗi TT cung cấp một tập các dịch vụ ( ví dụ các dịch vụ bộ nhớ, dịch vụ tạo TT, dịch vụ lập biểu …). Các phần mềm dịch vụ (server) chạy trong user mode thực hiện vòng lặp để tiếp nhận yêu cầu các dịch vụ của nó từ các client. Client có thể là thành phần khác của HĐH, hay là một ứng dụng, yêu cầu phục vụ bằng cách gởi một thông điệp (message) tới server. Kernel của HĐH, là phần rất nhỏ gọn (microkernel) chạy trong kernel mode phát các thông điệp tới server, server thực hiện yêu cầu, kernel trả lại kết quả cho client. Server chạy các TT trong user mode tách biệt, nên nếu có sự cố (fail) thì toàn bộ hệ thống không hề bị ảnh hưởng. Với nhiều CPU, hay nhiều máy kết hợp, các dịch vụ chạy trên các CPU, máy khác nhau, thích hợp cho các tính toán phân tán.



c. Loại cấu trúc theo lớp (layered OS):

HĐH được chia thành các lớp xếp chồng lên nhau. Phân lớp là cấu trúc được sắp xếp theo hai hướng lên-xuống (nhìn tại một lớp bất kì), sao cho mỗi lớp thành một đơn thể với chức năng cung cấp các dịch vụ cho lớp trên liền kề, và sử dụng tòan bộ dịch vụ của lớp dưới liền kề, với nguyên tắc lớp trên yêu cầu và nhận kết quả, lớp dưới thực hiện và trao kết quả cho lớp trên. Với cách xác định tường minh như vậy sẽ tránh được sự trùng lặp chức năng cũng như chồng chéo quan hệ (ví dụ ở mô hình đơn thể nói trên) giữa các đơn thể. Kiểu cấu trúc này mang lại các ưu điểm sau:
  • Nếu chuẩn hóa được các dịch vụ ở mỗi lớp, và chuẩn định dạng dữ liệu vào/ra thì các phần mềm thực hiện đơn thể sẽ trở nên phổ quát, dễ dùng chung cho các hệ thống có cấu trúc tương tự. Chương trình nguồn dễ dàng biên dịch lại và chạy ở các phần cứng khác nhau. Đó là tính portable.
  • Đơn giản hóa quá trình cải tiến hay nâng cấp hệ thống bằng việc thay đổi, nâng cấp các đơn thể các thể, mà không phải chờ đợi cho đến khi hòan tất toàn bộ hệ thống. Chính nhờ vậy mà tăng được hiệu năng họat động, tính ổn định của hệ thống.
  • Hổ trợ tốt cho nhu cầu trao đổi dữ liệu giữa các hệ thống khác nhau khi có sự chuẩn hóa về giao diện (interface), và giao thức (protocol). Đó chính là tính mở của hệ thống.
Các HĐH kiểu UNIX (VAX/VMS hay Multics (tiền thân của UNIX), …) thuộc loại này.Hãy quan sát mô tả điển hình của cấu trúc phân lớp theo hình sau:



Trên mô hình này, lớp 1, 2 gần với từng loại kiến trúc máy tính (hardware), trong đó lớp 1 cố gắng dấu đi các kiến trúc phần cứng có thể, tạo ra một lớp phần cứng trừu tượng (Hardware Abstract Layer). Lớp 2 là các thao tác (handling) cơ bản áp dụng trên các phần cứng bên dưới (bao gồm xử lí ngắt, chuyển bối cảnh thực hiện của các tiến trình, quản lí bộ nhớ). Lớp 3 thực thi phân phối thời gian chạy máy (scheduling), đồng bộ tiến trình và luồng. Lớp 4 là các đặc tả thiết bị có trên máy dạng tổng quát, không phụ thuộc vào loại thiết bị cụ thể, ví dụ ở UNIX tại gồm các tệp thiết bị tại thư mục /dev. Lớp 5 và 6 là cách tổ chức tài nguyên mà kernel sẽ thực hiện các biện pháp quản lí (tổ chức chức tệp (File System, Virtual File System), bộ nhớ ảo). Lớp 7 là giao diện của HĐH với trình ứng dụng. Có thể thấy, lớp 3 đến 7 là các lớp tổng quát, không phụ thuộc vào phần cứng. Như vậy mã thực thi có thể triển khai trên bất kì loại kiến trúc máy nào. Mô hình dưới cho thấy một ví dụ của ý tưởng trên:



Unix là một ví dụ điển hình với các đặc điểm như sau:
  • Hệ được viết bằng ngôn ngữ bậc cao, làm cho dễ đọc, dễ hiểu, dễ thay đổi và chạy trên các nền phần cứng khác nhau.
  • Có giao diện người dùng đơn giản, mang lại sức mạnh cung cấp các dịch vụ người dùng yêu cầu.
  • Cung cấp các hàm cơ bản (primitive) để phát triển các chương trình phức tạp từ các chương trình đơn giản.
  • Sử dụng hệ thống tệp có cấu trúc, dễ dùng, dễ bảo trì và hiệu quả.
  • Tệp được tổ chức theo kiểu dòng các byte, nhất quán, dễ tạo các ứng dụng.
  • Giao tiếp các thiết bị ngoại vi đơn giản, nhất quán và ổn định.
  • Là hệ nhiều người dùng, nhiều tiến trình, mỗi người dùng có thể chạy nhiều tiến trình đồng thời. Hệ cón là hệ đa xử lí.
  • Người phát triển ứng dụng không cần biết tới cấu trúc máy tính, do đó ứng dụng viết ra có thể chạy trên nhiều phần cứng khác nhau.
Đơn giản, nhất quán, đó là tư tưởng chủ đạo của Unix.

No comments:

Post a Comment