Kiến trúc tổng quát của các hệ chuyên gia
Một hệ chuyên gia kiểu mẫu gồm bảy thành phần cơ bản như sau : Những thành phần cơ bản của một hệ chuyên gia Cơ sở tri thức (knowledge base). Gồm các phần tử (hay đơn vị) tri thức, thông thường ...
Một hệ chuyên gia kiểu mẫu gồm bảy thành phần cơ bản như sau :

- Cơ sở tri thức (knowledge base). Gồm các phần tử (hay đơn vị) tri thức, thông thường được gọi là luật (rule), được tổ chức như một cơ sở dữ liệu.
- Máy duy diễn (inference engine). Công cụ (chương trình, hay bộ xử lý) tạo ra sự suy luận bằng cách quyết định xem những luật nào sẽ làm thỏa mãn các sự kiện, các đối tượng. , chọn ưu tiên các luật thỏa mãn, thực hiện các luật có tính ưu tiên cao nhất.
- Lịch công việc (agenda). Danh sách các luật ưu tiên do máy suy diễn tạo ra thoả mãn các sự kiện, các đối tượng có mặt trong bộ nhớ làm việc.
- Bộ nhớ làm việc (working memory). Cơ sở dữ liệu toàn cục chứa các sự kiện phục vụ cho các luật.
- Khả năng giải thích (explanation facility). Giải nghĩa cách lập luận của hệ thống cho người sử dụng.
- Khả năng thu nhận tri thức (explanation facility). Cho phép người sử dụng bổ sung các tri thức vào hệ thống một cách tự động thay vì tiếp nhận tri thức bằng cách mã hoá tri thức một cách tường minh. Khả năng thu nhận tri thức là yếu tố mặc nhiên của nhiều hệ chuyên gia.
- Giao diện người sử dụng (user interface). Là nơi người sử dụng và hệ chuyên gia trao đổi với nhau.
Cơ sở tri thức còn được gọi là bộ nhớ sản xuất (production memeory) trong hệ chuyên gia. Trong một cơ sở tri thức, người ta thường phân biệt hai loại tri thức là tri thức phán đoán (assertion knowledge) và tri thức thực hành (operating knowledge).
Các tri thức phán đoán mô tả các tình huống đã được thiết lập hoặc sẽ được thiết lập. Các tri thức thực hành thể hiện những hậu quả rút ra hay những thao tác cần phải hoàn thiện khi một tình huống đã được thiết lập hoặc sẽ được thiết lập trong lĩnh vực đang xét. Các tri thức thực hành thường được thể hiện bởi các biểu thức dễ hiểu và dễ triển khai thao tác đối với người sử dụng.

Từ việc phân biệt hai loại tri thức, người ta nói máy suy diễn là công cụ triển khai các cơ chế(hay kỹ thuật) tổng quát để tổ hợp các tri thức phán đoán và các tri thức thực hành. Hình trên đây mô tả quan hệ hữu cơ giữa máy suy diễn và cơ sở tri thức.
Có nhiều mô hình kiến trúc hệ chuyên gia theo các tác giả khác nhau. Sau đây là một số mô hình.
Mô hình J. L. Ermine

Mô hình C. Ernest
Kiến trúc hệ chuyên gia theo C. Ernest
Mô hình E. V. Popov

Tri thức của một hệ chuyên gia có thể được biểu diễn theo nhiều cách khác nhau. Thông thường người ta sử dụng các cách sau đây :
- Biểu diễn tri thức bởi các luật sản xuất
- Biểu diễn tri thức nhờ mệnh đề logic
- Biểu diễn tri thức nhờ mạng ngữ nghĩa
- Biểu diễn tri thức nhờ ngôn ngữ nhân tạo
Ngoài ra, người ta còn sử dụng cách biểu diễn tri thức nhờ các sự kiện không chắc chắn, nhờ bộ ba : đối tượng, thuộc tính và giá trị (O-A-V: Object-Attribute-Value), nhờ khung (frame), v.v... Tuỳ theo từng hệ chuyên gia, người ta có thể sử dụng một cách hoặc đồng thời cả nhiều cách.
Biểu diễn tri thức bởi các luật sản xuất
Hiện nay, hầu hết các hệ chuyên gia đều là các hệ thống dựa trên luật, bới lý do như sau :
- Bản chất đơn thể (modular nature). Có thể đóng gói tri thức và mở rộng hệ chuyên gia một cách dễ dàng.
- Khả năng diễn giải dễ dàng (explanation facilities). Dễ dàng dùng luật để diễn giải vấn đề nhờ các tiền đề đặc tả chính xác các yếu tố vận dụng luật, từ đó rút ra được kết quả.
- Tương tự quá trình nhận thức của con người. Dựa trên các công trình của Newell và Simon, các luật được xây dựng từ cách con người giải quyết vấn đề. Cách biểu diễn luật nhờ IF THEN đơn giản cho phép giải thích dễ dàng cấu trúc tri thức cần trích lọc.
Luật là một kiểu sản xuất được nghiên cứu từ những năm 1940. Trong một hệ thống dựa trên luật, công cụ suy luận sẽ xác định những luật nào là tiên đề thỏa mãn các sự việc.
Các luật sản xuất thường được viết dưới dạng IF THEN. Có hai dạng :
IF < điều kiện > THEN < hành động >
Hoặc
IF < điều kiện > THEN < kết luận > DO < hành động >
Tuỳ theo hệ chuyên gia cụ thể mà mỗi luật có thể được đặt tên. Chẳng hạn mỗi luật có dạng Rule: tên. Sau phần tên là phần IF của luật.
Phần giữa IF và THEN là phần trái luật (LHS: Left - Hand -Side), có nội dung được gọi theo nhiều tên khác nhau, như tiền đề (antecedent), điều kiện (conditional part), mẫu so khớp (pattern part),
Phần sau THEN là kết luận hay hậu quả (consequent). Một số hệ chuyên gia có thêm phần hành động (action) được gọi là phần phải luật (RHS: Right - Hand -Side).
Rule: đèn đỏ
IF
Đèn đỏ sáng
THEN
Dừng
Rule: Đèn xanh
IF
Đèn xanh sáng
THEN
Đi
Trong ví dụ trên, Đèn đỏ sáng và Đèn xanh sáng là những điều kiện, hay những khuôn mẫu. Sau đây là một số ví dụ khác :
Rule: Điều trị sốt
IF
Bệnh nhân sốt
THEN
Cho uống thuốc Aspirin
Hệ thống chuẩn đoán xe máy (OPS5)
IF
Máy xe không nổ khi khởi động
THEN
Dự đoán: Xe bị panne sức nén. Pittong, bạc xéc-măng và lòng xy lanh sai tiêu chuẩn,
dễ tạo thành những khe hở nhỏ làm cho pittong không còn kín nên hoà khí không được nén lên đầy đủ. Xử lý : nên điều chỉnh hoặc thay mới pittong, bạc xéc-măng và lòng xy lanh cho đúng tiêu chuẩn
IF
máy xe nổ không ổn định, OR máy xe nổ rồi lại tắt, AND bugi khô
THEN
Dự đoán : Xe đã bị nghẹt xăng.Xử lý : nên xúc rửa bình xăng và bộ khoá xăng của xe.
MYCIN hệ thống chẩn đoán bệnh viêm màng não và hiện tượng có vi khuẩn bất thường trong máu (nhiễm trùng)
IF
Tại vị trí vết thương có máu, AND
Chưa biết chắc chắn cơ quan bị tổn thương, AND
Chất nhuộm màu âm tính, AND
Vi khuẩn có dạng hình que, AND
Bệnh nhân bị sốt cao
THEN
Cơ quan có triệu chứng (0.4) nhiễm trùng
Bộ sinh của hệ chuyên gia
Bộ sinh của hệ chuyên gia (expert-system generator) là hợp của :
- một máy suy diễn,
- một ngôn ngữ thể hiện tri thức (bên ngoài)
- và một tập hợp các cấu trúc và các quy ước thể hiện các tri thức (bên trong).
Theo cách nào đó, các cấu trúc và các quy ước này xác định một cơ sở tri thức rỗng (hay rỗng bộ phận). Nhờ các tri thức chuyên môn để định nghĩa một hệ chuyên gia, người ta đã tạora bộ sinh để làm đầy cơ sở tri thức.
Chẳng hạn, EMYCIN là tên của bộ sinh của hệ chuyên gia MYCIN và được tiếp tục áp dụng cho một số lĩnh vực.
Hệ chuyên gia R1 được xây dựng từ bộ sinh OPS (là hệ thống luật được phát triển bởi Charles Forgy năm 1975 tại Carnegie-Mellon University). Sau đây là một số hậu duệ của EMYCIN và OPS :
Nhờ bộ sinh, mỗi hệ hệ chuyên gia có thể chứa từ hàng trăm đến hàng ngàn luật. Bảng dưới đây thống kê số luật của một số hệ chuyên gia :
Hệ chuyên gia | Lĩnh vực | Năm xuất hiện | Số luật |
MYCIN | Y học | 1974 | 500 |
PROSPECTOR | Địa chất | 1979 | 1 600 |
R1/XCON | Tin học | 1980 | > 7 000 |
LITHO | Địa chất | 1982 | 500 |
SPHINX | Y học | 1984 | 400 |
TOM | Nông học | 1984 | 200 |
Một trong những nét hấp dẫn của tiếp cận hệ chuyên gia là khả năng «học» (learn) của hệ thống nhằm thường xuyên sửa đổi và hoàn thiện cơ sở tri thức vốn có. Sơ đồ dưới đây cho biết sự tiến triển của hai hệ chuyên gia nổi tiếng của Mỹ là MYCIN và R1 :
«Soạn thảo kết hợp» các luật
Nói chung, tuỳ theo hệ chuyên gia mà những quy ước để tạo ra luật cũng khác nhau. Sự giống nhau cơ bản giữa các hệ chuyên gia về mặt ngôn ngữ là cách soạn thảo kết hợp (associative writing) các luật.
Ở đây, thuật ngữ soạn thảo kết hợp được chọn để gợi lên khái niệm về chế độ truy cập kết hợp (associative access) liên quan đến chế độ lưu trữ kết hợp (associative memory) là chế độ mà thông tin cần tìm kiếm được đọc không chỉ căn cứ vào địa chỉ đơn vị nhớ cụ thể mà còn căn cứ vào một phần nội dung của thông tin cần tìm kiếm chứa trong đó.
Soạn thảo kết hợp các luật gồm những quy ước như sau :
1. Mỗi luật do chuyên gia cung cấp phải định nghĩa được các điều kiện khởi động (tác nhân)hay tiền đề của luật, nghĩa là các tình huống (được xác định bởi các quan hệ trên tập hợp dữ liệu đã cho) và hậu quả của luật, để luật này có thể áp dụng.
Theo cách dùng thông thường, người ta đặt tên riêng cho luật để chọn áp dụng, hoặc cung cấp một nhóm các sự kiện (fact) tương thích với điều kiện khởi động của luật.
2. Trong luật, không bao giờ người ta chỉ định một luật khác bởi tên riêng.
Luật R sau đây tuân thủ hai đặc trưng :
IF bệnh nhân sốt AND tốc độ lắng huyết cầu trong máu tăng lên
THEN bệnh nhân nhiễm bệnh virut
Từ nội dung luật R, người ta có thể vận dụng như sau :
- Khi xảy ra tình huống bệnh nhân bị sốt và tốc độ lắng huyết cầu trong máu tăng lên, thì “bệnh nhân sốt” và “tốc độ lắng huyết cầu trong máu tăng lên” là những điều kiện để khởi động luật. Hậu quả của luật là “bệnh nhân nhiễm bệnh virut”. Như vậy, việc áp dụng luật sẽ dẫn đến một sự kiện mới được thiết lập từ đây trở đi : “bệnh nhân nhiễm bệnh virut”.
- Khi muốn tạo sự kiện “bệnh nhân bị nhiễm bệnh virut”, thì điều kiện khởi động luật là “bệnh nhân nhiễm bệnh virut”. Hậu quả của luật sẽ là “bệnh nhân sốt” và “tốc độ lắng huyết cầu trong máu tăng lên”. Từ đây, luật sẽ khởi động các sự kiện mới vừa được thiết lập “bệnh nhân sốt” và “tốc độ lắng huyết cầu trong máu tăng lên”.
Cách biểu diễn các điều kiện khởi động trong luật phù hợp với cách tư duy tự nhiên của các chuyên gia. Do vậy, người ta dễ dàng thể hiện cũng như sửa đổi các tri thức tiếp nhận.
Như vậy, người ta không nhất thiết phải đặt tên cho luật để có thể gọi đến khi cần, mà có thể khai thác thông tin từ các điều kiện khởi động của luật. Chẳng hạn từ luật R trên đây :
- Nếu tìm được các luật có khả năng thiết lập sự kiện “bệnh nhân nhiễm bệnh virut”, người ta sẽ để ý đến phần then của chúng như là các điều kiện khởi động. Luật R là một trong các luật có điều kiện khởi động tương ứng với lời gọi “bệnh nhân nhiễm bệnh virut”.
- Nếu tìm được các luật có khả năng đưa ra sự kiện “bệnh nhân sốt”, chỉ cần để ý đến phần if của chúng như là các điều kiện khởi động. Luật R là một trong các luật có điều kiện khởi động tương ứng với lời gọi “bệnh nhân sốt”.
Việc so sánh giữa điều kiện khởi động các luật và các sự kiện được xét tại một thời điểm
đã cho (tuỳ theo trường hợp, các sự kiện giả sử đã được thiết lập hay sẽ thiết lập) cho phép lọc (filter) các luật để giữ lại một số luật nào đó. Phần điều kiện khởi động của luật thường được gọi là bộ lọc, hay mẫu so khớp của luật đó.
Trong Tin học cổ điển, mỗi thủ tục (đóng vai trò là một đơn vị tri thức) thường được xác định và được gọi bởi tên của thủ tục. Lúc này, nếu muốn thêm vào hay lấy ra một thủ tục, người ta cần dự kiến các thay đổi trong toàn bộ thủ tục khác sử dụng đến thủ tục muốn thêm vào hay lấy ra này.
Ngược lại, về nguyên tắc, việc soạn thảo kết hợp cho phép tạo ra một luật mà không cần để ýđến sự hiện diện của các luật khác. Với mỗi luật, dù là của ai, một khi được đưa vào trong cơ sởtri thức, thì chỉ cần để ý đến các biểu thức điều kiện để xác định nếu luật đó là áp dụng được vàdo vậy, có thể gọi tới nó hay không. Người ta cũng xem rằng các sự kiện được đưa vào như là hậu quả của một luật có thể giúp để gọi đến các luật khác nhờ các bộ lọc của chúng.
Như vậy, phương pháp soạn thảo kết hợp cho phép bổ sung và loại bỏ dễ dàng các luật mà không cần xem xét hậu quả của việc bổ sung và loại bỏ đó. Phương pháp soạn thảo kết hợp có vịtrí quan trọng trong các hệ thống dựa trên luật của các hệ chuyên gia. Đó là các hệ thống suy diễnđịnh hướng bởi các bộ lọc (PDISPattern-Directed Inference Systems).
Các phương pháp biểu diễn tri thức khác
Biểu diễn tri thức nhờ mệnh đề logic
Người ta sử dụng các ký hiệu để thể hiện tri thức và các phép toán lôgic tác động lên các ký hiệu để thể hiện suy luận lôgic. Kỹ thuật chủ yếu thường được sử dụng là lôgic vị từ(predicate logic) mà ta sẽ đề cập đến ở chương sau.
Các ví dụ dưới đây minh hoạ cách thể hiện các phát biểu (cột bên trái) dưới dạng vị từ (cột bên phải) :
Phát biểu | Vị từ |
Tom là đàn ông | MAN(tom) |
Tom là chao của Mary | FATHER(tom,mary) |
Tất cả mọi người đều chết | MAN(X)→ MORTAL(X)với quy ước MAN(X) có nghĩa «X là một người» và MORTAL(X) có nghĩa «X chết». MAN và MORTAL được gọi là các vị từ đối với biến X. |
Các vị từ thường có chứa hằng, biến hay hàm. Người ta gọi các vị từ không chứa biến (có thể chứa hằng) là các mệnh đề (preposition). Mỗi vị từ có thể là một sự kiện (fact) hay một luật. Luật là vị từ gồm hai vế trái và phải được nối nhau bởi một dấu mũi tên (→). Các vị từ còn lại (không chứa mũi tên) được gọi là các sự kiện. Trong ví dụ trên đây, MAN và FATHER là các mệnh đề và là các sự kiện. Còn MAN(X) → MORTAL(X) là một luật.
Từ các tri thức sau :
Marc có tóc vàng hoe, còn Jean có tóc màu nâu. Pierre là cha của Jean. Marc là cha của Pierre. Jean là cha của René. Marc là con của Georges.
Giả sử X, Y và là Z những người nào đó, nếu Y là con của X thì X là cha của Y. Nếu X là cha của Z và Z là cha của Y thì X là ông của Y.
ta có thể biểu diễn thành các sự kiện và các luật như sau :
1. BLOND (marc)
2. BROWN (jean)
3. FATHER (pierre, jean)
4. FATHER (marc, pierre)
5. FATHER (jean, rené)
6. SON (marc, georges)
7. FATHER (X, Y) → SON (Y, X)
8. GRANDFATHER (X, Y) → FATHER (X, Z), FATHER (Z, Y)
Người ta gọi tập hợp các sự kiện và các luật là một cơ sở tri thức.
Biểu diễn tri thức nhờ mạng ngữ nghĩa
Trong phương pháp này, người ta sử dụng một đồ thị gồm các nút (node) và các cung (arc) nối các nút để biểu diễn tri thức. Nút dùng để thể hiện các đối tượng, thuộc tính của đối tượng và giá trị của thuộc tính. Còn cung dùng để thể hiện các quan hệ giữa các đối tượng. Các nút và các cung đều được gắn nhãn.
Để thể hiện tri thức “sẻ là một loài chim có cánh và biết bay”, người ta vẽ một đồ thị như sau :
Biểu diễn tri thức nhờ mạng ngữ nghĩa
Bằng cách thêm vào đồ thị các nút mới và các cung mới, người ta có thể mở rộng một mạng ngữ nghĩa. Các nút mới được thêm thể hiện các đối tượng tương tự (với các nút đã có trong đồ thị), hoặc tổng quát hơn.
Để thể hiện “chim là một loài động vật đẻ trứng” và “cánh cụt là loài chim biết lặn“, người ta vẽ thêm như sau :
Mở rộng mạng ngữ nghĩa biểu diễn tri thức
Một trong những tính chất quan trọng của mạng ngữ nghĩa là tính thừa kế. Khi sử dụng mạng ngữ nghĩa để biểu diễn tri thức, người ta phải xây dựng các phép toán tương ứng.
Biểu diễn tri thức nhờ ngôn ngữ nhân tạo
Nói chung, theo quan điểm của người sử dụng, ngôn ngữ tự nhiên sẽ là phương cách thuận tiện nhất để giao tiếp với một hệ chuyên gia, không những đối với người quản trị hệ thống (tư cách chuyên gia), mà còn đối với người sử dụng cuối. Hiện nay đã có những hệ chuyên gia có khả năng đối thoại trên ngôn ngữ tự nhiên (thông thường là tiếng Anh) nhưng chỉ hạn chế trong lĩnh vực ứng dụng chuyên môn của hệ chuyên gia
Hình dưới đây thể hiện một đơn vị tri thức (luật) trong hệ chuyên gia MYCIN dùng để chẩn đoán các bệnh virut. Cột bên trái là một luật được viết bằng tiếng Anh, cột bên phải là mã hoá nhân tạo của luật đó.

Có nhiều phương pháp tổng quát để suy luận trong các chiến lược giải quyết vấn đề của hệ chuyên gia. Những phương pháp hay gặp là suy diễn tiến (foward chaining), suy diễn lùi (backward chaining) và phối hợp hai phương pháp này (mixed chaining). Những phương pháp khác là phân tích phương tiện (means-end analysis), rút gọn vấn đề (problem reduction), quay lui (backtracking), kiểm tra lập kế hoạch (plan generate-test), lập kế hoạch phân cấp (hierachical planning)...
Dưới đây là nền tảng của công nghệ hệ chuyên gia hiện đại (foundation of modern rele- based expert system).

Suy diễn tiến ( forward charning) là lập luận từ các sự kiện, sự việc để rút ra các kết luận.
Nếu thấy trời mưa trước khi ra khỏi nhà (sự kiện) thì phải lấy áo mưa (kết luận).
Trong phương pháp này, người sử dụng cung cấp các sự kiện cho hệ chuyên gia để hệ thống (máy suy diễn) tìm cách rút ra các kết luận có thể. Kết luận được xem là những thuộc tính có thể được gán giá trị. Trong số những kết luận này, có thể có những kết luận làm ngườisử dụng quan tâm, một số khác không nói lên điều gì, một số khác có thể vắng mặt.Các sự kiện thường có dạng : Atthibute = value
Lần lượt các sự kiện trong cơ sở tri thức được chọn và hệ thống xem xét tất cả các luật mà các sự kiện này xuất hiện như là tiền đề. Theo nguyên tắc lập luận trên, hệ thống sẽ lấy ra những luật thoã mãn. Sau khi gán giá trị cho các thuộc tính thuộc kết luận tương ứng, ngườita nói rằng các sự kiện đã được thoã mãn. Các thuộc tính được gán giá trị sẽ là một phần của kết quả chuyên gia. Sau khi mọi sự kiện đã được xem xét, kết quả được xuất ra cho người sử dụng.
Phương pháp suy diễn lùi
Phương pháp suy diễn lùi tiến hành các lập luận theo chiều ngược lại (đối với phương pháp suy diễn tiến). Từ một giả thuyết (như là một kết luận), hệ thống đưa ra một tình huống trả lời gồm các sự kiện là cơ sở của giả thuyết đã cho này.
Nếu ai đó vào nhà mà cầm áo mưa và áo quần bị ướt thì giả thuyết này là trời mưa.Để củng cố giả thuyết này, ta sẽ hỏi người đó xem có phải trời mưa không ? Nếu người đó trả lời có thì giả thuyết trời mưa đúng và trở thành một sự kiện. Nghĩa là trời mưa nên phải cầmáo mưa và áo quần bị ướt.
Suy diễn lùi là cho phép nhận được giá trị của một thuộc tính. Đó là câu trả lời cho câu hỏi « giá trị của thuộc tính A là bao nhiêu ? » với A là một đích (goal).
Để xác định giá trị của A, cần có các nguồn thông tin. Những nguồn này có thể là những câu hỏi hoặc có thể là những luật. Căn cứ vào các câu hỏi, hệ thống nhận được một cách trực tiếp từ người sử dụng những giá trị của thuộc tính liên quan. Căn cứ vào các luật, hệ thống suy diễn có thể tìm ra giá trị sẽ là kết luận của một trong số các kết luận có thể của thuộc tính liên quan, v.v...
Ý tưởng của thuật toán suy diễn lùi như sau. Với mỗi thuộc tính đã cho, người ta định nghĩa nguồn của nó :
- Nếu thuộc tính xuất hiện như là tiền đề của một luật (phần đầu của luật), thì nguồn sẽ thu gọn thành một câu hỏi.
- Nếu thuộc tính xuất hiện như là hậu quả của một luật (phần cuối của luật), thì nguồn sẽ là các luật mà trong đó, thuộc tính là kết luận.
- Nếu thuộc tính là trung gian, xuất hiện đồng thời như là tiền đề và như là kết luận, khiđó nguồn có thể là các luật, hoặc có thể là các câu hỏi mà chưa được nêu ra.
Nếu mỗi lần với câu hỏi đã cho, người sử dụng trả lời hợp lệ, giá trị trả lời này sẽ được gán cho thuộc tính và xem như thành công. Nếu nguồn là các luật, hệ thống sẽ lấy lần lượt các luật mà thuộc tính đích xuất hiện như kết luận, để có thể tìm giá trị các thuộc tính thuộc tiền đề. Nếu các luật thoã mãn, thuộc tính kết luận sẽ được ghi nhận.
Các hệ thống sản xuất (production systems)
Các hệ thống sản xuất Post
Hệ thống sản xuất được Post sử dụng trong logic ký hiệu (symbolic logic) từ những năm
1943. Theo ông, rất nhiều hệ thống toán học và logic được viết dưới dạng các luật sản xuất(production rule). Các luật còn được gọi là quy tắc viết lại (rewrite rules) thường được dùngđể định nghĩa văn phạm của một ngôn ngữ. Các ngôn ngữ lập trình thường được định nghĩatừ dạng Backus - Naur (BNF).
Ý tưởng cơ bản của Post là xuất phát từ một xâu vào (input string), được gọi là tiền đề (antecedent), sản xuất ra một xâu kết quả mới khác (consequent). Mỗi sản xuất có dạng :
< xâu tiền đề > → < xâu kết quả >
Dấu mũi tên → chỉ ra rằng xâu vào bên trái được chuyển (transformation) thành xâu kết quả bên phải.
Để đi qua các ngã ba, ngã tư trong thành phố :
Đèn đỏ sáng → Dừng
Đèn xanh sáng → Đi
Để chữa trị bệnh sốt :
Bệnh nhân sốt → Cho uống thuốc Aspirin
Bệnh nhân sốt AND Sốt trên 39 0C → Đi khám bác sĩ
Một hệ thống sản xuất Post gồm một nhóm các luật sản xuất, chẳng hạn (chú ý các số thứ tự đặt trong dấu ngoặc chỉ dùng để trình bày) :
(1). Car won’t start → Check battery
(2). Car won’t start → Check gas
(3). Check battery AND Battery bad → Replace battery
(4). Check gas AND No gas → Fill gas tank
Nếu đưa vào xâu Car won’t start, thì các luật (1) và (2) có thể được áp dụng để sinh ra các xâu Check battery và Check gas. Tuy nhiên, không tồn tại cơ chế để có thể áp dụng đồng thời cả hai cho xâu vào này. Chỉ có thể áp dụng được một luật trong hai, hoặc không. Nếu đưa vào xâu Battery bad và Check battery thì luật 3 có thể được áp dụng để sinh ra xâu Replace battery.
Không đặt ra thứ tự các luật trong hệ thống. Sau khi đảo thứ tự, chẳng hạn (4) (2) (1) (3) thì hệ thống giữ nguyên giá trị :
(4) | Check gas AND No gas | → Fill gas tank |
(2) | Car won’t start | → Check gas |
(1) | Car won’t start | → Check battery |
(3) | Check battery AND Battery bad | → Replace battery |
Mặc dù các sản xuất Post được sử dụng trong hệ chuyên gia nhưng chúng không thuận
tiện cho việc viết các trình ứng dụng. Hạn chế chủ yếu của các sản xuất Post khi lập trình là không có các chiến lược điều khiển (control strategy) để định hướng sử dụng luật... Một hệ thống Post cho phép áp dụng luật cho một xâu vào theo cách tuỳ ý mà không chỉ ra cụ thể
làm thế nào để luật được áp dụng. Chính sự lựa chọn luật một cách ngẫu nhiên như vậy làm thời gian tìm kiếm trở nên đáng kể trong các hệ thống có nhiều luật.
Các thuật toán Markov
Để cải tiến việc áp dụng các luật sản xuất, năm 1954, Markov đã đề xuất một cấu trúc điều khiển cho hệ thống sản xuất. Một thuật toán Markov (Markov algorithm) là một nhóm các sản xuất có thứ tự được áp dụng theo một thứ tự ưu tiên cho một xâu vào. Nếu luật có ưu tiên cao nhất không được áp dụng, thì qui tắc tiếp theo sẽ được áp dụng và cứ thế tiếp tục. Thuật toán Markov dừng nếu :
(1) sản xuất cuối cùng không được áp dụng cho xâu, hoặc
(2) nếu sản xuất đó là cuối một giai đoạn được áp dụng.
Thuật toán Markov cũng có thể được áp dụng cho một xâu con (substring) của một xâu, bắt đầu từ bên trái :
Cho luật AB → HIJ
Khi đó, áp dụng cho xâu vào GABKAB sẽ tạo ra xâu mới GHIJKAB. Từ đó, ta nhậnđược tiếp tục xâu mới GHIJKHIJ.
Ký tự đặc biệt ε biều diễn xâu rỗng (null string), là xâu không có ký tự nào.
Luật A → ε
Là xóa tất cả các xuất hiện của A trong một xâu.
Các ký hiệu đặc biệt khác có vai trò như biến biểu diễn một ký tự bất kỳ được viết bởi các chữ cái thường a, b, c...
Luật A x B → B x A
Cho phép nghịch đảo các ký tự A và B.
Các chữ cái Hy lạp α,β size 12{α,β} {}, dùng để chỉ các dấu đặc biệt của xâu. Ở đây, các chữ cái Hy lạp dùng để phân biệt với bảng chữ cái đang sử dụng.
Một ví dụ về thuật toán Markov là di chuyển chữ cái đầu tiên đến vị trí cuối cùng của một xâu vào. Những luật được ưu tiên áp dụng cao nhất là (1), thấp hơn là (2), rồi (3), v.v... Các luật được cho lần lượt theo độ ưu tiên giảm dần như sau :
(1) | xy | → | y x |
(2) | → | ||
(3) | → |
Cho xâu vào ABC, quá trình di chuyển được cho trong bảng sau :
Luật | Thành công (S) hoặc thất bại (F) | Xâu kết quả |
1 | F | ABC |
2 | F | ABC |
3 | S | ABC |
1 | S | B AC |
1 | S | BC A |
1 | F | BC A |
2 | S | BCA |
Thuật toán mạng lưới (rete algorithm)
Chú ý rằng thuật toán Markov sử dụng chiến lược điều khiển tất định (definite control strategy) để áp dụng các luật có độ ưu tiên cao hơn trước tiên. Chừng nào mà luật có độ ưu tiên cao nhất không được áp dụng, thì thuật toán Markov sẽ tìm một luật khác có độ ưu tiên thấp hơn để áp dụng. Mặc dù thuật toán Markov có thể được sử dụng chủ yếu trong một hệ chuyên gia, nó vẫn không có hiệu quả trong những hệ thống có nhiều luật.
Vấn đề về hiệu suất (efficient) trở nên quan trọng khi người ta cần tạo ra các hệ chuyên gia giải quyết các bài toán thực tiễn chứa từ hàng trăm đến hàng ngàn luật. Một hệ chuyên gia là không hiệu quả nếu người sử dụng phải chờ đợi rất nhiều thời gian để nhận được một câu trả lời từ hệ thống. Vấn đề là cần có một thuật toán biết được tất cả các luật và có thể chọn ra các luật cần thiết để áp dụng thay vì thử lần lượt các luật.
Một giải pháp cho vấn đề này là thuật toán mạng lưới do Charles L. Forgy đề xuất tại trường Đại học Carnegie, Mellon, Hoa Kỳ vào năm 1979 trong luận văn tiến sĩ của ông về OPS (Official Production System).
Thuật toán mạng lưới cho phép so khớp (pattern mattching) rất nhanh để nhận được câu trả lời tức thời bằng cách lưu giữ thông tin của các luật trong một mạng lưới (network). Thayvì so khớp lặp đi lặp lại các sự kiện mỗi lần áp dụng một luật trong mỗi chu trình nhận thức (recognize-act cycle), thuật toán mạng lưới chỉ nhìn những thay đối khi so khớp trong mỗi chu trình.