25/05/2018, 14:33

Mạng bayes

Mạng Bayes (tiếng Anh: Bayesian network hoặc Bayesian belief network hoặc belief network) là một mô hình xác suất dạng đồ thị. Một mạng Bayes được biểu diễn bởi một đồ thị, trong đó các nút đại diện cho các biến, còn các cung đại diện cho các phụ ...

Mạng Bayes (tiếng Anh: Bayesian network hoặc Bayesian belief network hoặc belief network) là một mô hình xác suất dạng đồ thị.

Một mạng Bayes được biểu diễn bởi một đồ thị, trong đó các nút đại diện cho các biến, còn các cung đại diện cho các phụ thuộc có điều kiện. Phân phối xác suất có điều kiện phụ thuộc (joint probability distribution) của các biến được xác định bởi cấu trúc đồ thị của mạng. Cấu trúc đồ thị của một mạng Bayes dẫn tới các mô hình dễ giải thích, và tới các thuật toán học và suy luận hiệu quả. Các nút có thể đại diễn cho đủ loại biến, một tham số đo được, một biến ẩn (latent variable) hay một giả thuyết, chứ không nhất thiết phải đại diện cho các biến ngẫu nhiên.

Một mạng Bayes là một đồ thị có hướng phi chu trình mà trong đó:

  • các nút biểu diễn các biến
  • các cung biểu diễn các quan hệ phụ thuộc thống kê giữa các biến và phân phối xác suất địa phương cho mỗi giá trị nếu cho trước giá trị của các cha của nó

Nếu có một cung từ nút A tới nút B, thì biến B phụ thuộc trực tiếp vào biến A, và A được gọi là cha của B. Nếu với mỗi biến Xi, i ∈{1,..,N} tập hợp các biến cha được ký hiệu bởi parents(Xi), thì phân phối có điều kiện phụ thuộc của các biến là tích của các phân phối địa phương

Nếu Xi không có cha, ta nói rằng phân phối xác suất địa phương của nó là không có điều kiện, nếu không, nó là có điều kiện. Nếu biến được biểu diễn bởi một nút được quan sát, thì ta nói rằng nút đó là một nút hiển nhiên (evidence node).

Các câu hỏi về sự phụ thuộc không tương đẳng giữa các biến có thể được trả lời bằng cách nghiên cứu đồ thị. Có thể chứng minh rằng trong đồ thị, tính độc lập có điều kiện được biểu diễn bởi tính chất đồ thị d-separation: cho trước một số nút hiển nhiên cụ thể, các nút X và Y là d-separated trong đồ thị khi và chỉ khi các biến X và Y là độc lập, biết trước các biến hiển nhiên tương ứng. Tập hợp gồm tất cả các nút khác mà X có thể phụ thuộc trực tiếp được cho bởi Markov blanket của X.

Một ưu điểm của mạng Bayes là, về mặt trực quan, con người có thể hiểu các quan hệ phụ thuộc trực tiếp và các phân phối địa phương dễ dàng hơn là phân phối có điều kiện phụ thuộc hoàn chỉnh.

Một mạng Bayes đơn giản.

Nếu có hai lý do cho việc cỏ bị ướt (GRASSWET): hoặc do được tưới nước (SPRINKLER), hoặc do trời mưa (RAIN), thì tình huống này có thể được mô hình hóa bởi một mạng Bayes. Ở đây, các biến có hai trạng thái có thể: T (đúng) và F (sai).

Hàm xác suất phụ thuộc có điều kiện là

Pr(GRASSWET,SPRINKLER,RAIN) = Pr(GRASSWET | SPRINKLER,RAIN).Pr(SPRINKLER | RAIN).Pr(RAIN)

Mô hình có thể trả lời các câu hỏi như "Nếu cỏ ướt thì khả năng trời mưa là bao nhiêu?" bằng cách sử dụng các công thức xác suất có điều kiện và lấy tổng tất cả các biến trở ngại (nuisance variable):

Thay thế các giá trị số, ta được Pr(RAIN=T | GRASSWET=T) = 891/2491 ≈ 35.77%.

Cách

0