Xây dựng mô hình hồi quy tuyến tính bội
Giới thiệu Mô hình hồi quy hai biến mà chúng ta đã nghiên cứu ở chương 3 thường không đủ khả năng giải thích hành vi của biến phụ thuộc. Ở chương 3 chúng ta nói tiêu dùng phụ thuộc vào thu nhập khả dụng, tuy nhiên có nhiều yếu tố khác ...
Giới thiệu
Mô hình hồi quy hai biến mà chúng ta đã nghiên cứu ở chương 3 thường không đủ khả năng giải thích hành vi của biến phụ thuộc. Ở chương 3 chúng ta nói tiêu dùng phụ thuộc vào thu nhập khả dụng, tuy nhiên có nhiều yếu tố khác cũng tác động lên tiêu dùng, ví dụ độ tuổi, mức độ lạc quan vào nền kinh tế, nghề nghiệp… Vì thế chúng ta cần bổ sung thêm biến giải thích(biến độc lập) vào mô hình hồi quy. Mô hình với một biến phụ thuộc với hai hoặc nhiều biến độc lập được gọi là hồi quy bội.
Chúng ta chỉ xem xét hồi quy tuyến tính bội với mô hình tuyến tính với trong tham số, không nhất thiết tuyến tính trong biến số.
Mô hình hồi quy bội cho tổng thể
(4.1)
Với X2,i, X3,i,…,Xk,i là giá trị các biến độc lập ứng với quan sát i
β1 size 12{β rSub { size 8{1} } } {}﹐ β2 size 12{β rSub { size 8{2} } } {}﹐ β3 size 12{β rSub { size 8{3} } } {}﹐…﹐ βk size 12{β rSub { size 8{k} } } {}là các tham số của hồi quy
βi size 12{β rSub { size 8{i} } } {}là sai số của hồi quy
Với một quan sát i, chúng ta xác định giá trị kỳ vọng của Yi
(4.2)
Ý nghĩa của tham số
Các hệ số β size 12{β} {} được gọi là các hệ số hồi quy riêng
(4.3)
β size 12{β} {}k đo lường tác động riêng phần của biến Xm lên Y với điều kiện các biến số khác trong mô hình không đổi. Cụ thể hơn nếu các biến khác trong mô hình không đổi, giá trị kỳ vọng của Y sẽ tăng β size 12{β} {}m đơn vị nếu Xm tăng 1 đơn vị.
Giả định của mô hình
Sử dụng các giả định của mô hình hồi quy hai biến, chúng ta bổ sung thêm giả định sau:
Các biến độc lập của mô hình không có sự phụ thuộc tuyến tính hoàn hảo, nghĩa là không thể tìm được bộ số thực ( β size 12{β} {}﹐ β size 12{β} {}2﹐...﹐ β size 12{β} {}k) sao cho
với mọi i.
Giả định này còn được được phát biểu là “ không có sự đa cộng tuyến hoàn hảo trong mô hình”.
Số quan sát n phải lớn hơn số tham số cần ước lượng k.
Biến độc lập Xi phải có sự biến thiên từ quan sát này qua quan sát khác hay Var(Xi)>0.
Ước lượng tham số của mô hình hồi quy bội
Hàm hồi quy mẫu và ước lượng tham số theo phương pháp bình phương tối thiểu
Trong thực tế chúng ta thường chỉ có dữ liệu từ mẫu. Từ số liệu mẫu chúng ta ước lượng hồi quy tổng thể.
Hàm hồi quy mẫu
Với các βˆm size 12{ { hat {β}} rSub { size 8{m} } } {} là ước lượng của tham số β size 12{β} {}m. Chúng ta trông đợi βˆm size 12{ { hat {β}} rSub { size 8{m} } } {} là ước lượng không chệch của β size 12{β} {}m, hơn nữa phải là một ước lượng hiệu quả. Với một số giả định chặt chẽ như ở mục 3.3.1 chương 3 và phần bổ sung ở 4.1, thì phương pháp tối thiểu tổng bình phương phần dư cho kết quả ước lượng hiệu quả β size 12{β} {}m.
Phương pháp bình phương tối thiểu
Chọn β size 12{β} {}1﹐ β size 12{β} {}2﹐ …﹐ β size 12{β} {}k sao cho
(4.5)
đạt cực tiểu.
Điều kiện cực trị của (4.5)
Hệ phương trình (4.6) được gọi là hệ phương trình chuẩn của hồi quy mẫu (4.4).
Cách giải hệ phương trình (4.4) gọn gàng nhất là dùng ma trận. Do giới hạn của chương trình, bài giảng này không trình bày thuật toán ma trận mà chỉ trình bày kết quả tính toán cho hồi quy bội đơn giản nhất là hồi quy ba biến với hai biến độc lập. Một số tính chất của hồi quy ta thấy được ở hồi quy hai biến độc lập có thể áp dụng cho hồi quy bội tổng quát.
Ước lượng tham số cho mô hình hồi quy ba biến
Hàm hồi quy tổng thể
(4.7)
Hàm hồi quy mẫu
(4.8)
Nhắc lại các giả định
Kỳ vọng của sai số hồi quy bằng 0:
Không tự tương quan:, i≠j
Phương sai đồng nhất:
Không có tương quan giữa sai số và từng Xm:
Không có sự đa cộng tuyến hoàn hảo giữa X2 và X3.
Dạng hàm của mô hình được xác định một cách đúng đắn.
Với các giả định này, dùng phương pháp bình phương tối thiểu ta nhận được ước lượng các hệ số như sau.
Phân phối của ước lượng tham số
Trong phần này chúng ta chỉ quan tâm đến phân phối của các hệ số ước lựơng và. Hơn nữa vì sự tương tự trong công thức xác định các hệ số ước lượng nên chúng ta chỉ khảo sát. Ở đây chỉ trình bày kết quả
là một ước lượng không chệch : (4.13)
(4.14)
Nhắc lại hệ số tương quan giữa X2 và X3 :
Đặt rX2X3 size 12{r rSub { size 8{X rSub { size 6{2} } X rSub { size 6{3} } } } } {}= r23 biến đổi đại số (4.14) ta được
(4.15)
Từ các biểu thức (4.13) và (4.15) chúng ta có thể rút ra một số kết luận như sau:
Nếu X2 và X3 có tương quan tuyến tính hoàn hảo thì =1. Hệ quả là vô cùng lớn hay ta không thể xác định được hệ số của mô hình hồi quy.
Nếu X2 và X3 không tương quan tuyến tính hoàn hảo nhưng có tương quan tuyến tính cao thì ước lượng vẫn không chệch nhưng không hiệu quả.
Những nhận định trên đúng cho cả hồi quy nhiều hơn ba biến.
R2 size 12{R rSup { size 8{2} } } {} và hiệu chỉnh
Nhắc lại khái niệm về :
Một mô hình có lớn thì tổng bình phương sai số dự báo nhỏ hay nói cách khác độ phù hợp của mô hình đối với dữ liệu càng lớn. Tuy nhiên một tính chất đặc trưng quan trọng của là nó có xu hướng tăng khi số biến giải thích trong mô hình tăng lên. Nếu chỉ đơn thuần chọn tiêu chí là chọn mô hình có cao, người ta có xu hướng đưa rất nhiều biến độc lập vào mô hình trong khi tác động riêng phần của các biến đưa vào đối với biến phụ thuộc không có ý nghĩa thống kê.
Để hiệu chỉnh phạt việc đưa thêm biến vào mô hình, người ra đưa ra trị thống kê hiệu chỉnh(Adjusted R2 size 12{R rSup { size 8{2} } } {} )
(4.16)
Với n là số quan sát và k là số hệ số cần ước lượng trong mô hình.
Qua thao tác hiệu chỉnh này thì chỉ những biến thực sự làm tăng khả năng giải thích của mô hình mới xứng đáng được đưa vào mô hình.
Kiểm định mức ý nghĩa chung của mô hình
Trong hồi quy bội, mô hình được cho là không có sức mạnh giải thích khi toàn bộ các hệ số hồi quy riêng phần đều bằng không.
Giả thiết
H0: β size 12{β} {}2 = β size 12{β} {}3 = … = β size 12{β} {}k = 0
H1: Không phải tất cả các hệ số đồng thời bằng không.
Trị thống kê kiểm định H0:
Quy tắc quyết định
Nếu Ftt > F(k-1,n-k,β size 12{β} {}) thì bác bỏ H0.
Nếu Ftt ≤ F(k-1,n-k,β size 12{β} {}) thì không thể bác bỏ H0.
Quan hệ giữa R2 và F
Ước lượng khoảng và kiểm định giả thiết thống kê cho hệ số hồi quy
Ước lượng phương sai của sai số
(4.17)
Người ta chứng minh được là ước lượng không chệch của σ size 12{σ} {}2, hay .
Nếu các sai số tuân theo phân phối chuẩn thì.
Ký hiệu. Ta có trị thống kê
Ước lượng khoảng cho β size 12{β} {}m với mức ý nghĩa β size 12{β} {} là
(4.18)
Thông thường chúng ta muốn kiểm định giả thiết H0 là biến Xm không có tác động riêng phần lên Y.
H0 : β size 12{β} {}m = 0
H1 : β size 12{β} {}m ≠ 0
Quy tắc quyết định
Nếu /t-stat/ > t(n-k,β size 12{β} {}/2) thì ta bác bỏ H0.
Nếu /t-stat/≤ t(n-k,β size 12{β} {}/2) thì ta không thể bác bỏ H0.