Xác suất & Thống kê - Chương 7 - Bài 1: Các phương pháp tìm ước lượng điểm

  1. Tác giả: LTTK CTV
    Đánh giá: ✪ ✪ ✪ ✪ ✪

    Tóm tắt lý thuyết

    1. Phương pháp hàm ước lượng


    Mô tả phương pháp:
    Giả sử cần ước lượng tham số \(\theta \) của đại lượng ngẫu nhiên X. Từ X ta lập mẫu ngẫu nhiên kích thước n:
    \(W_X=(X_1,X_2,...,X_n)\)
    Chọn
    \(\widehat \theta = f({X_1},{X_2},...,{X_n})\)
    \(\widehat \theta \) là hàm của các đại lượng ngẫu nhiên X1, X2, . . . , Xn nên nó là một đại lượng ngẫu nhiên, \(\widehat \theta \) được gọi là hàm ước lượng của \(\theta\). Trong thực tế người ta thường chọn hàm ước lượng như sau:
    • Chọn \(\widehat \theta = \overline X = \frac{1}{n}\sum\limits_{i = 1}^n {{X_i}} \) nếu là ước lượng trung bình của tổng thể
    • Chọn \(\widehat \theta = {S^2} = \frac{1}{{n - 1}}{\sum\limits_{i = 1}^n {\left( {{X_i} - \overline X } \right)} ^2}\) nếu là ước lương phương sai của tổng thể
    • Chọn \(\widehat \theta = F = \frac{1}{n}\sum\limits_{i = 1}^n {{X_i}} \), nếu là ước lượng tỷ lệ tổng thể
    Từ mẫu cụ thể WX = (X1, X2, . . . , Xn), ta tính giá trị của \(\widehat \theta \) (ký hiệu là \(\widehat \theta \)).
    Tức là: \({\hat \theta ^*} = f({x_1},{x_2},....,{x_n})\)
    Ước lượng điểm của \(\theta \) chính là giá trị \(\widehat \theta ^*\) vừa tính được.
    Các tiêu chuẩn lựa chọn hàm ước lượng
    Ta thấy có vô số cách chọn dạng hàm f, tức có vô số đại lượng ngẫu nhiên \(\widehat \theta \) có thể dùng làm hàm ước lượng của \(\theta \). Vì vậy, cần đưa ra một tiêu chuẩn để đánh giá chất lượng của ước lượng. Từ đó lựa chọn được một hàm ước lượng “tốt hơn” theo một nghĩa nào đó.
    Dưới đây ta sẽ xét một số tiêu chuẩn đó.
    Ước lượng không chệch
    Định nghĩa: \(\widehat \theta \) được gọi là ước lượng không chệch của tham số \(\theta \) nếu: \(E(\widehat \theta )= \theta \)
    Ngược lại, nếu \(E(\hat \theta ) \ne \theta \) thì \(\widehat \theta \) được gọi là ước lượng chệch của \(\theta \).
    Ý nghĩa: Ta thấy \((\widehat \theta - \theta)\) là đại lượng ngẫu nhiên biểu thị sai số của ước lượng. Theo tính chất của kỳ vọng toán, ta có:
    \(E(\widehat \theta - \theta)=E(\widehat \theta )-E( \theta )= \theta - \theta =0\) nếu \( \theta \) là ước lượng không chệch.
    Như vậy, ước lượng không chệch là ước lượng có sai số trung bình băng 0. Tức là giá trị của \(\theta \) không bị lệch về một phía, nếu dùng \(\widehat \theta \) để ước lượng \( \theta \) thì không mắc phải sai số hệ thống. Rõ ràng trong hai loại ước lượng: chệch và không chệch thì ta nên chọn ước lượng không chệch.
    Chú ý rằng, \(\widehat \theta \) là ước lượng không chệch của \(\theta \) không có nghĩa là mọi giá trị của \(\widehat \theta \) ,đều trùng khít với \( \theta \) mà chỉ có nghĩa là: Trung bình các giá trị của \(\widehat \theta \) bằng \( \theta \), một giá trị của \(\widehat \theta \) có thể sai khác nhiều so với \( \theta \).
    * Thí dụ :
    • Trung bình mẫu ngẫu nhiên \((\overline X )\) là ước lượng không chệch của trung bình tổng thể \((\mu )\). Vì theo kết quả ở chương 6, ta có: \({\rm{E}}\left( {\overline X } \right) = \mu \).
    • Phương sai mẫu ngẫu nhiên (S2) là ước lượng không chệch của phương sai tổng thể \(({\sigma ^2})\) vì: \(E(S^2)={\sigma ^2}\) .
    • Tỷ lệ mẫu ngẫu nhiên (F) là ước lượng không chệch của tỷ lệ tổng thể (p) vì: E(F) = p.
    Chứng minh: Thật vậy, theo định nghĩa tỷ lệ mẫu ngẫu nhiên ta có:
    \(F = \frac{1}{n}\sum\limits_{i = 1}^n {{X_i}} \)
    Trong đó Xi là số phần tử có tính chất A có trong lần lấy phần tử thứ i vào mẫu. Xi (i = 1, 2, ...,n) là các đại lượng ngẫu nhiên có phân phối xác suất như sau:
    Xi01
    Pqp
    với q = 1 - p
    Ta có: \(E({X_i}) = 0\,x\,q\, + 1\,x\,p\, = \,p\,\left( {\forall i} \right)\)
    Vậy:
    \(E(F) = E\left( {\frac{1}{n}\sum\limits_{i = 1}^n {{X_i}} } \right) = \frac{1}{n}\sum\limits_{i = 1}^n {E\left( {{X_i}} \right)} = \frac{1}{n}.np = p\)
    Ước lượng hiệu quả
    Giả sử \(\widehat \theta \) là ước lượng không chệch của \( \theta \). Áp dụng bất đẳng thức Chebyshev cho đại lượng ngẫu nhiên \(\widehat \theta \), ta có:
    \(P\left( {\left| {\hat \theta - E(\hat \theta )} \right| - \varepsilon } \right) \ge 1 - \frac{{V{\rm{ar}}(\hat \theta )}}{{{\varepsilon ^2}}}\)
    Vì \(E({\hat \theta })= \theta \) nên bất đẳng thức Chebyshev trở thành:
    \(P\left( {\left| {\hat \theta - E( \theta )} \right| - \varepsilon } \right) \ge 1 - \frac{{V{\rm{ar}}(\hat \theta )}}{{{\varepsilon ^2}}}\)
    Như vậy, nếu phương sai \({V{\rm{ar}}(\hat \theta )}\) càng nhỏ thì xác suất để \(\widehat \theta \) nhận giá trị gần \( \theta \) bao nhiêu cũng được, sẽ càng lớn. Do đó phương sai của \(\widehat \theta \) là một chỉ tiêu quan trọng phản ánh chất lượng của hàm ước lượng \(\widehat \theta = f({X_1},{X_2},...,{X_n})\). Tất nhiên một cách hợp lý là cần chọn những hàm ước lượng không chệch và phương sai nhỏ nhất.
    * Định nghĩa: \(\widehat \theta = f({X_1},{X_2},...,{X_n})\) là ước lượng không chệch của \(\theta \) và phương sai \(var(\widehat \theta )\) bằng cận dưới các phương sai của các hàm ước lượng được xây dựng từ mẫu ngẫu nhiên Wx thì \(\widehat \theta \) được gọi là ước lượng hiệu quả của \(\theta \).
    Để tìm cận dưới của phương sai các hàm ước lượng ta dựa vào bất đẳng thức Crame-Rao được nêu trong định lý dưới đây
    Định lý: Cho mẫu ngẫu nhiên Wx = (X1, X2,. . ., Xn) được xây dựng từ đại lượng ngẫu nhiên X có hàm mật độ xác suất (hay biểu thức xác suất) \(f(x, \theta )\). Thỏa mãn một số điều kiện nhất định (thường được thỏa mãn trong thực tế) và \(\widehat \theta \) là ước lượng không chệch bất kỳ của \( \theta \) thì:
    \(V{\rm{ar}}(\widehat \theta ) \ge \frac{1}{{n.E{{\left[ {\frac{{\partial .\ln (x,\theta )}}{{\partial \theta }}} \right]}^2}}}\)
    Ước lượng vững
    Một hàm ước lượng được coi là hợp lý nếu như kích thước của mẫu tăng lên khá lớn thì giá trị của nó phải gần tham số cần ước lượng bao nhiêu cũng được. Nhận xét sơ bộ này được chính xác bởi định nghĩa sau:
    Định nghĩa: Cho mẫu Wx = (X1, X2, .... Xn) xây dựng từ đại lượng ngẫu nhiên X. Hàm ước lượng \(\widehat \theta = f({X_1},{X_2},...,{X_n})\) của \( \theta\) được gọi là vững nếu mọi \(\varepsilon > 0\) bé tùy ý cho trước ta đều có:
    \(\mathop {Lim}\limits_{n \to \infty } P\left[ {\left| {f({X_1},{X_2},...,X{}_n) - \theta } \right| < \varepsilon } \right] = 1\)
    Điều kiện đủ của ước lượng vững được phát biểu dưới dạng định lý sau:
    Định lý: Nếu \(\widehat \theta \) là ước lượng không chệch của \(\theta \) và \(\mathop {Lim}\limits_{n \to \infty } V{\rm{ar}}(\widehat \theta ) = 0\) thì \(\widehat \theta\) là ước lượng vững của \( \theta\).

    2. Phương pháp ước lượng hợp lý tối đa


    Giả sử đã biết qui luật phân phối xác suất dạng tổng quát của đại lượng ngẫu nhiên X, chẳng hạn hàm mật độ \(f(x,\theta)\) (cũng có thể xem \(f(x,\theta)\) là công thức tính xác suất nếu X là đại lượng ngẫu nhiên rời rạc), cần ước lượng tham số \(\theta\).
    Lập mẫu cụ thể: Wx = (X1, X2,..., Xn).
    Hàm của đối số \(\theta \): \(L({x_1},{x_2},...,{x_n},\theta ) = f({x_1},\theta ).f({x_2},\theta )....f({x_n},\theta )\)
    và gọi là hàm hợp lý của tham số \(\theta \).
    Giá trị của hàm hợp lý chính là xác suất (hay mật độ xác suất) tại điểm Wx = (X1, X2,..., Xn)
    Giá trị \({\theta ^*} = f({x_1},{x_2},...,{x_n})\) được gọi là ước lượng hợp lý tối đa nếu ứng với giá trị này hàm hợp lý đạt cực đại.
    Vì hàm L và hàm lnL đạt cực đại cùng một giá trị của \(\theta \). Do vậy có thể tìm giá trị của \(\theta\) để lnL đạt cực đại với các bước sau
    Bước 1: Tìm đạo hàm bậc nhất của lnL theo \(\theta\).
    Bước 2: Lập phương trình \(\frac{{\partial \ln L}}{{\partial \theta }} = 0\)
    Phương trình này được gọi là phương trình hợp lý. Giả sử nó có nghiệm là \({\theta _0} = \varphi ({x_1},{x_2},...,{x_n})\)
    Bước 3: Tìm đạo hàm bậc 2: \(\frac{{{\partial ^2}\ln L}}{{\partial {\theta ^2}}}\)
    Nếu tại điểm \({\theta _0} = \varphi ({x_1},{x_2},...,{x_n})\) đạo hàm bậc hai âm thì tại điểm này hàm lnL đạt cực đại. Do đó \({\theta _0} = \varphi ({x_1},{x_2},...,{x_n})\)
    là ước lượng hợp lý tối đa của \(\theta\)