Xác suất & Thống kê - Chương 3 - Bài 3: Phân phối siêu bội

  1. Tác giả: LTTK CTV
    Đánh giá: ✪ ✪ ✪ ✪ ✪

    Tóm tắt lý thuyết

    1. Bài toán tổng quát dẫn đến phân phối siêu bội


    Từ một tập hợp gồm N phần tử (trong đó có M phần tử có tính chất A nào đó), lấy ngẫu nhiên không hoàn lại ra n phần tử . Gọi X là số phần tử có tính chất A có trong n phần tử lấy ra, thì X là đại lượng ngẫu nhiên rời rạc có thể nhận các giá trị trong khoảng [n1, n2], với các xác suất tương ứng:
    \({P_x} = P(X = x) = \frac{{C_M^xC_{N - M}^{n - x}}}{{C_N^n}}\)
    x phải thoả mãn điều kiện: \(x \in \left[ {{n_1},{n_2}} \right]\)
    \({n_1} = M{\rm{ax}}\left\{ {0;M + n - N} \right\};\,\,{n_2} = Min\{ n;M{\rm{\} }}\)

    2. Định nghĩa


    Đại lượng ngẫu nhiên rời rạc X có thể nhận các giá trị nguyên, không âm với các xác suất tương ứng được tính theo công thức (3.12) thì X có phân phối siêu bội với các tham số: N, M, n.
    Đai lượng ngẫu nhiên X có phân phối siêu bội với các tham số N, M, n được ký hiệu là: X ~ H (N, M, n).
    Thí dụ: Một hộp có 10 sản phẩm (trong đó có 7 sản phẩm loại A). Lấy ngẫu nhiên (không hoàn lại) từ hộp ra 5 sản phẩm. Gọi X là số sản phẩm loại A có trmg 5 sản phẩm lấy ra, thì X ~ H(10, 7, 5).
    n1 = Max{0 ; 7 + 5 -10} = 2; n2= Min{5;7}=5
    Các giá trị X có thể nhận là 2, 3, 4, 5, với các xác suất tương ứng được tính như sau:
    \(\begin{array}{l} P(X = 2) = \frac{{C_7^2C_3^3}}{{C_{10}^5}} = \frac{{21}}{{252}} = \frac{1}{{12}}\\ P(X = 3) = \frac{{C_7^3C_3^2}}{{C_{10}^5}} = \frac{{105}}{{252}} = \frac{5}{{12}}\\ P(X = 4) = \frac{{C_7^4C_3^1}}{{C_{10}^5}} = \frac{{105}}{{252}} = \frac{5}{{12}}\\ P(X = 5) = \frac{{C_7^5}}{{C_{10}^5}} = \frac{{21}}{{252}} = \frac{1}{{12}} \end{array}\)
    Nếu X ~ H (N, M, n), để tính P(X = x) ta có thể dùng hàm HYPGEOMDIST trong Excel
    P(X = x) =HYPGEOMDIST(x,n,M,N)
    Thí dụ: Cho X ~ H (20, 14, 8), tính P(X = 5)
    Ta có: P(X = 5) =HYPGEOMDIST(5,8,14,20) = 0,317853

    3. Các tham số đặc trưng


    Ta có thể chứng minh được rằng: Nếu X ~ H (N, M, n), thì: (với \(p=\frac{M}{N}\))
    \(V{\rm{ar}}(X) = npq\frac{{N - n}}{{N - 1}}\)
    Trong thực tế, phân phối siêu bội được dùng để tính xác suất có X phần tử mang dấu hiệu A nào đó khi lấy ngẫu nhiên n phần tử theo phương thức không hoàn lại từ một tập hợp gồm N phần tử. Chẳng hạn, để kiểm ha chất lượng của một lô sản phẩm, người ta thường lấy ra từ lô đó ra n sản phẩm theo phương thức không hoàn lại và tính xác suất để có X phế phẩm (hoặc chính phẩm).
    Ta có thể chứng minh rằng: Khi n là rất bé so với N thì ta có công thức xấp xỉ sau đây:
    \(\frac{{C_M^xC_{N - M}^{n - x}}}{{C_N^n}} \approx C_n^x{p^x}{q^{n - x}}\)
    Chứng minh:
    Xét vế trái của (3.15) ta có:
    \(C_M^x = \frac{{M!}}{{x!(M - x)!}} = \frac{{M(M - 1)(M - 2)....(M - x + 1)}}{{x!}}\)
    \(C_{N - M}^{n - x} = \frac{{(N - M)!}}{{(n - x)!(N - M - n + x)!}}\)
    \( = \frac{{(N - M)(N - M - 1)....(N - M - n + x + 1)}}{{(n - x)!}}\)
    \(C_N^n = \frac{{N!}}{{n!(N - n)!}} = \frac{{N(N - 1)....(N - n + 1)}}{{n!}}\)
    Thay các biểu thức trên vào vế ứái của (3.15) và sắp xếp lại ta được:
    \(VT = C_n^xB\)
    Trong đó: VT là ký hiệu vế trái của (3.15); B là biểu thức dưới đây:
    \(\frac{{M(M - 1)...(M - x + 1)(N - M)(N - M - 1)...(N - M - n + x + 1)}}{{N(N - 1)(N - 2)...(N - n + 1)}}\)
    Để ý rằng, tử số và mẫu số của biểu thức trên đều có n thừa số. Chia cả tử số và mẫu số của biểu thức đó cho Nn ta được:
    \(B = \frac{{QR}}{S}\)
    Trong đó:
    \(Q = \frac{M}{N}\left( {\frac{M}{N} - \frac{1}{N}} \right)....\left( {\frac{M}{N} - \frac{{x - 1}}{N}} \right)\)
    \(R = \left( {1 - \frac{M}{N}} \right)\left( {1 - \frac{M}{N} - \frac{1}{N}} \right)...\left( {1 - \frac{M}{N} - \frac{{n - x - 1}}{N}} \right)\)
    \(S = 1.\left( {1 - \frac{1}{N}} \right)\left( {1 - \frac{2}{N}} \right)....\left( {1 - \frac{{n - 1}}{N}} \right)\)
    Đặt: \(\frac{M}{N} = p;\,\,\, \Rightarrow \left( {1 - \frac{M}{N}} \right) = 1 - p = q\)
    Khi N lớn, n rất nhỏ so với N thì: \(Q \approx {p^x};\,\,R \approx {q^{n - X}};\,\,s \approx 1\)
    Từ đó ta suy ra điều cần phải chứng minh
    Trong thực tế, công thức (3.15) thường được áp dụng như sau: Nếu lấy n phần tử từ một tập hợp gồm N phần tử theo phương thức không hoàn lại và n là rất nhỏ so với N. Gọi X là số phần tử có tính chất A nào đó có trong n phần tử lấy ra thì ta có thể xem X ~ B(n, p). Với p là tỉ lệ phần tử có tính chất A của tập hợp.
    Thí dụ: Một lô hàng gồm 1000 sản phẩm, trong đó có 800 sản phẩm loại A và 200 sản phẩm loại B. Lây ngẫu nhiên (không hoàn lại) từ lô hàng đó 10 sản phẩm để kiểm ưa. Tìm xác suất để có ít nhất 8 sản phẩm loại A ưong 10 sản phẩm lấy ra kiểm tra.
    Giải: Gọi X là số sản phẩm loại A có trong 10 sản phẩm lấy ra kiểm ưa. Vì lấy không hoàn lại nên X ~ H(1000, 800, 10). Nhưng vì lấy ít (10) từ một tập hợp có số phần tử lớn (1000) nên ta có thể coi X ~ B(n, p), với n = 10 và \(p = \frac{{800}}{{1000}} = 0,8\)
    Xác suất cần tìm là P(X \(\le\) 8).
    Ta có:
    \(\begin{array}{l} P(X = 8) = C_{10}^8{(0,8)^8}{(0,2)^2} = 0,30199\\ P(X = 9) = C_{10}^9{(0,8)^9}{(0,2)^2} = 0,268435\\ P(X = 10) = {(0,8)^{10}} = 0,107374 \end{array}\)
    Vậy: P(X \(\ge \) 8) = P(X = 8) + P(X = 9) + P(X = 10) = 0,6778
    Chú ý: Ngoài cách tính trên, ta có thể dùng hàm HYPGEOMDIST để tính như sau:
    P(X = 8) =HYPGEOMDIST(8,10,800,1000) = 0,30351
    P(X = 9) =HYPGEOMDIST(9,10,800,1000) = 0,268431
    P(X = 10) =HYPGEOMDIST(10,10,800,1000) = 0,106164
    P(X \(\ge\) 8) = 0,30351 + 0,268431 + 0,106164 = 0,678105
    Ta thấy kết quà của hai cách tính xâ'p xỉ nhau.