Tóm tắt lý thuyết 1. Bài toán tổng quát dẫn đến phân phối siêu bội Từ một tập hợp gồm N phần tử (trong đó có M phần tử có tính chất A nào đó), lấy ngẫu nhiên không hoàn lại ra n phần tử . Gọi X là số phần tử có tính chất A có trong n phần tử lấy ra, thì X là đại lượng ngẫu nhiên rời rạc có thể nhận các giá trị trong khoảng [n1, n2], với các xác suất tương ứng: \({P_x} = P(X = x) = \frac{{C_M^xC_{N - M}^{n - x}}}{{C_N^n}}\) x phải thoả mãn điều kiện: \(x \in \left[ {{n_1},{n_2}} \right]\) \({n_1} = M{\rm{ax}}\left\{ {0;M + n - N} \right\};\,\,{n_2} = Min\{ n;M{\rm{\} }}\) 2. Định nghĩa Đại lượng ngẫu nhiên rời rạc X có thể nhận các giá trị nguyên, không âm với các xác suất tương ứng được tính theo công thức (3.12) thì X có phân phối siêu bội với các tham số: N, M, n. Đai lượng ngẫu nhiên X có phân phối siêu bội với các tham số N, M, n được ký hiệu là: X ~ H (N, M, n). Thí dụ: Một hộp có 10 sản phẩm (trong đó có 7 sản phẩm loại A). Lấy ngẫu nhiên (không hoàn lại) từ hộp ra 5 sản phẩm. Gọi X là số sản phẩm loại A có trmg 5 sản phẩm lấy ra, thì X ~ H(10, 7, 5). n1 = Max{0 ; 7 + 5 -10} = 2; n2= Min{5;7}=5 Các giá trị X có thể nhận là 2, 3, 4, 5, với các xác suất tương ứng được tính như sau: \(\begin{array}{l} P(X = 2) = \frac{{C_7^2C_3^3}}{{C_{10}^5}} = \frac{{21}}{{252}} = \frac{1}{{12}}\\ P(X = 3) = \frac{{C_7^3C_3^2}}{{C_{10}^5}} = \frac{{105}}{{252}} = \frac{5}{{12}}\\ P(X = 4) = \frac{{C_7^4C_3^1}}{{C_{10}^5}} = \frac{{105}}{{252}} = \frac{5}{{12}}\\ P(X = 5) = \frac{{C_7^5}}{{C_{10}^5}} = \frac{{21}}{{252}} = \frac{1}{{12}} \end{array}\) Nếu X ~ H (N, M, n), để tính P(X = x) ta có thể dùng hàm HYPGEOMDIST trong Excel P(X = x) =HYPGEOMDIST(x,n,M,N) Thí dụ: Cho X ~ H (20, 14, 8), tính P(X = 5) Ta có: P(X = 5) =HYPGEOMDIST(5,8,14,20) = 0,317853 3. Các tham số đặc trưng Ta có thể chứng minh được rằng: Nếu X ~ H (N, M, n), thì: (với \(p=\frac{M}{N}\)) \(V{\rm{ar}}(X) = npq\frac{{N - n}}{{N - 1}}\) Trong thực tế, phân phối siêu bội được dùng để tính xác suất có X phần tử mang dấu hiệu A nào đó khi lấy ngẫu nhiên n phần tử theo phương thức không hoàn lại từ một tập hợp gồm N phần tử. Chẳng hạn, để kiểm ha chất lượng của một lô sản phẩm, người ta thường lấy ra từ lô đó ra n sản phẩm theo phương thức không hoàn lại và tính xác suất để có X phế phẩm (hoặc chính phẩm). Ta có thể chứng minh rằng: Khi n là rất bé so với N thì ta có công thức xấp xỉ sau đây: \(\frac{{C_M^xC_{N - M}^{n - x}}}{{C_N^n}} \approx C_n^x{p^x}{q^{n - x}}\) Chứng minh: Xét vế trái của (3.15) ta có: \(C_M^x = \frac{{M!}}{{x!(M - x)!}} = \frac{{M(M - 1)(M - 2)....(M - x + 1)}}{{x!}}\) \(C_{N - M}^{n - x} = \frac{{(N - M)!}}{{(n - x)!(N - M - n + x)!}}\) \( = \frac{{(N - M)(N - M - 1)....(N - M - n + x + 1)}}{{(n - x)!}}\) \(C_N^n = \frac{{N!}}{{n!(N - n)!}} = \frac{{N(N - 1)....(N - n + 1)}}{{n!}}\) Thay các biểu thức trên vào vế ứái của (3.15) và sắp xếp lại ta được: \(VT = C_n^xB\) Trong đó: VT là ký hiệu vế trái của (3.15); B là biểu thức dưới đây: \(\frac{{M(M - 1)...(M - x + 1)(N - M)(N - M - 1)...(N - M - n + x + 1)}}{{N(N - 1)(N - 2)...(N - n + 1)}}\) Để ý rằng, tử số và mẫu số của biểu thức trên đều có n thừa số. Chia cả tử số và mẫu số của biểu thức đó cho Nn ta được: \(B = \frac{{QR}}{S}\) Trong đó: \(Q = \frac{M}{N}\left( {\frac{M}{N} - \frac{1}{N}} \right)....\left( {\frac{M}{N} - \frac{{x - 1}}{N}} \right)\) \(R = \left( {1 - \frac{M}{N}} \right)\left( {1 - \frac{M}{N} - \frac{1}{N}} \right)...\left( {1 - \frac{M}{N} - \frac{{n - x - 1}}{N}} \right)\) \(S = 1.\left( {1 - \frac{1}{N}} \right)\left( {1 - \frac{2}{N}} \right)....\left( {1 - \frac{{n - 1}}{N}} \right)\) Đặt: \(\frac{M}{N} = p;\,\,\, \Rightarrow \left( {1 - \frac{M}{N}} \right) = 1 - p = q\) Khi N lớn, n rất nhỏ so với N thì: \(Q \approx {p^x};\,\,R \approx {q^{n - X}};\,\,s \approx 1\) Từ đó ta suy ra điều cần phải chứng minh Trong thực tế, công thức (3.15) thường được áp dụng như sau: Nếu lấy n phần tử từ một tập hợp gồm N phần tử theo phương thức không hoàn lại và n là rất nhỏ so với N. Gọi X là số phần tử có tính chất A nào đó có trong n phần tử lấy ra thì ta có thể xem X ~ B(n, p). Với p là tỉ lệ phần tử có tính chất A của tập hợp. Thí dụ: Một lô hàng gồm 1000 sản phẩm, trong đó có 800 sản phẩm loại A và 200 sản phẩm loại B. Lây ngẫu nhiên (không hoàn lại) từ lô hàng đó 10 sản phẩm để kiểm ưa. Tìm xác suất để có ít nhất 8 sản phẩm loại A ưong 10 sản phẩm lấy ra kiểm tra. Giải: Gọi X là số sản phẩm loại A có trong 10 sản phẩm lấy ra kiểm ưa. Vì lấy không hoàn lại nên X ~ H(1000, 800, 10). Nhưng vì lấy ít (10) từ một tập hợp có số phần tử lớn (1000) nên ta có thể coi X ~ B(n, p), với n = 10 và \(p = \frac{{800}}{{1000}} = 0,8\) Xác suất cần tìm là P(X \(\le\) 8). Ta có: \(\begin{array}{l} P(X = 8) = C_{10}^8{(0,8)^8}{(0,2)^2} = 0,30199\\ P(X = 9) = C_{10}^9{(0,8)^9}{(0,2)^2} = 0,268435\\ P(X = 10) = {(0,8)^{10}} = 0,107374 \end{array}\) Vậy: P(X \(\ge \) 8) = P(X = 8) + P(X = 9) + P(X = 10) = 0,6778 Chú ý: Ngoài cách tính trên, ta có thể dùng hàm HYPGEOMDIST để tính như sau: P(X = 8) =HYPGEOMDIST(8,10,800,1000) = 0,30351 P(X = 9) =HYPGEOMDIST(9,10,800,1000) = 0,268431 P(X = 10) =HYPGEOMDIST(10,10,800,1000) = 0,106164 P(X \(\ge\) 8) = 0,30351 + 0,268431 + 0,106164 = 0,678105 Ta thấy kết quà của hai cách tính xâ'p xỉ nhau.