Tóm tắt lý thuyết Giả sử có mẫu cụ thể WX = (X1, X2,. . . ,Xn), thì trung bình mẫu \(\overline X \) và phương sai mẫu (s2) là hai giá trị cơ bản nhất đối với mẫu cụ thể này, s có thể suy ra từ s2; còn f thì tính rất đơn giản. Do đó phần này chúng ta chỉ nêu ra công thức tính \(\overline x \) và s2 tương ứng với từng trường hợp số liệu hiện có như sau: 1. Trường hợp số liệu của mẫu cho dưới dạng gồm đủ n giá trị quan sát Trường hợp này, để tính \(\overline x \) ta sử dụng công thức định nghĩa: \(\overline x = \frac{1}{n}\sum\limits_{i = 1}^n {{x_i}} \) Để tính s2 ta dùng công thức: \({s^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^n {x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\) Chứng minh: Theo công thức định nghĩa của S2 ta có: \({s^2} = \frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{\left( {{x_i} - \overline x } \right)}^2}} \) Ta có: \({\left( {{x_i} - \overline x } \right)^2} = {\left( {{x_i}} \right)^2} - 2{x_i}\overline x + {\left( {\overline x } \right)^2}\) Vậy: \(\sum\limits_{i = 1}^n {{{\left( {{x_i} - \overline x } \right)}^2}} = \sum\limits_{i = 1}^n {\left[ {{{\left( {{x_i}} \right)}^2} - 2\overline x .{x_i} + {{\left( {\overline x } \right)}^2}} \right]} \) \(= \sum\limits_{i = 1}^n {x_i^2 - 2\overline x .{x_i} + n.{{\left( {\overline x } \right)}^2}} = \sum\limits_{i = 1}^n {x_i^2 - n} .{\left( {\overline x } \right)^2}\) Suy ra: \({S^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^n {x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\) Thí dụ 3: Quan sát điểm thi môn Toán cao cấp của 10 sinh viên được chọn ngẫu nhiên từ một lớp ta thu được các số liệu sau: 5; 6; 7; 4; 6; 9; 4; 5; 5; 7 Tính \(\overline x \) và s của mẫu này. Giải Ta có: \(\sum\limits_{i = 1}^{10} {{x_i}} = 58\) vậy: \(\overline x = \frac{{58}}{{10}} = 5,8\) \(\sum\limits_{i = 1}^{10} {x_i^2} = 358\) vậy: \({s^2} = \frac{1}{9}\left[ {358 - 10.{{(5,8)}^2}} \right] = 2,4\) \( \Rightarrow s = \sqrt {{s^2}} = \sqrt {2,4} = 1,549193\) Chú ý: Để tính \(\overline x \) ta có thể dùng hàm AVERAGE trong Excel: \(\overline x = AVERAGE\left\{ {{x_i}} \right\}\) Để tính s2 ta có thể dùng hàm VAR trong Excel: s2 =VAR{Xi} Để tính s ta có thể dùng hàm STDEV trong Excel: s = STDEV{Xi} Cách thức thực hiện các lệnh này cũng tương tự như lệnh AVERAGE (xem phụ lục 1). Thí dụ 4: Có các số liệu về doanh số bán (Y) và chi phí chào hàng (X) của 12 công ty thương mại tư nhân cho ỏ bảng dưới đây. Hãy tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y. Doanh số bán (yi) triệu đ/nămChi phí chào hàng (xi) triệu đ/nămDoanh số bán (yi) triệu đ/nămChi phí chào hàng (xi) triệu đ/năm1270 1490 1060 1626 1020 1800100 106 60 160 70 1701610 1280 1390 1440 1590 1380140 120 116 120 140 150Tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y. Từ các số liệu cho ở bảng trên, ta tính được: \(\sum\limits_{i = 1}^{12} {{x_i}} = 1452\) Vậy: \(\overline x = \frac{{1452}}{{12}} = 121\) \(\sum\limits_{i = 1}^{12} {{y_i}} = 16956\) Vậy: \(\overline y = \frac{{16956}}{{12}} = 1413\) \(\sum\limits_{i = 1}^n {x_i^2} = 188192\). Vậy: \(s_X^2 = \frac{1}{{11}}\left[ {188192 - 12{{(121)}^2}} \right] = 1136,363636\) \( \Rightarrow {s_X} = \sqrt {1136,363636} = 33,71\) \(\sum\limits_{i = 1}^n {y_i^2} = 24549576\). Vậy: \(s_Y^2 = \frac{1}{{11}}\left[ {24549576 - 12{{(1413)}^2}} \right] = 53704,36364\) \(\Rightarrow {s_Y} = \sqrt {53704,36364} = 231,742\) 2. Trường hợp số liệu của mẫu cho dưới dạng có tấn số ni (nói chung ni > 1). Trường hợp này, để tính \(\overline x \) và s2 ta áp dụng công thức: \(\overline x = \frac{1}{n}\sum\limits_{i = 1}^k {{n_i}{x_i}} \) \({s^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^k {{n_i}x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\) Chú ý: \(\sum\limits_{k = 1}^k {{n_i}} {x_i}\) trong công thức (6.30) cũng chính là \(\sum\limits_{i = 1}^n {x_i}\) trong công thức (6.27); Tương tự \(\sum\limits_{k = 1}^k {{n_i}} {x_i^2}\) trong công thức (6.31) cũng chính là \(\sum\limits_{k = 1}^n {x_i^2}\) trong công thức (6.28). Với các số liệu cho ở thí dụ 3, ta có thể trình bày số liệu quan sát của mẫu này dưới dạng có tần số như sau: xi45679ni23221Từ số liệu ở bảng trên, ta tính được: \(\sum\limits_{i = 1}^k {{n_i}} {x_i} = 58;\sum\limits_{i = 1}^k {{n_i}} x_i^2 = 358\) So sánh với kết quả tính ở thí dụ 3 ta có thể minh chứng cho nhận xét nêu trên. Thí dụ 5: Tính trung bình và phương sai của mẫu cho ở bảng sau: xi4579ni10151312Giải: Từ số liệu của mẫu đã cho ta tính được: \(\sum\limits_i {{n_i}{x_i} = 314} \). Vậy: \(\overline x = \frac{{314}}{{50}} = 6,28\) \(\sum\limits_i {{n_i}} x_i^2 = 2144\). Vậy: \({s^2} = \frac{1}{{49}}\left[ {2144 - 50.{{(6,28)}^2}} \right] = 3,5118\) Thí dụ 6: Số liệu cho ở cột 1 và cột 3 của bảng dưới đây (bảng 6.33) là số liệu quan sát về lượng hàng bán được (kg/ngày) của một đại lý. Hãy tính trung bình mẫu và phương sai mẫu. Lượng hàng bán được(kg/ngày)Số ngày800-850 851-900 901-950 951-1000 1001-1050 1051-1100 1101-1150 1151-1200 1201-13009 12 24 36 25 20 16 10 8Ta thay mỗi khoảng bằng giá trị trung tâm khoảng, từ đó ta có bảng sau: (bảng 6.34) xini825 875,5 925,5 975,5 1025,5 1075,5 1125,5 1175,5 1250,59 12 24 36 25 20 16 10 8n = 160Từ số liệu của bảng trên, ta tính được: \(\sum\limits_i {{n_i}} {x_i} = 162175,5\) Vậy: \(\overline x = \frac{{162175,5}}{{160}} = 1013,596875\) \(\sum\limits_{i = 1}^n {{n_i}x_i^2} = 166159712,75\) Vậy \({s^2} = \frac{1}{{159}}\left[ {166159712,75 - 160.{{(1013,125)}^2}} \right] = 11189,51384\)