Xác suất & Thống kê - Chương 6 - Bài 4: Phương pháp tính các tham số đặc trưng của mẫu

  1. Tác giả: LTTK CTV
    Đánh giá: ✪ ✪ ✪ ✪ ✪

    Tóm tắt lý thuyết

    Giả sử có mẫu cụ thể WX = (X1, X2,. . . ,Xn), thì trung bình mẫu \(\overline X \) và phương sai mẫu (s2) là hai giá trị cơ bản nhất đối với mẫu cụ thể này, s có thể suy ra từ s2; còn f thì tính rất đơn giản. Do đó phần này chúng ta chỉ nêu ra công thức tính \(\overline x \) và s2 tương ứng với từng trường hợp số liệu hiện có như sau:

    1. Trường hợp số liệu của mẫu cho dưới dạng gồm đủ n giá trị quan sát


    Trường hợp này, để tính \(\overline x \) ta sử dụng công thức định nghĩa:
    \(\overline x = \frac{1}{n}\sum\limits_{i = 1}^n {{x_i}} \)
    Để tính s2 ta dùng công thức:
    \({s^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^n {x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)
    Chứng minh:
    Theo công thức định nghĩa của S2 ta có:
    \({s^2} = \frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{\left( {{x_i} - \overline x } \right)}^2}} \)
    Ta có:
    \({\left( {{x_i} - \overline x } \right)^2} = {\left( {{x_i}} \right)^2} - 2{x_i}\overline x + {\left( {\overline x } \right)^2}\)
    Vậy:
    \(\sum\limits_{i = 1}^n {{{\left( {{x_i} - \overline x } \right)}^2}} = \sum\limits_{i = 1}^n {\left[ {{{\left( {{x_i}} \right)}^2} - 2\overline x .{x_i} + {{\left( {\overline x } \right)}^2}} \right]} \)
    \(= \sum\limits_{i = 1}^n {x_i^2 - 2\overline x .{x_i} + n.{{\left( {\overline x } \right)}^2}} = \sum\limits_{i = 1}^n {x_i^2 - n} .{\left( {\overline x } \right)^2}\)
    Suy ra:
    \({S^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^n {x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)
    Thí dụ 3: Quan sát điểm thi môn Toán cao cấp của 10 sinh viên được chọn ngẫu nhiên từ một lớp ta thu được các số liệu sau:
    5; 6; 7; 4; 6; 9; 4; 5; 5; 7
    Tính \(\overline x \) và s của mẫu này.
    Giải
    Ta có: \(\sum\limits_{i = 1}^{10} {{x_i}} = 58\) vậy: \(\overline x = \frac{{58}}{{10}} = 5,8\)
    \(\sum\limits_{i = 1}^{10} {x_i^2} = 358\) vậy: \({s^2} = \frac{1}{9}\left[ {358 - 10.{{(5,8)}^2}} \right] = 2,4\)
    \( \Rightarrow s = \sqrt {{s^2}} = \sqrt {2,4} = 1,549193\)
    Chú ý:
    Để tính \(\overline x \) ta có thể dùng hàm AVERAGE trong Excel: \(\overline x = AVERAGE\left\{ {{x_i}} \right\}\)
    Để tính s2 ta có thể dùng hàm VAR trong Excel: s2 =VAR{Xi}
    Để tính s ta có thể dùng hàm STDEV trong Excel: s = STDEV{Xi}
    Cách thức thực hiện các lệnh này cũng tương tự như lệnh AVERAGE (xem phụ lục 1).
    Thí dụ 4: Có các số liệu về doanh số bán (Y) và chi phí chào hàng (X) của 12 công ty thương mại tư nhân cho ỏ bảng dưới đây. Hãy tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y.
    Doanh số bán (yi) triệu đ/nămChi phí chào hàng (xi) triệu đ/nămDoanh số bán (yi) triệu đ/nămChi phí chào hàng (xi) triệu đ/năm
    1270
    1490
    1060
    1626
    1020
    1800
    100
    106
    60
    160
    70
    170
    1610
    1280
    1390
    1440
    1590
    1380
    140
    120
    116
    120
    140
    150
    Tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y.
    Từ các số liệu cho ở bảng trên, ta tính được:
    \(\sum\limits_{i = 1}^{12} {{x_i}} = 1452\) Vậy: \(\overline x = \frac{{1452}}{{12}} = 121\)
    \(\sum\limits_{i = 1}^{12} {{y_i}} = 16956\) Vậy: \(\overline y = \frac{{16956}}{{12}} = 1413\)
    \(\sum\limits_{i = 1}^n {x_i^2} = 188192\). Vậy: \(s_X^2 = \frac{1}{{11}}\left[ {188192 - 12{{(121)}^2}} \right] = 1136,363636\)
    \( \Rightarrow {s_X} = \sqrt {1136,363636} = 33,71\)
    \(\sum\limits_{i = 1}^n {y_i^2} = 24549576\). Vậy: \(s_Y^2 = \frac{1}{{11}}\left[ {24549576 - 12{{(1413)}^2}} \right] = 53704,36364\)
    \(\Rightarrow {s_Y} = \sqrt {53704,36364} = 231,742\)

    2. Trường hợp số liệu của mẫu cho dưới dạng có tấn số ni (nói chung ni > 1).


    Trường hợp này, để tính \(\overline x \) và s2 ta áp dụng công thức:
    \(\overline x = \frac{1}{n}\sum\limits_{i = 1}^k {{n_i}{x_i}} \)
    \({s^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^k {{n_i}x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)
    Chú ý: \(\sum\limits_{k = 1}^k {{n_i}} {x_i}\) trong công thức (6.30) cũng chính là \(\sum\limits_{i = 1}^n {x_i}\) trong công thức (6.27); Tương tự \(\sum\limits_{k = 1}^k {{n_i}} {x_i^2}\) trong công thức (6.31) cũng chính là \(\sum\limits_{k = 1}^n {x_i^2}\) trong công thức (6.28).
    Với các số liệu cho ở thí dụ 3, ta có thể trình bày số liệu quan sát của mẫu này dưới dạng có tần số như sau:
    xi45679
    ni23221
    Từ số liệu ở bảng trên, ta tính được:
    \(\sum\limits_{i = 1}^k {{n_i}} {x_i} = 58;\sum\limits_{i = 1}^k {{n_i}} x_i^2 = 358\)
    So sánh với kết quả tính ở thí dụ 3 ta có thể minh chứng cho nhận xét nêu trên.
    Thí dụ 5: Tính trung bình và phương sai của mẫu cho ở bảng sau:
    xi4579
    ni10151312
    Giải:
    Từ số liệu của mẫu đã cho ta tính được: \(\sum\limits_i {{n_i}{x_i} = 314} \). Vậy: \(\overline x = \frac{{314}}{{50}} = 6,28\)
    \(\sum\limits_i {{n_i}} x_i^2 = 2144\). Vậy: \({s^2} = \frac{1}{{49}}\left[ {2144 - 50.{{(6,28)}^2}} \right] = 3,5118\)
    Thí dụ 6: Số liệu cho ở cột 1 và cột 3 của bảng dưới đây (bảng 6.33) là số liệu quan sát về lượng hàng bán được (kg/ngày) của một đại lý. Hãy tính trung bình mẫu và phương sai mẫu.
    Lượng hàng bán được(kg/ngày)Số ngày
    800-850
    851-900
    901-950
    951-1000
    1001-1050
    1051-1100
    1101-1150
    1151-1200
    1201-1300
    9
    12
    24
    36
    25
    20
    16
    10
    8
    Ta thay mỗi khoảng bằng giá trị trung tâm khoảng, từ đó ta có bảng sau: (bảng 6.34)
    xini
    825
    875,5
    925,5
    975,5
    1025,5
    1075,5
    1125,5
    1175,5
    1250,5
    9
    12
    24
    36
    25
    20
    16
    10
    8
    n = 160
    Từ số liệu của bảng trên, ta tính được: \(\sum\limits_i {{n_i}} {x_i} = 162175,5\)
    Vậy:
    \(\overline x = \frac{{162175,5}}{{160}} = 1013,596875\)
    \(\sum\limits_{i = 1}^n {{n_i}x_i^2} = 166159712,75\)
    Vậy
    \({s^2} = \frac{1}{{159}}\left[ {166159712,75 - 160.{{(1013,125)}^2}} \right] = 11189,51384\)