Xác suất & Thống kê - Chương 4 - Bài 1: Khái niệm và phân phối xác suất của đại lượng ngẫu nhiên 2 chiều

  1. Tác giả: LTTK CTV
    Đánh giá: ✪ ✪ ✪ ✪ ✪

    Tóm tắt lý thuyết

    1. Khái niệm về đại lượng ngẫu nhiên hai chiều


    Ở các chương trước, chúng ta đã xét những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận được biểu thị bằng một số. Các đại lượng ngẫu nhiên như vậy được gọi là đại lượng ngẫu nhiên một chiều. Ngoài những đại lượng ngẫu nhiên một chiều, trong thực tế ta còn gặp những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận được biểu thị bằng 2, hoặc 3,..., hoặc n số.
    Những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận là những véctơ 2 chiều được gọi là đại lượng ngẫu nhiên 2 chiều.
    Tổng quát: Những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận là một véctơ n chiều được gọi là đại lượng ngẫu nhiên n chiều.
    Ta ký hiệu đại lượng ngẫu nhiên 2 chiều là (X, Y). Trong đó X và Y được gọi là các thành phần của đại lượng ngẫu nhiên 2 chiều, cả hai đại lượng ngẫu nhiên X và Y được xét một cách đồng thời tạo nên đại lượng ngẫu nhiên 2 chiều. Tương tự, n đại lượng ngẫu nhiên được xét một cách đồng thời tạo nên đại lượng ngẫu nhiên n chiều.
    Thí dụ 1: Khi nghiên cứu về thể lực của những học sinh tiểu học có cùng độ tuổi, người ta thường quan sát đồng thời cả chiều cao (X) và trọng lượng (Y) của các học sinh đó, như vậy ta có đại lượng ngẫu nhiên hai chiều (X, Y). Còn nếu ta quan tâm cả vòng ngực (Z) thì ta sẽ có đại lượng ngẫu nhiên 3 chiều (X, Y, Z).
    Thí dụ 2: Khi khảo sát các siêu thị, nếu ta quan tâm đến doanh số bán (X1) và lượng vốn (X2) ta sẽ có đại lượng ngẫu nhiên hai chiều (X1, X2). Còn nếu ta quan tâm cả chi phí quảng cáo (X3) thì ta sẽ có đại lượng ngẫu nhiên 3 chiều (X1, X2, X3).
    Trong thực tế người ta cũng phân chia đại lượng ngẫu nhiên nhiều chiều thành hai loại: rời rạc và liên tục.
    Các đại lượng ngẫu nhiên nhiều chiều được gọi là rời rạc nếu các thành phần của nó là các đại lượng ngẫu nhiên rời rạc.
    Các đại lượng ngẫu nhiên nhiều chiều được gọi là liên tục nếu các thành phần của nó là các đại lượng ngẫu nhiên liên tục.

    2. Phân phối xác suất của đại lượng ngẫu nhiên hai chiều


    Đối với đại lượng ngẫu nhiên hai chiều người ta cũng dùng bảng phân phối xác suất hoặc hàm phân phối xác suất hoặc hàm mật độ xác suất để thiết lập phối xác suất của chúng.

    2.1 Bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều


    Bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều rời rạc có dạng:
    Yy1y2....ym
    X
    x1P(x1,y1)P(x1,y2)....P(x1,ym)
    x2P(x2,y1)P(x2,y2)....P(x2,ym)
    ....................
    xnP(xn,y1)P(xn,y2)....P(xn,ym)
    Trong đó:
    xi (i = 1, 2,..., n) là các giá trị có thể nhận của thành phần X.
    yj (i = 1, 2,..., m) là các giá trị có thể nhận của thành phần Y
    P(xi, yj) (i = 1, 2, . . . n; j = 1, 2, . . . , m) là xác suất để đại lượng ngẫu nhiên 2 chiều (X, Y) nhận giá trị (xi, yj)
    \(\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {P({x_i},{{\rm{y}}_{\rm{j}}}} } ) = 1\)
    Ký hiệu:
    \(P({x_i},{y_j}) = P\left[ {\left( {X = {x_i}} \right)\left( {Y = {y_j}} \right)} \right] = {p_{{\rm{ij}}}} = P(X = {x_i}).P(Y = {y_j}/X = {x_i})\)
    \(= P(Y = {y_j}).P(X = {x_i}/Y = {{\rm{y}}_{\rm{j}}})\)
    \(P(X = {x_i}) = \sum\limits_{j = 1}^m {P({x_i},{y_j}) = \sum\limits_{j = 1}^m {{p_{{\rm{ij}}}} = {p_i}} } \)
    \(P(Y = {y_i}) = \sum\limits_{i = 1}^n {P({x_i},{y_j}) = \sum\limits_{i = 1}^n {{p_{{\rm{ij}}}} = {q_i}} } \)
    Nếu \({p_{{\rm{ij}}}} = {p_i}.{q_j}\,(\forall i,j)\) thì X, Y độc lập
    Ta luôn có: \(\sum\limits_{i = 1}^n {{p_i}} = \sum\limits_{j = 1}^m {{q_j} = 1} \)
    Với các ký hiệu trên, ta có thể biểu diễn bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều dưới dạng sau:
    Yy1y2.......ymPx
    X
    x1p11p12....p1mp1
    x2p21p22....p2mp2
    ....................
    xnpn1pn2pnmpn
    PYq1q2....qm1

    Biết được phân phối xác suất của đại lượng ngẫu nhiên 2 chiều ta có thể tìm được bảng phân phối xác suất của các thành phần.
    Bảng phân phối xác suất của thành phần X có dạng:
    Xx1x2....xm
    PXp1p2....pm
    Từ bảng phân phối xác suất của X với các công thức đã biết ở chương 2 ta có thể tính được E(X), Var(X), Mod(X),.. .
    Tương tự ta có bảng phân phối xác suất của thành phần Y có dạng:
    Yy1y2....ym
    PYq1q2....qm

    Từ bảng phân phối xác suất của Y ta cũng có thể tính được E(Y), Var(Y), Mod(Y),...
    Thí dụ: Cho biết bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều (X, Y), trong đó X là doanh thu và Y là chi phí quảng cáo của các công ty tư nhân kinh doanh cùng một mặt hàng như sau (đơn vị tính của X và Y đều là triệu đồng/tháng):
    X100150200PY
    Y
    00,10,050,050,2
    10,050,20,150,4
    200,10,30,4
    PX0,150,350,50,1
    Từ bảng phân phối xác suất của (X, Y) ở trên, ta có:
    Bảng phân phối xác suất của X:
    X100150200
    PX0,150,350,5
    Từ đó ta dễ dàng tính được:
    \(E(X) = 100 x 0,15 + 150x 0,35 + 200x 0,5 = 167,5 \)
    Tức doanh thu trung bình của một công ty tư nhân là 167,5 triệu đ/tháng.
    \(E(X^2) = 100^2x 0,15 + 150^2 x 0,35 + 200^2 x 0,5 = 29375\)
    \(Var(X) = E(X^2) -[E(X)]^2 = 29375 - (167,5)^2 = 1318,75 \)
    \( \Rightarrow \sigma (X) = \sqrt {1318,75} = 36,3146\)
    Tức là mức chênh lệch trung bình về doanh thu của các công ty vào khoảng 36,3 triệu đồng/tháng.
    Bảng phân phôi xác suất của Y:
    Y012
    PY0,20,40,4
    \(E(Y) = 0x 0,2 + 1x 0,4 + 2x 0,4 = 1,2\)
    Tức chi phí quảng cáo trung bình của một công ty tư nhân là 1,2 triệu đ/tháng.
    \(Var(Y) = E(Y^2) -[E(Y)]^2 = 2- (1,2)^2 = 0,56\)
    \( \Rightarrow \sigma (Y) = \sqrt {0,56} = 0,74833\)
    Tức là mức chênh lệch trung bình về chi phí quảng cáo của các công ty vào khoảng 0,748 triệu đồng/tháng.

    2.2 Hàm phân phối xác suất của đại lượng ngẫu nhiên 2 chiều


    Định nghĩa: Hàm phân phối xác suất của đại lượng ngẫu nhiên hai chiều (X, Y) [ký hiệu là F(x, y)]
    Như vậy hàm phân phối F(x, y) có miền xác định là R2 và miền giá trị là [0,1]
    Tính chất:
    Từ định nghĩa, ta có thể chứng minh được các tính chất sau đây của hàm phân phối:
    (i) \(0 \le F(x;y) \le 1\)
    (ii) F(x, y) là hàm không giảm theo từng đối số
    (iii) \(F(x, - \infty ) = F( - \infty ,y) = 0;\,\,\,F( + \infty , + \infty ) = 1\)
    (iv) \(\forall {x_1} < {x_2}\,và\,{y_1} < {y_2}\) ta có:
    \(P\left[ {({x_1} \le X < {x_2})({y_1} \le Y < {y_2})} \right] = F({x_2},{y_2}) - F({x_2},{y_1}) - F({x_1},{y_2}) + F({x_2},{y_2})\)
    (v)
    \(\begin{array}{l} F(x, + \infty ) = P\left[ {(X < x)(Y < \infty )} \right] = P(X < x) = {F_1}(x)\\ F( + \infty ,y) = P\left[ {\left( {X < \infty } \right)\left( {Y < y} \right)} \right] = P(Y < y) = {F_2}(y) \end{array}\)
    trong đó F1(x), F2(y) tương ứng là hàm phân phối riêng của X và Y
    Hệ quả:
    • X, Y độc lập khi và chỉ khi: F(x, y) = F1(x).F2 (y)
    • Với véc tơ ngẫu nhiên 2 chiều (X, Y) rời rạc, ta có:
      • \(F(x,y) = \sum\limits_{{x_i} < x} {\sum\limits_{{y_j} < y} {P\left[ {(X = {x_i})(Y = {y_j})} \right]} } \)
      • \(P\left[ {({x_1} < X < {x_2})({y_1} < Y < {y_2})} \right] \) View attachment 44027 View attachment 44026
    Trên R2 biến cố [(x1 < X < x2)(y1 < Y < y2)] có thể biểu diễn là các điểm trong hình chữ nhật ABCD (hình vẽ)
    01.png

    2.3 Hàm mật độ xác suất của đại lượng ngẫu nhiên hai chiều


    Định nghĩa: Hàm mật độ xác suất của đại lượng ngẫu nhiên hai chiều liên tục (X, Y) [ký hiệu là f(x, y)] thỏa mãn các điều kiện sau:
    \(f(x,y) \ge 0\,\,\,\forall (x,y) \in {R^2}\)
    \(\int\limits_{ - \infty }^{ + \infty } {\int\limits_{ - \infty }^{ + \infty } {f(x,y)dxdy = 1} } \)
    \(P\left[ {({x_1} < X < x{}_2)({y_1} < Y < y{}_2)} \right] = \int\limits_{{x_1}}^{{x_2}} {\int\limits_{{y_1}}^{{y_2}} {f(x,y)dxdy} } \)
    Các tính chất:
    \(F(x,y) = \int\limits_{ - \infty }^x {\int\limits_{ - \infty }^y {f(u,v)du,dv} } \)
    \({F_1}(x) = \int\limits_{ - \infty }^x {\int\limits_{ - \infty }^{ + \infty } {f(x,y)dy} } ;\,\,{F_2}(x) = \int\limits_{ - \infty }^y {\int\limits_{ - \infty }^{ + \infty } {f(x,y)dx} } \)
    \(\begin{array}{l} {f_1}(x) = \frac{{\partial {F_1}(x)}}{{\partial x}} = \int\limits_{ - \infty }^{ + \infty } {f(x,y)dy} \\ {f_2}(x) = \frac{{\partial {F_2}(x)}}{{\partial x}} = \int\limits_{ - \infty }^{ + \infty } {f(x,y)dx} \end{array}\)
    Trong đó:
    f1(x) và f2(y) tương ứng là hàm mật độ xác suất của X và Y (hàm mật độ xác suất biên)
    Hệ quả: X, Y độc lập khi và chỉ khi f(x, y) = f1(x).f2(y)