So sánh 2 tỷ lệ có ý nghĩa năm 2024

Kiểm định khác biệt giữa 2 tỉ lệ [one sample binomial test] cho phép chúng ta kiểm tra xem tỉ lệ các giá trị của biến phân loại 2 mức có khác ý nghĩa thống kê với nhau hay không. Chẳng hạn, chúng ta muốn biết sự khác nhau trong tỉ lệ học sinh nam và nữ trong bộ dữ liệu có ý nghĩa thống kê hay không. Kiểm định khác biệt giữa hai tỉ lệ có thể được phát biểu dưới dạng giả thuyết thống kê như sau:

\[{H_0}:\begin{array}{ccccccccccccccc}{}&{p = 0.5}\end{array}\]

Và các giả thuyết thay thế có thể là:

\[\begin{array}{l}{H_1}:\begin{array}{ccccccccccccccc}{}&{p \ne 0.5}\end{array}\\{H_1}:\begin{array}{ccccccccccccccc}{}&{p > 0.5}\end{array}\\{H_1}:\begin{array}{ccccccccccccccc}{}&{p < 0.5}\end{array}\end{array}\]

Xem thêm

Trang 2 sẽ trình bày cách tiến hành và đọc kết quả kiểm định khác biệt giữa 2 tỉ lệ trên SPSS.

II. Thực hành kiểm định khác biệt giữa 2 tỉ lệ trên SPSS

Sử dụng bộ dữ liệu hsb2.sav. Đối tượng khảo sát của bộ dữ liệu này là 200 học sinh từ trung học trở xuống. Các biến chính trong bộ dữ liệu bao gồm điểm số các môn toán [math], đọc [read], viết [write], chương trình học [prog], giới tính [female]… Giả sử chúng ta muốn kiểm tra tỉ lệ học sinh nam/nữ có bằng nhau hay không? Để kiểm chứng điều này, chúng ta thực hiện kiểm định khác biệt giữa 2 tỉ lệ như sau:

Các suy luận thống kê cho kiểm định này liên quan đến tỷ lệ dân số, giả thuyết vô hiệu H0 là chúng bằng nhau [π1=π2].

Các giả thuyết thay thế sẽ là:

  • H1 hai mặt: π1 ≠ π2
  • H1 mặt phải: π1 > π2
  • H1 mặt trái: π1 < π2

Kiểm tra dựa trên một ước lượng gần đúng chuẩn của phân phối nhị thức, giá trị Z được sử dụng để đánh giá khoảng tin cậy cho sự khác biệt, D, giữa các tỷ lệ dân số. Để tính toán ý nghĩa của sự khác biệt này, sai số chuẩn của sự khác biệt quan sát được sẽ được tính toán và một khoảng tin cậy thích hợp [appropriate confidence interval] cho sự khác biệt được đánh giá dựa trên sai số chuẩn quan sát này. Sự khác biệt chưa biết giữa các tỷ lệ dân số, D, được ước lượng bằng cách sử dụng sự khác biệt quan sát được về tỷ lệ mẫu, P1-P2. Nếu khoảng tin cậy [CI] loại trừ 0, chúng ta có thể tin tưởng rằng các nhóm là khác nhau đáng kể.

3. Giả định kiểm tra

  • Các quan sát được lấy mẫu ngẫu nhiên từ một dân số nhị phân xác định. Dân số có thể được coi là nhị phân đối với một biến liên tục với điều kiện là một giá trị cho biến thống kê có thể được gán cho hai danh mục loại trừ lẫn nhau, ví dụ, IQ≥100 và 0], tìm hàng tương ứng với giá trị Z và cột tương ứng với mức ý nghĩa α, chúng ta tìm thấy giá trị p_left.
  • Giá trị p [2-sided] là: 2 x [1- p_left]
  • Nếu [Zπ2

    – Nếu giá trị Z trong mẫu bằng hoặc lớn hơn giá trị tới hạn Z*.

    – Hoặc tính giá trị p tương ứng với Z và xem nó có bằng hoặc nhỏ hơn α [thường là 0.05].

    Giá trị p là xác suất tìm thấy giá trị Z hoặc giá trị lớn hơn, cho rằng giả thuyết H0 là đúng.

    • Tìm hàng tương ứng với giá trị Z và cột tương ứng với mức ý nghĩa α, chúng ta tìm thấy giá trị p_left.
    • Giá trị p [right-sided] là: 1- p_left
    • Nếu chúng ta quyết định trước để kiểm tra mặt phải nhưng thấy Z0] ở mức ý nghĩa 0.05 cho thấy giá trị p_left = 0.99987

      – Nếu kiểm tra hai mặt, giá trị p [2-sided] = 2 × [1- p_left] = 2 × [1-0.99987]=0.00026 [p

Chủ Đề