Bài toán so sánh tỉ lệ của hai tổng thể

1. Thí dụ:

Trong một thử nghiệm lâm sàng để điều trị ung thư vú đã di căn, bệnh nhânh được phân nhóm ngẫu nhiên để được điều trị với L-Pam hay CMF [một phối hợp gồm 3 loại thuốc]. Ðáp ứng khối u được định nghĩa là sự teo nhỏ trên một nửa của diện tích  khối u trong thời gian tối thiểu là 2 tuần. Số liệu được trình bày trong bảng sau:

Ðiều trị

CMF

L-Pam

Tổng số

Ðáp ứng của khối u

49
[52,7%]

18
[19,8%]

67
[36,4%]

Không

44

73

117

Tổng số bệnh nhân

93

91

184

Với số liệu trên, chúng ta có thể sử dụng kiểm định ý nghĩa để xem bằng chứng để kết luận CMF tốt hơn L-Pam mạnh đến mức độ nào.

2. Nguyên tắc của kiểm định ý nghĩa

Nguyên lí của phương pháp phản chứng là nều chúng ta có thể suy luận

nếu {A Þ B không xảy ra} thì  {B xảy ra Þ A không xảy ra}

Kí hiệu `B là phủ định của mệnh đề B, `A là phủ định của mệnh đề A, ta có thể viết

nếu {A Þ `B} thì  {B Þ `A }

Ðây là suy luận chúng ta rất thường xuyên ứng dụng trong chẩn đoán y khoa [dù rằng chúng ta ứng dụng nó một cách có ý thức hay vô thức].Thí dụ: một bệnh nhân nhập viện vì bị đau bụng dữ dội. Giả sử chúng ta nghi ngờ bệnh nhân bị tắc ruột và chúng ta khai thác bệnh sử của bệnh nhân. Bệnh nhân cho biết bệnh nhân có trung tiện bình thường và chúng ta loại bỏ căn nguyên tắc ruột. Có thể chúng ta không nhận thức được quá trình suy luận nhưng nó đã diễn ra như sau:

            Nếu bệnh nhân bị tắc ruột thì bệnh nhân sẽ không đi trung tiện.

            Do bệnh nhân trung tiện bình thường nên bệnh nhân không bị tắc ruột.

Nguyên tắc của kiểm định ý nghĩa tương tự như nguyên tắc của phương pháp phản chứng. Ðó là:

Nếu {Ho Þ T hiếm xảy ra} thì { T xảy ra Þ Ho hiếm xảy ra }

Kí hiệu theo công thức xác suất của biến cố T là P[T], ta viết:

Nếu {Ho Þ P[T] nhỏ } thì { T xảy ra Þ P[Ho] nhỏ }

Phân tích từng bước của quá trình kiểm định ý nghĩa chúng ta có các bước:

1. Xây dựng giả thuyết Ho

2. Chọn lựa kiểm định thích hợp - Việc tìm chuỗi suy luận từ Ho Þ P[T]

3. Tính giá trị thống kê T của số liệu thu thập được

4. Tính xác suất của thống kê T  - kí hiệu là P[T] và được gọi là giá trị p

5. Và nếu P[T] đủ nhỏ chúng ta kết luận P[Ho] nhỏ và chúng ta bác bỏ giả thuyết Ho

2.1. Giả thuyết không

Trong thống kê, giả thuyết không [null hypothesis] là một mệnh đề âm tính cho rằng không có sự liên hệ thống kê nào và như ở trên đã trình bày, khẳng định giả thuyết không là buớc đầu tiên của bất cứ một kiểm định ý nghĩa thống kê nào. Trong trường hợp so sánh 2 tỉ lệ trước tiên chúng ta sẽ chọn lập trường âm tính: giả định rằng không có sự khác biệt về tỉ lệ giữa hai dân số đích mà đã được đại diện bởi hai dân số nghiên cứu [mẫu].

Trong thí dụ điều trị ung thư vú, chúng ta xem giả thuyết không là hai điều trị này có hiệu quả tương đương. Nói khác đi các bệnh nhân ung thư vú sẽ có tỉ lệ đáp ứng với điều trị bằng nhau đối với CMF và L-Pam.

Ho: p1=p2  Hay

Hp: tỉ lệ đáp ứng với CMF = tỉ lệ đáp ứng với L-Pam

Chúng ta cũng có phát biểu giả thuyết không như sau: đối với một bệnh nhân bất kì, xác suất đáp ứng điều trị với CMF và L-Pam là bằng nhau.

2.2. Chọn kiểm định ý nghĩa để so sánh hai tỉ lệ phần trăm

Sau khi xác định giả thuyết không chúng ta cần xác định chuỗi suy luận từ HoÞ P[B]  bằng cách đặt ra câu hỏi:

            - Nếu giả thuyết không là đúng, cơ hội [xác suất] xảy ra sự khác biệt về tỉ lệ tương tự hay lớn hơn sự khác biệt đã quan sát được là bao nhiêu?

Cụ thể trong trường hợp thí dụ về ung thư vú, chúng ta đặt ra câu hỏi, nếu thuốc CMF và L-Pam có hiệu quả điều trị cùng bằng 36%, xác suất xảy ra sự khác biệt tương tự hoặc khác biệt nhiều hơn số liệu đã quan sát [đó là đáp ứng với CMF là 52,7% và với L-Pam là 19,8%] là bao nhiêu?

Như vậy, giả thuyết không cho rằng số bệnh nhân điều trị thuốc L-Pam được xem là một mẫu  gồm 19 bệnh nhân và bệnh nhân điều trị thuốc CMF là một mẫu gồm 93 bệnh nhân cả hai đều có tỉ lệ đáp ứng là 36,4%. Trong trường hợp này lí thuyết thống kê cho rằng:

- Hiệu số của tỉ lệ đáp ứng ở hai mẫu p1-p2 sẽ có phân phối xấp xỉ bình thường

- Hiệu số của tỉ lệ đáp ứng ở hai mẫu p1-p2 sẽ dao động chung quanh giá trị 0

- Sai số chuẩn của hiệu số hai tỉ lệ là

           

2.3. Tính chỉ số thống kê đo lường hiệu số quan sát được

Sự khác biệt [hiệu số] quan sát được đo lường theo sai số chuẩn được gọi là thống kê z:

           

2.4. Tính xác suất của chỉ số thống kê Z

Ðối với phân phối bình thường, ta có xác định xác suất có được thống kê Z lớn hơn hoặc bằng một giá trị Z0 nhất định bằng cách sử dụng một phần mềm thống kê [thí dụ như Epi-Info; Excel hay Stata], hoặc tham khảo bảng phân phối chuẩn. Hoặc chúng ta có thể sử dụng trực tiếp các thông tin sau:

            P[|Z| ³ 0,674] =0,5                  P[|Z| ³ 1,282] =0,2                  P[|Z| ³ 1,645] =0,1

            P[|Z| ³ 1,960] =0,05                P[|Z| ³ 2,576] =0,01                P[|Z| ³ 3,291]=0,001

Ðiểm cần nhắc lại là nếu Z càng lớn thì xác suất P càng nhỏ.

Trong thí dụ trên với Z=4,63 thì ta có P

Chủ Đề