Student T-test là gì

Giải phẫu phương pháp t-test

Phương pháp t-test được dùng một cách phổ biến để xác định xem liệu giá trị trung bình của một quần thể [the mean of a population] có khác biệt với một giá trị nào đó [gọi là giá trị trung bình giả thuyết – a hypothesized mean] hoặc với giá trị trung bình của một quần thể khác.

Ví dụ, phương pháp 1-sample t-test [hay phương pháp kiểm định t cho một mẫu] được dùng để kiểm định xem liệu thời gian chờ trung bình của các bệnh nhân trong một phòng khám y khoa có lâu hơn so với thời gian mong muốn là 15 phút hay không, dựa trên dữ liệu từ một nhóm ngẫu nhiên các bệnh nhân.

Để xác định xem liệu sự khác biệt [giữa thời gian chờ thực tế và thời gian mong muốn] có ý nghĩa thống kê hay không, phương pháp t-test sẽ tính toán một giá trị gọi là t-value [giá trị p-value nổi tiếng cũng được lấy trực tiếp từ t-value]. Giá trị này được tính như sau:

t = \frac{\bar{x} - \mu _{0}}{\frac{s}{\sqrt{n}}}

Công thức toán học này trông có vẻ bí hiểm nhưng thực ra bạn hoàn toàn có thể làm chủ được nó nếu bạn hiểu được hai động lực quan trọng đằng sau nó : phần tử số [ở phía trên] và phần mẫu số [ở phía dưới].

Phần tử số là Tín Hiệu

Phần tử số trong công thức 1-sample t-test đo lường độ mạnh của tín hiệu [signal]: sự khác biệt giữa giá trị trung bình của mẫu dữ liệu của bạn [\bar{x}] và giá trị trung bình giả thuyết của quần thể [\mu_{0}].

Trở lại với ví dụ về thời gian chờ của các bệnh nhân, giá trị trung bình giả thuyết là 15 phút.

Nếu các bệnh nhân trong mẫu dữ liệu ngẫu nhiên của bạn có thời gian chờ trung bình là 15.1 phút, tín hiệu bằng 15.1 – 15 = 0.1 phút. Giá trị khác biệt này tương đối nhỏ, do vậy tín hiệu ở phần tử số thì yếu.

Tuy nhiên, nếu thời gian chờ trung bình của bệnh nhân là 68 phút, sự khác biệt sẽ lớn hơn và bằng 68-15=53 phút. Do vậy, tín hiệu sẽ mạnh hơn.

Kiểm định T-Test trong SPSS và tất cả kiến thức bạn cần biết

Trong nghiên cứu khoa học, thống kê được coi là “ngôn ngữ thứ 2” cho phép người nghiên cứu đưa ra các kết luận có giá trị. Đảm bảo tính khách quan của nghiên cứu. Trong nghiên cứu khoa học ứng dụng, vai trò của thống kê được thể hiện qua mô tả, so sánh và liên hệ dữ liệu. Trong bài viết này, Luận Văn 2S xin được chia sẻ đến bạn đọc phương pháp so sánh dữ liệu thông qua kiểm định T-Test.

Cú pháp

T.TEST[array1,array2,tails,type]

Cú pháp của hàm T.TEST có các đối số như sau:

  • Array1 Bắt buộc. Tập dữ liệu thứ nhất.

  • Array2 Bắt buộc. Tập dữ liệu thứ hai.

  • Tails Bắt buộc. Xác định số đuôi của phân phối. Nếu đuôi = 1, T.TEST sử dụng phân phối một phía. Nếu đuôi = 2, T.TEST sử dụng phân phối hai phía.

  • Type Bắt buộc. Loại Phép thử t cần thực hiện.

Hướng dẫn thực hiện T-Test trong Excel

  • Ý nghĩa thống kê [statistical significance] là gì?
  • Tại sao phải kiểm tra ý nghĩa thống kê?
  • Phân phối t Student là gì?
  • Cách thực hiện T-Test trong Excel
    • Kiểm tra và tải add-in Analysis Toolpak
    • Thực hiện F-test và T-test trong Excel

Ý nghĩa thống kê [statistical significance] là gì?

Giả sử bạn muốn biết con xúc xắc nào trong hai con sẽ cho điểm cao hơn. Bạn lăn con xúc xắc đầu tiên và nhận được 2 điểm. Sau đó, bạn lăn con xúc xắc thứ 2 và nhận được 6 điểm. Điều này có cho bạn biết con xúc xắc thứ hai thường cho điểm cao hơn không? Nếu câu trả lời của bạn “tất nhiên là không”, thì bạn đã có một số hiểu biết nhất định về ý nghĩa thống kê. Bạn hiểu sự khác biệt là do sự thay đổi ngẫu nhiên về điểm số mỗi lần một con xúc xắc được lăn. Vì mẫu rất nhỏ [chỉ có 1 lần lăn xúc xắc] nên nó không cho thấy gì đáng kể.

Bây giờ hãy tưởng tượng bạn lăn mỗi con xúc xắc 6 lần:

  • Con xúc xắc đầu tiên cho ra các số 3, 6, 6, 4, 3, 3. Giá trị trung bình là 4,17.
  • Con xúc xắc thứ hai cho ra các số 5, 6, 2, 5, 2, 4. Giá trị trung bình là 4,00.

Điều này bây giờ có chứng minh con xúc xắc đầu tiên cho điểm cao hơn con thứ hai không? Có lẽ là không. Một mẫu với các giá trị trung bình chênh lệch không lớn làm cho sự khác biệt dường như vẫn là do các biến ngẫu nhiên. Khi ta tăng số lần lắc xúc xắc, sẽ rất khó để đưa ra câu trả lời thông thường cho câu hỏi - sự khác biệt giữa điểm số là kết quả của sự thay đổi ngẫu nhiên hay thực sự có khả năng con xúc xắc này cho điểm cao hơn con xúc xắc kia?

Significance [mức ý nghĩa] là xác suất, trong đó sự khác biệt mà ta quan sát được giữa các mẫu là do các biến thể ngẫu nhiên. Significance được gọi là cấp độ alpha hoặc đơn giản là “α”. Confidence [mức độ tin cậy], hoặc đơn giản là “c”, là xác suất mà sự khác biệt giữa các mẫu không phải do biến ngẫu nhiên. Nói cách khác, có một sự khác biệt giữa các quần thể [population] cơ bản. Do đó: c = 1 - α.

Bạn có thể đặt “α” ở bất kỳ mức độ nào mình muốn, để cảm thấy tự tin về mức ý nghĩa đã chứng minh. Mức α = 5% [độ tin cậy 95%] được sử dụng thường xuyên, nhưng nếu muốn thực sự chắc chắn rằng bất kỳ sự khác biệt nào đều không phải do biến ngẫu nhiên gây ra, bạn có thể áp dụng mức độ tin cậy cao hơn, sử dụng α = 1% hoặc thậm chí α = 0,1%.

Các thử nghiệm thống kê khác nhau được sử dụng để tính toán độ tin cậy trong các tình huống khác nhau. T-Test được sử dụng để xác định xem số trung bình của hai quần thể có khác nhau không và thử nghiệm F-Test được sử dụng để xác định xem các phương sai có chênh lệch hay không.

Bài 5. T-test độc lập [Independent t-test]

admin

8786 15 phút đọc

Kiểm định t-mẫu độc lập [independent t-test] để so sánh giá trị trung bình giữa hai nhóm không liên quan trên cùng một biến liên tục. Ví dụ, chúng ta có thể sử dụng bài kiểm tra t-test độc lập để hiểu liệu mức lương của sinh viên tốt nghiệp năm đầu tiên có khác nhau dựa trên giới tính hay không [tức là, biến phụ thuộc của bạn sẽ là “lương của sinh viên tốt nghiệp năm đầu tiên” và biến độc lập của bạn sẽ là “giới tính”, có hai nhóm: “Nam và nữ”]. Ngoài ra, chúng ta có thể sử dụng một bài kiểm tra t-test độc lập để hiểu liệu có sự khác biệt về mức độ lo lắng khi kiểm tra dựa trên trình độ học vấn hay không [nghĩa là, biến phụ thuộc của bạn sẽ là “lo lắng khi kiểm tra” và biến độc lập của bạn sẽ là “trình độ học vấn”, có hai nhóm: “sinh viên chưa tốt nghiệp” và “sinh viên sau đại học”].

Video liên quan

Chủ Đề