So sánh giá trị trung bình giữa các nhóm là việc phổ biến trong các thí nghiệm, ví dụ so sánh ảnh hưởng của hai loại thuốc trừ sâu đến khả năng diệt sâu hại, so sánh ảnh hưởng của hai chế độ ăn khác nhau đến trọng lượng vật nuôi, so sánh nồng độ chì giữa hai nguồn nước... Trong thống kê, chỉ dựa vào sự khác nhau giữa các giá trị trung bình giữa hai mẫu (sample) là chưa đủ để kết luận cho cả quần thể (population). Các thông số khác cần quan tâm gồm phương pháp chọn mẫu, độ lớn của mẫu và độ tin cậy mong muốn.
Để thiết kế thí nghiệm một cách đơn giản nhất, các mẫu cần được chọn ngẫu nhiên và có kích thước đủ lớn (thông thường lớn hơn hoặc bằng 30). Bước tiếp theo cần lập giả thiết thí nghiệm, gồm giả thiết không (null hypothesis – H0) là giả thiết ngược với những gì nhà nghiên cứu muốn chứng minh và giả thiết thay thế (alternative hypothesis – HA) là những gì được mong muốn chứng minh là đúng. Ví dụ giả sử nhà nghiên cứu muốn chứng minh chiều cao cây của giống chè A lớn hơn chiều cao của giống chè B, khi đó:
H0: Chiều cao cây của giống A và giống B là tương đương
HA: Chiều cao cây của giống A lớn hơn giống B
Mục tiêu của dữ liệu thống kê là nhằm xác định có thể hay không thể không bác bỏ giả thiết H0, qua đó xác định có thể chấp nhận HA hay không. Giả thiết H0 được bác bỏ hay không dựa trên việc so sánh giữa giá trị p (p-value) và mức ý nghĩa (α).
Giá trị p được tính toán dựa trên ba thông số: giá trị trung bình (mean) và độ lệch chuẩn (standard deviation) và cỡ mẫu (size) của hai mẫu. Các phần mềm thống kê phổ biến như Excell, Minitab, R, SPSS đều cho phép tính toán giá trị p. Độ tin cậy là chỉ số quan trọng để đi đến kết luận thống kê. Độ tin cậy thường được chọn lớn hơn hoặc bằng 90% và phổ biến nhất là 95%, nhưng giá trị cụ thể tùy thuộc vào nghiên cứu viên. Lựa chọn giá trị càng cao sẽ càng thể hiện tin cậy cao của kết luận. Chỉ số “α = 1- độ tin cậy” được gọi là mức ý nghĩa và được làm cơ sở để so sánh với giá trị p, qua đó bác bỏ hoặc không bác bỏ giả thiết không.
Giá trị p < α: bác bỏ H0 và chấp nhận HA
Giá trị p > α: không đủ cơ sở bác bỏ H0 (nhưng không đồng nghĩa với H0 được chấp nhận là đúng)
Giả sử giá trị p = 0.04, khi đó với độ tin cậy 95% (α = 0.05) thì giả thiết H0 bị bác bỏ do giá trị p < α nhưng với độ tin cậy 99% (α = 0.01) thì không đủ cơ sở để bác bỏ H0. Do vậy, một bài toán thống kê có thể có nhiều kết luận khác nhau, tùy theo góc nhìn của nhà nghiên cứu.
Trong ví dụ trên, giả sử các thông số sau được tính toán dựa trên kết quả đo từ hai giống chè:
Giống A: chiều cao trung bình = 60, độ lệch chuẩn = 9, cỡ mẫu = 30.
Giống B: chiều cao trung bình = 57, độ lệch chuẩn = 6, cỡ mẫu = 35.
Sử dụng phần mềm Minitab, giá trị p được tính = 0,063
Do giá trị p lớn hơn α = 0,05 và nhỏ hơn α = 0,1 nên các kết luận sau đều là phù hợp:
“Với độ tin cậy 90%, có đủ số liệu phù hợp để chứng minh chiều cao của giống A là lớn hơn chiều cao của giống B.”
hoặc: “Với độ tin cậy 95%, chưa đủ số liệu phù hợp để chứng minh chiều cao của giống A là lớn hơn chiều cao của giống B” (nhưng không đồng nghĩa với chiều cao của hai giống A và B là bằng nhau).
Tin bài: Dương Mạnh Cường
Tham khảo:
Roxy Peck and Jay L. Devore (2012) Statistic – The Exploration and Analysis of Data, 7th . Cengage learning.
Nguyễn Văn Tuấn (2009) Hướng dẫn phân tích số liệu và vẽ biểu đồ bằng R. Truy cập tại
http://vietsciences.free.fr/khaocuu/nguyenvantuan/bieudoR/ch7-kiemdinhgiathiet.htm
Đang online | 951 |
Hôm nay | 2256 |
Hôm qua | 6838 |
Tuần này | 22633 |
Tuần trước | 11560 |
Tháng này | 3754207 |
Tháng trước | 3843540 |
Tất cả | 48275286 |
Lượt truy cập: 48275291
Đang online: 952
Ngày hôm qua: 6838
Phụ trách kỹ thuật: 0987. 008. 333