Thống kê Sinh học

Ngô Vũ

Senior Member
Được sự đồng ý của GS Tuấn, tôi xin phép giới thiệu một trong những bài viết khá phổ biến của GS về số P trong Thống kê Sinh học (và thống kê nói chung). ?Bài này được đăng trên trang nhà của GS ở http://www.nguyenvantuan.com. ?Toàn bộ bài giảng của GS về chủ đề này có thể được tham khảo tại trang ykhoanet.com ( http://www.ykhoanet.com/baigiang/index.htm )

Ý nghĩa của trị số P (P-value) trong nghiên cứu khoa học
Tác giả: Nguyễn Văn Tuấn

? ? ? ? ?Phân tích thống kê là một khâu quan trọng không thể thiếu được trong các công trình nghiên cứu khoa học, nhất là khoa học thực nghiệm. ?Một công trình nghiên cứu khoa học, cho dù có tốn kém và quan trọng cỡ nào, nếu không được phân tích đúng phương pháp sẽ không bao giờ có cơ hội được xuất hiện trong các tập san khoa học. ?Ngày nay, chỉ cần nhìn qua tất cả các tập san nghiên cứu khoa học trên thế giới, hầu như bất cứ bài báo y học nào cũng có phần “Statistical Analysis” (Phân tích thống kê), nơi mà tác giả phải mô tả cẩn thận phương pháp phân tích, tính toán như thế nào, và giải thích ngắn gọn tại sao sử dụng những phương pháp đó để hàm ý “bảo kê” hay tăng trọng lượng khoa học cho những phát biểu trong bài báo. ?Các tạp san y học có uy tín càng cao yêu cầu về phân tích thống kê càng nặng. ?Không có phần phân tích thống kê, bài báo không có ý nghĩa khoa học.

? ? ? ? ?Trong các bài báo khoa học, ngoài những dữ kiện bằng số, biểu đồ và hình ảnh, con số mà chúng ta thường hay gặp nhất là trị số P (mà tiếng Anh gọi là P-value). ?Trị số P là một con số xác suất, tức là viết tắt chữ “probability value”. ?Chúng ta thường gặp những phát biểu được kèm theo con số, chẳng hạn như “Kết quả phân tích cho thấy tỉ lệ gãy xương trong nhóm bệnh nhân được điều trị bằng thuốc Alendronate là 2%, thấp hơn tỉ lệ trong nhóm bệnh nhân không được chữa trị (5%), và mức độ khác biệt này có ý nghĩa thống kê (p = 0.01)”, hay một phát biểu như “Sau 3 tháng điều trị, mức độ giảm áp suất máu trong nhóm bệnh nhân là 10% (p < 0.05)”. ?Trong văn cảnh trên đây, đại đa số nhà khoa học hiểu rằng trị số P phản ánh xác suất sự hiệu nghiệm của thuốc Alendronate hay một thuật điều trị, họ hiểu rằng câu văn trên có nghĩa là “xác suất mà thuốc alendronate tốt hơn giả dược là 0.99” (lấy 1 trừ cho 0.01). ?Nhưng cách hiểu đó hoàn toàn sai!

Rất nhiều người, không chỉ người đọc mà ngay cả chính các tác giả của những bài báo khoa học, giáo sư đại học, không hiểu ý nghĩa của trị số P. ?Theo một nghiên cứu được công bố trên tập san danh tiếng Statistics in Medicine [1], tác giả cho biết 85% các tác giả khoa học và bác sĩ nghiên cứu không hiểu hay hiểu sai ý nghĩa của trị số P. ?Đọc đến đây có lẽ bạn đọc rất ngạc nhiên, bởi vì điều này có nghĩa là nhiều nhà nghiên cứu khoa học có khi không hiểu hay hiểu sai những gì chính họ viết ra có nghĩa gì! ?Thế thì, câu hỏi cần đặt ra một cách nghiêm chỉnh: Ý nghĩa của trị số P là gì?

? ? ? ? ?Để trả lời cho câu hỏi này, chúng ta cần phài xem xét qua tiến trình của một công trình nghiên cứu khoa học thực nghiệm. ?Một nghiên cứu khoa học, như chúng ta đều biết, phải bắt đầu bằng một giả thuyết. ?Hãy lấy một ví dụ về một nghiên cứu so sánh chỉ số thông minh (IQ) giữa phái nam và nữ. ?Giả thuyết có thể đề ra là sinh viên nữ thông minh hơn sinh viên nam. ?Giả thuyết này, phát biểu theo ngôn ngữ thực nghiệm, là chỉ số IQ trong nữ giới cao hơn chỉ số IQ trong nam giới. ?Nhưng để cho tiện việc tính toán và phân tích sau này, một giả thuyết đảo (null hypothesis, hay gọi tắt là Ho) được phát biểu rằng chỉ số IQ trong phái nữ bằng với chỉ số IQ trong phái nam.

? ? ? ? ?Để “chứng minh” giả thuyết trên, nhà nghiên cứu có thể đo tất cả sinh viên nam và nữ trong tất cả các trường đại học trong cả nước và tính toán xem chỉ số IQ của phái nữa có cao hơn hay bằng với chỉ số IQ của phái nam. ?Trong trường hợp này, nhà nghiên cứu không cần đến phân tích thống kê, không cần đến trị số P. ?Nhưng một việc làm như thế chẳng những không thực tế, mà còn không cần thiết, bởi vì nhà nghiên cứu có thể chỉ chọn ra một số đối tượng, thu thập thông tin, và dùng các thuật toán thống kê để suy luận cho toàn bộ quần thể sinh viên. ?Giả dụ nhà nghiên cứu quyết định chọn hai nhóm sinh viên đại học (100 sinh viên nam và 100 sinh viên nữ) có cùng độ tuổi và có cùng hoàn cảnh gia đình, nhưng họ được chọn một cách ngẫu nhiên từ nhiều trường đại học khác nhau. ?

Bước kế tiếp là nhà nghiên cứu sử dụng một phương pháp đo lường khách quan nào đó để “đo” chỉ số IQ trong từng sinh viên trong nhóm 200 người này. ?Giả dụ như sau khi đo xong và kết quả được tóm lược như sau:
? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Phái nam ? Phái nữ
Số lượng sinh viên (n) ? ? ? ? ? ? ? ? ? ? ? ? ? ? 100 ? ? ? ? ? 100
Chỉ số IQ trung bình (mean) ? ? ? ? ? ? ? ? ? ? 130 ? ? ? ? ? 140
Độ lệch chuẩn (standard deviation) ? ? ? ? ? ?20 ? ? ? ? ? ? 22

Đến đây, câu hỏi cụ thể đặt ra là các số liệu trên đây có đủ bằng chứng để kết luận rằng sinh viên nữ thông minh hơn sinh viên nam? ?Nói cách khác, nhà nghiên cứu phải dựa vào kết quả thu thập được trong một nhóm đối tượng để suy luận cho một quần thể sinh viên của cả nước. ?Câu hỏi này hoàn toàn có lí do của nó, bởi vì nên nhớ rằng đây chỉ là dữ kiện của một nhóm người được chọn ngẫu nhiên từ một quần thể, và vì bản chất ngẫu nhiên trong chọn đối tượng, nếu một nghiên cứu khác cũng chọn 200 đối tượng như trên thì kết quả có thể khác đi, thậm chí ngược lại với kết quả trên đây. ?Vì thế, nhà nghiên cứu phải hết sức thận trọng trong việc suy luận từ một nhóm đối tượng cho một quần thể sao cho xác suất sai lầm là tối thiểu.

? ? ? ? ?Để trả lời câu hỏi trên, nhà nghiên cứu có thể sử dụng một phương pháp phân tích khách quan có tên là t-test (mà tôi tạm dịch là nghiệm toán t). ?Mục đích của nghiệm toán t là nhằm trả lời câu hỏi: nếu sinh viên nam và nữ có chỉ số IQ giống nhau (giả thuyết đảo), thì xác suất mà kết quả trên xảy ra là bao nhiêu? ?Nói cách khác, đó chính là phương pháp đi tìm trị số P. ?Sau vài phép tính, câu trả lời là P = 0.0009, tức 0.09% [2]. ?Theo thông lệ, nếu trị số P thấp hơn 0.05 (hay 5%) thì nhà nghiên cứu có bằng chứng để bác bỏ giả thuyết đảo. ?Bác bỏ giả thuyết đảo cũng có nghĩa là gián tiếp chấp nhận giả thuyết chính, tức là nữ sinh viên quả thật thông minh hơn nam sinh viên.

? ? ? ? ?Trong thực tế, trị số P có một ảnh hưởng rất lớn đến số phận của một bài báo khoa học. ?Nhiều tập san và nhà khoa học xem một nghiên cứu khoa học với trị số P cao hơn 0.05 là một “kết quả tiêu cực” (“negative result”) và bài báo có thể bị từ chối cho công bố. ?Chính vì thế mà đối với đại đa số nhà khoa học, con số “P < 0.05” đã trở thành một cái “giấy thông hành” để công bố kết quả nghiên cứu. ?Nếu kết quả với P < 0.05, bài báo có cơ may xuất hiện trên một tập san nào đó và tác giả có thể sẽ nổi tiếng; nếu kết quả P > 0.05, số phận bài báo và công trình nghiên cứu có cơ may đi vào lãng quên!

? ? ? ? ?Nhưng đứng trên phương diện lí trí và khoa học nghiêm chỉnh, chúng ta có nên đặt tầm quan trọng vào trị số P như thế hay không? ?Theo tôi, câu trả lời là không. ?Trị số P có nhiều vấn đề, và việc phụ thuộc vào nó trong quá khứ (cũng như hiện nay) đã bị rất nhiều người phê phán gay gắt. ?Cái khiếm khuyết số 1 của trị số P là nó thiếu tính logic. ?Thật vậy, nếu chúng ta chịu khó xem xét lại ví dụ trên, chúng ta có thể khái quát tiến trình của một nghiên cứu khoa học (dựa vào trị số P) như sau:

· ? ? ? ? Đề ra một giả thuyết chính (H)
· ? ? ? ? Từ giả thuyết chính, đề ra một giả thuyết đảo (Ho)
· ? ? ? ? Tiến hành thu thập dữ kiện (D)
· ? ? ? ? Phân tích dữ kiện: tính toán xác suất D xảy ra nếu Ho là sự thật. ?Nói theo ngôn ngữ toán xác suất, bước này xác định P(D | Ho).

Vì thế, con số P có nghĩa là xác suất của dữ kiện D xảy ra nếu (nhấn mạnh: “nếu”) giả thuyết đảo Ho là sự thật. ?Như vậy, con số P không trực tiếp cho chúng ta một ý niệm gì về sự thật của giả thuyết chính H; nó chỉ gián tiếp cung cấp bằng chứng để chúng ta chấp nhận giả thuyết chính và bác bỏ giả thuyết đảo.

? ? ? ? ?Cái logic đằng sau của trị số P có thể được hiểu như là một tiến trình chứng minh đảo ngược (proof by contradiction):

· ? ? ? ? Mệnh đề 1: Nếu giả thuyết đảo là sự thật, thì dữ kiện này không thể xảy ra;
· ? ? ? ? Mệnh đề 2: Dữ kiện xảy ra;
· ? ? ? ? Mệnh đề 3 (kết luận): Giả thuyết đảo không thể là sự thật.
? ? ? ?
? ? ? ? Nếu bạn đọc cảm thấy khó hiểu cách lập luận trên, tôi xin lấy thêm một ví dụ trong y khoa để minh họa cho tiến trình này:

· ? ? ? ? Nếu ông Tuấn bị cao huyết áp, thì ông không thể có triệu chứng rụng tóc (hai hiện tượng sinh học này không liên quan với nhau, ít ra là theo kiến thức y khoa hiện nay);
· ? ? ? ? Ông Tuấn bị rụng tóc;
· ? ? ? ? Do đó, ông Tuấn không thể bị cao huyết áp.

Trị số P, do đó, gián tiếp phản ánh xác suất của mệnh đề 3. ?Và đó cũng chính là một khiếm khuyết quan trọng của trị số P, bởi vì con số P nó ước tính mức độ khả dĩ của dữ kiện, chứ không nói cho chúng ta biết mức độ khả dĩ của một giả thuyết. ?Điều này làm cho việc suy luận dựa vào trị số P rất xa rời với thực tế, xa rời với khoa học thực nghiệm. ?Trong khoa học thực nghiệm, điều mà nhà nghiên cứu muốn biết là với dữ kiện mà họ có được, xác suất của giả thuyết chính là bao nhiêu, chứ họ không muốn biết nếu giả thuyết đảo là sự thật thì xác suất của dữ kiện là bao nhiêu. ?Nói cách khác và dùng kí hiệu mô tả trên, nhà nghiên cứu muốn biết P(H | D), chứ không muốn biết P(D | H) hay P(D | Ho). ?

? ? ? ? ?Trị số P, dù cực kì thông dụng trong nghiên cứu khoa học, không phải là một phán xét cuối cùng của một công trình nghiên cứu hay một giả thuyết. ?Chúng ta không nên quả phụ thuộc vào con số này. ?Vấn đề quan trọng là làm sao để ước tính mức độ khả dĩ của một giả thuyết một khi có dữ kiện thật trong tay, P(H | D). ?Trong bài kế tiếp, tôi sẽ bàn về một phương pháp tính P(H | D).

Chú thích:

[1] Wulff HR, Andersen B, Brandenhoff P, Guttler F. What do doctors know about statistics? ?Statistics in Medicine 1987; 6:3-10.

[2] Nghiệm toán t có thể được mô tả như sau. ?Trước hết, mức độ khác biệt trung bình giữa hai nhóm nam và nữ là d = 140 – 130 = 10 điểm. ?Phương sai (variance) của d là tổng phương sai của nhóm nam và nhóm nữ: var(d) = var(nam) + var(nữ) = 20^2 + 22^2 = 884. ?Do đó, độ lệch chuẩn (standard deviation) của d là: SD(d) = = 29,73 điểm. ?Từ đó, nghiệm toán t là: t = 10 / (29.73/ ) = 3,36. ?Trị số P của t=3,36 là 0.0009. ?

Các phép tính trên đây có thể tiến hành trực tuyến tại các website như http://graphpad.com/quickcalcs/ttest1.cfm.
 

Facebook

Thống kê diễn đàn

Threads
12,995
Messages
72,869
Members
45,065
Latest member
Go88aa
Back
Top