Đây là bài chia sẻ của GS. Nguyễn Văn Tuấn qua Facebook, một nhà khoa học nổi tiếng hiện đang sống và làm việc tại Úc. Ông đó đóng góp lớn cho các nghiên cứu về các thống kê y khoa và có nhiều bài giảng về kỹ năng dành cho các nhà khoa học trẻ.
Thỉnh thoảng, tôi vẫn nhận được email hỏi cách đọc một bài báo khoa học như thế nào. Đọc phần nào trước, và cần có kĩ năng gì để lĩnh hội nội dung của một bài báo khoa học. Tôi nghĩ câu trả lời tuỳ thuộc vào vai trò của người đọc, là đọc tham khảo hay vai trò của editor của tập san. Trong cái note này tôi chỉ chia sẻ kinh nghiệm cá nhân, có nghĩa là từ vai trò của người đọc để tham khảo.
Trong vai trò người đọc, tôi thường bắt đầu rất nhanh với tựa đề bài báo và sau đó đọc phần abstract (bản tóm tắt). Tựa đề bài báo, nếu được soạn thảo có suy nghĩ (nói theo tiếng Anh là “thoughtful”), thì có thể chuyển tải cái thông điệp chính của bài báo. Nhưng cũng không chắc lắm, vì một số tác giả có xu hướng đặt tựa đề trung dung, không nói lên cái thông điệp nào cả. Cũng có tác giả đặt tựa đề một cách giật gân, không nhất thiết phải tương đồng và nhất quán với dữ liệu thật.
Do đó, sau phần tựa đề, tôi phải đọc qua phần abstract. Abstract là một “bức ảnh” của bài báo khoa học, hay cũng có thể xem là một phiên bản thu gọn của bài báo. Nếu abstract viết theo thể có tiêu đề theo cấu trúc (như background, aim, methods, results, và conclusion) thì rất dễ theo dõi. Nhưng có nhiều tập san thì yêu cầu tác giả viết abstract theo dạng không có tiêu đề, và trong trường hợp này thì hơi khó theo dõi. Nhưng dù là ở dạng nào thì thời gian đọc abstract cũng chỉ 10 phút là cao nhất. Vì thế, nhất định phải đọc abstract trước. Vừa đọc vừa ghi ra những con số cụ thể, và so sánh với phần kết luận xem có nhất quán hay không. Có một số tác giả viết phần kết luận hơi “chênh” với dữ liệu thực tế. Chúng ta, người đọc, phải quyết định tin hay không tin vào kết luận dựa trên dữ liệu thật, chứ không phải dựa trên câu chữ của tác giả.
Sau phần abstract, tôi sẽ đọc các bảng số liệu, biểu đồ, hình ảnh (nếu có) trong bài báo. Bảng số liệu và biểu đồ là “trái tim” của bài báo khoa học. Tác giả có thể dùng chữ hoa mĩ, vặn vẹo từ ngữ, nhưng không thể nào vặn vẹo được dữ liệu. Nếu tác giả là người có kinh nghiệm tốt, thì mỗi biểu đồ và mỗi bảng số liệu đều nói lên một điểm. Chỉ cần nhìn vào một bảng số liệu hay một biểu đồ được thiết kế tốt, người đọc có thể biết được một thông điệp. Sau khi “lắp ráp” các thông điệp từ các bảng biểu, người đọc đã có một câu chuyện mà tác giả muốn chuyển tải đến người đọc.
Thỉnh thoảng, tôi viết ra những số liệu quan trọng, và nếu cần thiết tôi sẽ tự mình phân tích lại. Một số bài báo trình bày dữ liệu rõ ràng giúp cho người đọc có thể tự mình “đọc” bằng cách phân tích lại. Tuy đại đa số bài báo tác giả phân tích đúng, nhưng cũng có vài trường hợp mà kết quả của tôi không phù hợp với kết quả tác giả báo cáo, và những ca này làm tôi phải suy nghĩ và đặt câu hỏi tại sao. Có thể tác giả hiệu chỉnh mà tôi không có dữ liệu để làm, và như thế tôi có thể biết thêm một cách diễn giải khác. Nhưng nói chung, rất cần viết xuống những dữ liệu quan trọng để … nghiền ngẫm.
Sau khi đọc xong bảng biểu, tôi sẽ chú ý đến chi tiết trong phần Methods (phương pháp). Phần phương pháp có thể xem như cơ chế của bài báo khoa học. Trong phần này, tôi chú ý đến phương pháp đo lường nhất, vì giá trị khoa học của công trình nghiên cứu là ở phần này. Phẩm chất của đo lường chính là yếu tố quyết định tính hợp lí nội tại của bài báo. Sau đó, tôi sẽ xem cách họ chọn đối tượng nghiên cứu theo tiêu chuẩn nào, vì phần này liên quan đến khái niệm “hợp lí ngoại tại”. Tôi không quan tâm mấy đến cái gọi là “tính đại diện”, nhưng tôi rất quan tâm đến tính “thông minh” trong thiết kế nghiên cứu. Một phần khác cũng quan trọng không kém là phương pháp phân tích dữ liệu, vì phần này quyết định một phần cái thông điệp của bài báo. Phương pháp phân tích là gì, biến outcome là gì, biến tiên lượng là gì, có hiệu chỉnh cho yếu tố nhiễu hay không, nếu có thì dùng phương pháp gì, dùng nhu liệu nào cho tính toán (nếu dùng Excel là xem như vứt đi, vì thiếu tính chuyên nghiệp). Đôi khi, chỉ cần đọc qua phần phương pháp và phân tích dữ liệu là biết đẳng cấp của tác giả ở đâu.
Sau cùng, tôi sẽ đọc phần Discussion (bàn luận). Thật ra, đọc phần này chỉ để biết quan điểm của tác giả là gì, và tìm những tài liệu tham khảo liên quan. Phần bàn luận phản ảnh “tri thức” của tác giả thâm hậu cỡ nào; tác giả có kiến thức tốt viết phần này đọc rất hay, còn tác giả xoàng thì chỉ đọc vài dòng là biết họ chẳng có ý gì. Những bài báo quan trọng từ các labo nghiên cứu có tiếng thường được viết rất hay, và đây cũng là cách để tôi học cách viết, thậm chí học những từ ngữ hay của họ. Chú ý đến ý nghĩa của kết quả, và cách tác giả bàn về cơ chế của ảnh hưởng. Nếu phần bàn luận được viết tốt, phải có vài dòng đề cập đến những điểm mạnh và điểm yếu của nghiên cứu.
Đọc xong bài báo, người đọc phải trả lời 3 câu hỏi sau đây:
- Câu hỏi 1: tôi có thể tin vào kết quả của bài báo này? Tin vào thông điệp nào?
- Câu hỏi 2: nếu tin, tôi phải làm gì? có cần thay đổi thực hành?
- Câu hỏi 3: tôi học được gì từ bài báo này, và nếu tôi phải làm lại, tôi sẽ làm như thế nào?
Câu hỏi thứ nhất có thể đánh giá qua trị số P, qua khoảng tin cậy 95%, và sự nhất quán giữa các kết quả. Nếu các kết quả nghiên cứu đều nói lên một “câu chuyện” nhất quán với nhiều nghiên cứu trước đây thì đó là kết quả đáng tin cậy. Đây chính là tính đại diện trong khoa học.
Câu hỏi thứ hai rất quan trọng, vì có nhiều công trình tuy kết quả tốt, nhưng chẳng gây tác động gì đáng kể. Nếu một can thiệp chỉ giảm nguy cơ gãy xương khoảng 5% (chỉ là ví dụ) thì mức độ ảnh hưởng quá nhỏ, khó có thể thay đổi thực hành lâm sàng (dù có ý nghĩa khoa học).
Câu hỏi thứ ba mang tính khoa học và phương pháp. Nếu phương pháp mà tác giả sử dụng tốt thì câu hỏi đặt ra là có phương pháp nào khác, có cách tiếp cận nào khác tốt hơn, rẻ tiền hơn, mà có thể cho ra kết quả với chất lượng cao. Một câu hỏi khác là nếu với dữ liệu trình bày, chúng ta có thể phân tích lại bằng một phương pháp khác (như Bayes chẳng hạn) và kết quả có làm thay đổi kết luận của tác giả.
Nói tóm lại, đọc một bài báo khoa học vừa là một nghệ thuật mà cũng là một khoa học. Nghệ thuật ở chỗ đặt thông điệp vào bối cảnh chung, cái đẹp của dữ liệu, và tri thức mới. Khoa học là so sánh và tính tái lập của kết quả nghiên cứu. Cũng như “văn ôn võ luyện”, đọc bài báo khoa học là một thói quen cần phải được luyện tập thường xuyên, cố gắng mỗi tuần phải đọc ít nhất một bài báo quan trọng và rút ra ít nhất một thông tin mới.
—-
Ghi thêm: Một ví dụ tiêu biểu về đọc báo khoa học là bài tôi mới đọc hồi tuần vừa qua. Đó là bài trên JAMA về công trình RCT đánh giá ảnh hưởng của bổ sung calcium và vitamin D (viết tắt CaD) xem có giảm nguy cơ ung thư không (1). Đầu tiên tôi thấy tựa đề nằm trong radar quan tâm của mình, vì tôi đang nghiên cứu về CaD ở bệnh nhân loãng xuơng. Yếu tố thứ hai tôi quan tâm là bài báo được công bố trên JAMA và từ một nhóm tác giả tôi biết.
Đọc bản abstract, tôi chú ý ngay đến đoạn tác giả kết luận “among healthy postmenopausal older women … supplementation with vitamin D3 and calcium compared with placebo did not result in a significantly lower risk of all-type cancer at 4 years.” (Tác giả kết luận rằng bổ sung CaD sau 4 năm không làm giảm đáng kể nguy cơ ung thư ở phụ nữ sau mãn kinh). Nhưng tôi rất ngờ kết luận này. Lí do là vì trong bản abstract, tác giả báo cáo rằng bổ sung CaD giảm nguy cơ ung thư đến 30%. Nhưng vì tỉ số nguy cơ [relative risk] có khoảng tin cậy 95% dao động từ 0.47 đến 1.02, và trị số P = 0.06, nên tác giả nói rằng “not significantly”!
Đây là một kết luận tôi hay gọi là nô lệ vào thống kê. Chỉ vì P cao hơn 0.05 chỉ có 1% mà tác giả kết luận rằng không có ảnh hưởng! Trong khi đó số liệu cho thấy rõ ràng rằng bổ sung CaD có thể làm giảm nguy cơ ung thư đến 53%, mặc dù có một xác suất nhỏ là CaD có thể tăng nguy cơ 2%. Nhưng nhìn chung, lợi vẫn cao hơn “hại” rất rất nhiều.
Do đó, bước kế tiếp là tôi đọc các bảng số liệu và biểu đồ. Biểu đồ quan trọng nhất cho thấy quả thật bổ sung CaD giảm nguy cơ ung thư ngay từ năm thứ hai. Nhưng vì con số ca ung thư còn thấp, nên các phân tích thống kê có thể cho ra kết quả thiếu nhất quán. Đọc kĩ hơn nữa trong phần kết quả, tôi phát hiện hai số liệu quan trọng:
- khi giới hạn phân tích trong nhóm người tuân thủ theo protocol thì kết quả có ý nghĩa thống kê (P = 0.046), và CaD giảm ung thư khoảng 35%.
- bệnh nhân ung thư có nồng độ vitamin D3 thấp hơn nhóm không bị ung thư.
Cả hai sự thật này rất nhất quán với giả thuyết về ảnh hưởng của CaD đến ung thư.
Tôi không cần đọc phần bàn luận vì một khi tác giả đã kết luận như thế, thì họ sẽ viết bàn luận theo kiểu định hướng. Vả lại, bàn luận là phần mang tính chủ quan, tác giả có quyền suy luận và viết theo ý của họ. Nhưng để trả lời 3 câu hỏi trên, tôi đi đến kết luận:
- Câu hỏi 1: tôi có thể tin vào kết quả của bài báo này? Tin. Đây là nghiên cứu RCT, có giá trị khoa học khá cao.
- Câu hỏi 2: nếu tin, tôi phải làm gì? Trước mắt thì không làm gì cả. Nhưng rõ ràng tôi có chứng cứ để tin rằng bổ sung CaD là có ích cho người cao tuổi.
- Câu hỏi 3: tôi học được gì từ bài báo này? Tôi học cái không nên làm, đó là kết luận chưa nhất quán với kết quả nghiên cứu.
Thế là chúng tôi định viết một bình luận gửi cho JAMA. Bài bình luận là sẽ nói rằng chúng tôi (tôi và Bs Thạch) có một cách diễn giải khác, và hi vọng là tác giả sẽ thích. Cách hiểu của chúng tôi là: bổ sung CaD có thể làm giảm ung thư, nhưng mức độ ảnh hưởng tương đối thấp.
—–
(1) Effect of vitamin D and calcium supplementation on cancer incidence in older women: a randomized clinical trial. JAMA 2017;317:1234-1243.
Tác giả: GS Nguyễn Văn Tuấn