Mean +/- SD or Mean +/-SEM?

Trịnh Thành Trung · Feb 10, 2009

Các bác cho em hỏi, trong khi muốn so sánh giá trị mean của 2 dãy số liệu. Lúc nào ta cần trình bày giá trị của Mean +/- SD? lúc nào or Mean +/-SEM?, or even Mean +/- range? hay thậm chí hơn nữa là Mean +/-95% CI.

Em đọc trên các publication, lắm lúc không hiểu được lắm. Cám ơn các bác.

AdaptivePlasticity · Feb 10, 2009

Trịnh Thành Trung said:
Các bác cho em hỏi, trong khi muốn so sánh giá trị mean của 2 dãy số liệu. Lúc nào ta cần trình bày giá trị của Mean +/- SD? lúc nào or Mean +/-SEM?, or even Mean +/- range? hay thậm chí hơn nữa là Mean +/-95% CI.

Em đọc trên các publication, lắm lúc không hiểu được lắm. Cám ơn các bác.

Hihihi cái này dùng như ăn cơm nhưng cũng chả hiểu rõ về nó lắm. Bác nào đọc lý thuyết và post vào cho anh em ăn ngon miệng hơn thì cám ơn nhiều.
Tiện thể các bác cứ khởi xướng nhiều bio-statistics cho anh em ăn ngon miệng hơn khi chế biến các recipe nhé.

Nguyễn Đôn · Feb 10, 2009

Trịnh Thành Trung said:
Các bác cho em hỏi, trong khi muốn so sánh giá trị mean của 2 dãy số liệu. Lúc nào ta cần trình bày giá trị của Mean +/- SD? lúc nào or Mean +/-SEM?, or even Mean +/- range? hay thậm chí hơn nữa là Mean +/-95% CI.

Em đọc trên các publication, lắm lúc không hiểu được lắm. Cám ơn các bác.

Bạn có thể dùng cả hai: độ lệch chuẩn (SD) hay sai số chuẩn (SEM).
SEM là kết quả chia SD cho căn bậc hai của cỡ mẫu

, do đó SEM sẽ có kết quả nhỏ hơn SD.

- Nếu bạn muốn nhấn mạnh độ tin cậy đối với giá trị trung bình tính được thì dùng: giá trị trung bình +/- sai số chuẩn.
- Nếu bạn muốn nhấn mạnh mức phân bố của mẫu thì dùng: giá trị trung bình +/- độ lệch chuẩn.

Dùng cái nào cũng được, nhưng người ta thường dùng độ lệch chuẩn (SD) hơn. Vì mọi người ngại rằng dùng sai số chuẩn (SEM) sẽ phần nào "giấu" bớt biên độ dao động của số liệu.

Trịnh Thành Trung · Feb 10, 2009

Nguyễn Đôn said:
Bạn có thể dùng cả hai: độ lệch chuẩn (SD) hay sai số chuẩn (SEM).
SEM là kết quả chia SD cho căn bậc hai của cỡ mẫu , do đó SEM sẽ có kết quả nhỏ hơn SD.

- Nếu bạn muốn nhấn mạnh độ tin cậy đối với giá trị trung bình tính được thì dùng: giá trị trung bình +/- sai số chuẩn.
- Nếu bạn muốn nhấn mạnh mức phân bố của mẫu thì dùng: giá trị trung bình +/- độ lệch chuẩn.

Dùng cái nào cũng được, nhưng người ta thường dùng độ lệch chuẩn (SD) hơn. Vì mọi người ngại rằng dùng sai số chuẩn (SEM) sẽ phần nào "giấu" bớt biên độ dao động của số liệu.

Cám ơn Đôn, tức là không có sự ràng buộc rõ ràng nào về kiểu và dạng phân phối của mẫu, ta cứ thích SD hay SEM là dùng?

Nguyễn Ngọc Lương · Feb 11, 2009

Không đồng ý với cách phát biểu chủ quan của bạn Đôn.
Mặc dù có sự sử dụng một cách bừa bãi SD và SEM, trong sinh học, SEM nên được sử dụng thay vì SD. SD chỉ phản ánh sự phân bố của số liệu. Nói cách khác nó là một thông số về thống kê mô tả (M cộng/trừ 2xSE = 95% khoảng số liệu). Trong khi đó SEM là một thông số về thống kê suy diễn, cái mà sinh học và các ngành khoa học thực nghiệm cần (một kết luận nào đó từ các số liệu). Ví dụ muốn biết giá trị thực sự của mean (đại diện cho một population) nằm trong khoảng nào thì người ta sẽ sử dụng công thức M cộng/trừ txSEM, với t phụ thuộc độ lớn của mẫu.
Có hồi tôi ngồi cãi nhau với một cậu bạn làm về xác suất về cái này. Xem ra VN vẫn cứ tương SD vào mean mà không ghi rõ, và cũng không hiểu nó là cái gì.
Một lạm dụng "outrage" nữa của thống kê là hình như các bạn làm nuôi cấy mô cứ nhầm lẫn giữa replica và independent experiment. Theo nguyên tắc không được đưa M và SE hay SD vào thông số mô tả replica. Nói cách khác cái giá trị n sử dụng một cách chặt chẽ phải là số lần thí nghiệm được lặp lại độc lập (ví dụ một người khác lặp lại, một lô mẫu khác, vào một ngày khác...v.v).
Một "tiêu chuẩn vàng" là replica = 3 cũng là một lạm dụng khác của thống kê. Với số lần lặp là 3 thì nói chung p < 0,001 cũng chưa chắc đã có ý nghĩa nhiều lắm. Chưa kể sự nhầm lẫn giữa replica và independent experiments.
Một cái nữa là các cái bảng số liệu đưa vào luận văn hay đồ án tốt nghiệp cũng rất phản cảm. Thật ra chỉ cần đưa đồ thị và chú thích đầy đủ là người ta có thể phát hiện anh suy luận đúng hay sai ngay tức khắc. Số liệu nên đưa vào phần phụ lục. Trong đồ thị thì các thanh sai số (error bar) cũng thường được các cô cậu tú quy cho SD cả. Vậy mà kết luận đều sử dụng thống kê suy diễn.

Nguyễn Xuân Hưng · Feb 11, 2009

Nguyễn Ngọc Lương said:
Không đồng ý với cách phát biểu chủ quan của bạn Đôn.
Mặc dù có sự sử dụng một cách bừa bãi SD và SEM, trong sinh học, SEM nên được sử dụng thay vì SD. SD chỉ phản ánh sự phân bố của số liệu. Nói cách khác nó là một thông số về thống kê mô tả (M cộng/trừ 2xSE = 95% khoảng số liệu). Trong khi đó SEM là một thông số về thống kê suy diễn, cái mà sinh học và các ngành khoa học thực nghiệm cần (một kết luận nào đó từ các số liệu). Ví dụ muốn biết giá trị thực sự của mean (đại diện cho một population) nằm trong khoảng nào thì người ta sẽ sử dụng công thức M cộng/trừ txSEM, với t phụ thuộc độ lớn của mẫu.
Có hồi tôi ngồi cãi nhau với một cậu bạn làm về xác suất về cái này. Xem ra VN vẫn cứ tương SD vào mean mà không ghi rõ, và cũng không hiểu nó là cái gì.
Một lạm dụng "outrage" nữa của thống kê là hình như các bạn làm nuôi cấy mô cứ nhầm lẫn giữa replica và independent experiment. Theo nguyên tắc không được đưa M và SE hay SD vào thông số mô tả replica. Nói cách khác cái giá trị n sử dụng một cách chặt chẽ phải là số lần thí nghiệm được lặp lại độc lập (ví dụ một người khác lặp lại, một lô mẫu khác, vào một ngày khác...v.v).
Một "tiêu chuẩn vàng" là replica = 3 cũng là một lạm dụng khác của thống kê. Với số lần lặp là 3 thì nói chung p < 0,001 cũng chưa chắc đã có ý nghĩa nhiều lắm. Chưa kể sự nhầm lẫn giữa replica và independent experiments.
Một cái nữa là các cái bảng số liệu đưa vào luận văn hay đồ án tốt nghiệp cũng rất phản cảm. Thật ra chỉ cần đưa đồ thị và chú thích đầy đủ là người ta có thể phát hiện anh suy luận đúng hay sai ngay tức khắc. Số liệu nên đưa vào phần phụ lục. Trong đồ thị thì các thanh sai số (error bar) cũng thường được các cô cậu tú quy cho SD cả. Vậy mà kết luận đều sử dụng thống kê suy diễn.

Có lần đọc 1 bài nature paper, dưới bảng số liệu tác giả ghi rằng data is represent from one experiment :eek:

. Hiện giờ với man power, nature paper có nhiều bài thể hiện đồ thị, bảng biểu xử lý thống kê rất hài.

Nguyễn Ngọc Lương · Feb 11, 2009

Không phải đâu Hưng ạ. Data trình bày trong bài báo có thể là đại diện của một trong số các thí nghiệm độc lập. Nhưng như vậy thì không được đưa mean hay SD hay SE hay error bar gì cả. Cái này báo vẫn chấp nhận. Có khi số liệu các thí nghiệm độc lập nó đưa vào phụ chú, hoặc kiểu data not presented here. Tầm nature nói chung khó lọt kiểu đó lắm.
Gửi các bạn một bài viết chi tiết về Error bar và rules how to use it:
http://rapidshare.com/files/196791288/Error_bar_in_experimental_biology.pdf.html

Nguyễn Xuân Hưng · Feb 11, 2009

Nguyễn Ngọc Lương said:
Không phải đâu Hưng ạ. Data trình bày trong bài báo có thể là đại diện của một trong số các thí nghiệm độc lập. Nhưng như vậy thì không được đưa mean hay SD hay SE hay error bar gì cả. Cái này báo vẫn chấp nhận. Có khi số liệu các thí nghiệm độc lập nó đưa vào phụ chú, hoặc kiểu data not presented here. Tầm nature nói chung khó lọt kiểu đó lắm.
Gửi các bạn một bài viết chi tiết về Error bar và rules how to use it:
http://rapidshare.com/files/196791288/Error_bar_in_experimental_biology.pdf.html

Không mà cái vụ không đưa mean hay SD hay error bar gì cả không vấn đề gì lắm. Nhưng thường phải data is represent from two (or three) experiments chứ from one thì :botay:

Trịnh Thành Trung · Feb 11, 2009

Nguyễn Xuân Hưng said:
Không mà cái vụ không đưa mean hay SD hay error bar gì cả không vấn đề gì lắm. Nhưng thường phải data is represent from two (or three) experiments chứ from one thì

Check carefully in the 'materials and methods' part to know how many replications they did in one independent experiment? Otherwise check what kind of data they had (continuous or catergory data) or you might confuse SD, SEM with CI since nobody is so stupid as your thought.

Trịnh Thành Trung · Feb 11, 2009

Nguyễn Ngọc Lương said:
Không đồng ý với cách phát biểu chủ quan của bạn Đôn.
Mặc dù có sự sử dụng một cách bừa bãi SD và SEM, trong sinh học, SEM nên được sử dụng thay vì SD. SD chỉ phản ánh sự phân bố của số liệu. Nói cách khác nó là một thông số về thống kê mô tả (M cộng/trừ 2xSE = 95% khoảng số liệu). Trong khi đó SEM là một thông số về thống kê suy diễn, cái mà sinh học và các ngành khoa học thực nghiệm cần (một kết luận nào đó từ các số liệu). Ví dụ muốn biết giá trị thực sự của mean (đại diện cho một population) nằm trong khoảng nào thì người ta sẽ sử dụng công thức M cộng/trừ txSEM, với t phụ thuộc độ lớn của mẫu.
Có hồi tôi ngồi cãi nhau với một cậu bạn làm về xác suất về cái này. Xem ra VN vẫn cứ tương SD vào mean mà không ghi rõ, và cũng không hiểu nó là cái gì.
Một lạm dụng "outrage" nữa của thống kê là hình như các bạn làm nuôi cấy mô cứ nhầm lẫn giữa replica và independent experiment. Theo nguyên tắc không được đưa M và SE hay SD vào thông số mô tả replica. Nói cách khác cái giá trị n sử dụng một cách chặt chẽ phải là số lần thí nghiệm được lặp lại độc lập (ví dụ một người khác lặp lại, một lô mẫu khác, vào một ngày khác...v.v).
Một "tiêu chuẩn vàng" là replica = 3 cũng là một lạm dụng khác của thống kê. Với số lần lặp là 3 thì nói chung p < 0,001 cũng chưa chắc đã có ý nghĩa nhiều lắm. Chưa kể sự nhầm lẫn giữa replica và independent experiments.
Một cái nữa là các cái bảng số liệu đưa vào luận văn hay đồ án tốt nghiệp cũng rất phản cảm. Thật ra chỉ cần đưa đồ thị và chú thích đầy đủ là người ta có thể phát hiện anh suy luận đúng hay sai ngay tức khắc. Số liệu nên đưa vào phần phụ lục. Trong đồ thị thì các thanh sai số (error bar) cũng thường được các cô cậu tú quy cho SD cả. Vậy mà kết luận đều sử dụng thống kê suy diễn.

Công nhận với bác Lương là buồn cho cái xác suất thống kê đang sử dụng của đại đa số sinh viên ở Việt Nam. Âu nó cũng là cái Bát bởi vì chính người sửa luận văn cho sinh viên đôi khi cũng chẳng biết SD or SEM là cái con củ khoai lang hay khoai tây gì.

Bác giải thích đúng về SD và SEM nhưng có vẻ hơi loằng quằng khiến các bạn khó hiểu. Cứ hiểu đại khái theo tiếng Anh như này có được không?

SD (Standard Deviation) là độ biến thiên của mẫu.

SEM (Standard Erros of Mean) là độ biến thiên của Mean (mean tiếng Việt có nghĩa là gì các bác nhỉ? mean hoàn toàn khác với medium ' số trung bình cộng')

SEM luôn luôn nhỏ hơn SD.

Nguyễn Đôn · Feb 12, 2009

Nguyễn Ngọc Lương said:
Không đồng ý với cách phát biểu chủ quan của bạn Đôn.
Mặc dù có sự sử dụng một cách bừa bãi SD và SEM, trong sinh học, SEM nên được sử dụng thay vì SD. SD chỉ phản ánh sự phân bố của số liệu. Nói cách khác nó là một thông số về thống kê mô tả (M cộng/trừ 2xSE = 95% khoảng số liệu). Trong khi đó SEM là một thông số về thống kê suy diễn, cái mà sinh học và các ngành khoa học thực nghiệm cần (một kết luận nào đó từ các số liệu). Ví dụ muốn biết giá trị thực sự của mean (đại diện cho một population) nằm trong khoảng nào thì người ta sẽ sử dụng công thức M cộng/trừ txSEM, với t phụ thuộc độ lớn của mẫu.
Có hồi tôi ngồi cãi nhau với một cậu bạn làm về xác suất về cái này. Xem ra VN vẫn cứ tương SD vào mean mà không ghi rõ, và cũng không hiểu nó là cái gì.

Tôi hơi chủ quan khi nói rằng người ta dùng độ lệch chuẩn (SD) nhiều hơn sai số chuẩn (SEM) (chắc tại vì thấy nhiều bài báo sử dụng SD). Quả thật là nhiều người dùng SD và SEM "bừa bãi". Tuy nhiên, trong sinh học, người ta có thể dùng cả hai loại này để biểu diễn số liệu, mỗi thứ đều có lý do của nó.

Dùng độ lệch chuẩn (SD).
- Từ độ lệch chuẩn, người đọc sẽ biết về mức phân bố của mẫu. Anh Lương đã giải thích sự phân bố số liệu (2/3 trong khoảng +/- SD, và 95% trong khoảng +/- 2SD). Từ đây, người ta cũng biết được một số liệu bất kỳ nào đó là bình thường (trong các khoảng lệch chuẩn) hay bất thường (nằm ngoài các khoảng lệch chuẩn) hay không.
- Quan trọng hơn, người ta phải dùng độ lệch chuẩn (SD) để tính độ khác biệt (effect size). Khi so sánh hai giá trị trung bình của hai nhóm, người ta tính hiệu của hai giá trị này, sau đó lấy hiệu này chia cho SD của nhóm 1, hoặc SD của nhóm 2, hoặc SD chung để tính độ khác biệt (EF = effect size).
+ EF lớn hơn hoặc bằng 0.8: LỚN
+ EF từ 0.2 trở xuống: NHỎ
+ Khoảng EF còn lại là TRUNG BÌNH.
Bệnh viện đa khoa Hoàn Mỹ tại TP. Hồ Chí Minh có một ví dụ về tầm quan trọng của độ khác biệt trong đường dẫn dưới đây:
http://hoanmysaigon.com/index.php?option=com_content&task=view&id=915&Itemid=123.

Dùng sai số chuẩn (SEM)
Người ta thường dùng sai số chuẩn (SEM) trong thống kê suy luận như anh Lương đã nói. Khi muốn thể hiện độ chính xác của giá trị trung bình (mean), người ta biểu diễn SEM.
Tuy nhiên, không phải lúc nào sai số chuẩn cũng được "ưa chuộng".
Trong sinh học, ta thường phải so sánh các giá trị trung bình với nhau, nhiều người thường dùng SEM để so sánh. Khi biểu diễn trên đồ thị:
- Nếu thanh SEM của hai giá trị có đoạn chồng lấp: khác biệt giữa hai giá trị trung bình không có ý nghĩa.
- Nếu thanh SEM của hai giá trị không chồng lấp: khác biệt giữa hai giá trị trung bình có thể có ý nghĩa (mà cũng có thể không).
Như vậy, để biết khác biệt có ý nghĩa hay không, ta phải tính toán thống kê: thể hiện giá trị p (p-value), hoặc biểu diễn kiểm nghiệm t (t-test), v.v ... còn chỉ nhìn vào thanh SEM thì cũng không nói chắc chắn được gì.

Tóm lại, tuỳ theo "lý luận" và mục đích của người viết báo cáo mà họ sử dụng độ lệch chuẩn (SD) hay sai số chuẩn (SEM). Dù sử dụng SD hay SEM thì người viết cũng phải ghi chú rõ ràng trong các bảng biểu của họ.

:mrgreen:

Vì không gõ được công thức tính trong này nên tôi phải ghi cách tính độ khác biệt (effect size) hơi dài dòng lôi thôi.

Trịnh Thành Trung said:
mean tiếng Việt có nghĩa là gì các bác nhỉ? mean hoàn toàn khác với medium ' số trung bình cộng'

"Mean" chính là giá trị trung bình cộng.
"Medium" --> Chắc bạn Trung muốn nói "median"?! "Median" là số trung bình hoặc số trung tâm của một tập hợp.

AdaptivePlasticity · Feb 12, 2009

Nguyễn Ngọc Lương said:
Không phải đâu Hưng ạ. Data trình bày trong bài báo có thể là đại diện của một trong số các thí nghiệm độc lập. Nhưng như vậy thì không được đưa mean hay SD hay SE hay error bar gì cả. Cái này báo vẫn chấp nhận. Có khi số liệu các thí nghiệm độc lập nó đưa vào phụ chú, hoặc kiểu data not presented here. Tầm nature nói chung khó lọt kiểu đó lắm.
Gửi các bạn một bài viết chi tiết về Error bar và rules how to use it:
http://rapidshare.com/files/196791288/Error_bar_in_experimental_biology.pdf.html

Bác Lương có thể nói đúng chỗ này. Cần phải hiểu ý sâu xa của chữ representative ở chỗ này, mà tôi đang băn khoăn chắc là không có chữ represent như bạn nào đó đã post ở trên trong câu data is represent from one experiment. Có thể data mà tác giả bài báo show trong bảng đó là đại diện, tức pattern của nó ổn định qua các thí nghiệm độc lập, thì họ chỉ cần show 1 cái đại diện thôi, còn các cái khác xin mời bạn đọc xem phụ lục hay supporting materials chẳng hạn. Phải cố hiểu bản chất của mỗi từ quan trọng mới hiểu ý sâu xa của người ta được. Đừng vội xếp mình cùng hàng cao nhân.
PS mà cái thâm thuý nữa của tác giả là họ dùng chữ one experiment chứ không an experiment, vì khi đã có one thì người đọc sẽ nghĩ đến two, three; chứ an thì chỉ là an mà thôi. Mà đã có two và three thì còn gì phải băn khoăn về cách viết cao tay của người ta nữa nhỉ.

Nguyễn Xuân Hưng · Feb 12, 2009

http://rapidshare.com/files/197051588/ni.1655.pdf.html

Bài báo đây. Đây chỉ là 1 bài mò lại trong máy thôi, còn nhiều lắm. Thú thật là tôi chả biết gì về thống kê. Nhưng nghe các bác giải thích theo kiểu

PS mà cái thâm thuý nữa của tác giả là họ dùng chữ one experiment chứ không an experiment, vì khi đã có one thì người đọc sẽ nghĩ đến two, three; chứ an thì chỉ là an mà thôi. Mà đã có two và three thì còn gì phải băn khoăn về cách viết cao tay của người ta nữa nhỉ.

thì cũng chịu thôi.

Figure 1: Data are representative of three independent experiments with ten mice per cohort in each.

Figure 2: Images (c,d) are representative of two experiments with at least five wild-type mice.

Figure 3: Data are representative of three independent experiments.

Figure 4: Data are representative of one experiment (n >= 9 mice per cohort).

Figure 5: Data are representative of two experiments with at least five
mice per cohort (a–e) or of one experiment with eight mice (f), at least six mice (g) or sixteen mice (h–k) per cohort (mean and s.e.m., i–k).

Figure 6: Data are representative of one experiment (mean and s.e.m. of five or more mice per cohort).

Figure 7: Data are representative of one experiment with three mice per
cohort (a), 12 or more mice per cohort (b–d), seven or more mice per cohort (e–g) or five or more mice per cohort (h,i; mean and s.e.m., c,d,f,h,i).

FACS data, one experiment with 3 mice:mygod:

HoLan · Feb 12, 2009

Có vẻ mọi người đã hiểu ý nghĩa của độ lệch chuẩn (SD), tức là độ dao động của mẫu. Tuy nhiên tôi chưa thấy ai nói rỏ thế nào là sai số chuẩn (SEM) và làm sao để phân biệt và dùng đúng SD hay SEM.

Đôn và các bạn có nói rằng SEM là giá trị của SD chia cho căn bậc hai của số mẩu, do đó SEM sẽ nhỏ hơn SD. Chính vì giá trị nhỏ hơn này, dùng SEM thay vì SD sẽ cho cảm giác độ dao động của mẩu ít hơn, chính xác hơn. Những cách dùng này có thể là gian lận hay đơn giản là không hiểu rỏ SEM.

Bác Lương thì nói rằng: "Mặc dù có sự sử dụng một cách bừa bãi SD và SEM, trong sinh học, SEM nên được sử dụng thay vì SD. SD chỉ phản ánh sự phân bố của số liệu. Nói cách khác nó là một thông số về thống kê mô tả (M cộng/trừ 2xSE = 95% khoảng số liệu). Trong khi đó SEM là một thông số về thống kê suy diễn, cái mà sinh học và các ngành khoa học thực nghiệm cần (một kết luận nào đó từ các số liệu). Ví dụ muốn biết giá trị thực sự của mean (đại diện cho một population) nằm trong khoảng nào thì người ta sẽ sử dụng công thức M cộng/trừ txSEM, với t phụ thuộc độ lớn của mẫu."

Bác Lương nói đúng tính chất của SEM, một thông số suy diễn, nhưng vẫn chưa nói rỏ SEM dùng trong tình huống nào. Còn nữa, trong công thức trên của bác Lương (M +/- txSEM, với t phụ thuộc độ lớn của mẩu), bác có thể giải thích bằng ví dụ cụ thể thế nào là "t phụ thuộc độ lớn của mẩu"?

Còn Trung thì định nghĩa đơn giản hơn: "SEM (Standard Erros of Mean) là độ biến thiên của Mean". Tôi thì chưa chắc hiểu độ biến thiên của Mean là gì. Không phải lỗi của bạn, rất nhiều người lầm lẫn chổ này tại vì sách viết cũng không rỏ. SEM phải là Standard error of the Means hay Standard deviation of the Means. Vậy, sai số chuẩn (SEM) cho biết độ dao động của CÁC GIÁ TRỊ TRUNG BÌNH. Chú ý số nhiều.

Để hiểu phân biệt cách dùng giữa SD và SEM, ta nên biết cách tính của SEM. (Tôi giả thử các bạn đã biết cách tính SD). Thí dụ, một trại bò (PhD?) có 1 vạn con. Để biết trọng lượng trung bình của đàn bò này người ta không thể nào cân hết cả vạn con mà chỉ có thể chọn lựa một số con, 10 chẳng hạn, một cách ngẩu nhiên để cân. Sau đó lấy giá trị trung bình của 10 con này. Tiếp tục chọn ngẩu nhiên 10 con khác, lấy giá trị trung bình. Tiếp tục làm như vậy nhiều lần người ta sẽ có một tập hợp các giá trị trung bình. Sau đó, để "suy diễn" giá trị trung bình thực của 1 vạn con bò này, người ta tính giá trị trung bình của tập hợp các giá trị trung bình trên rồi tính độ lệch chuẩn (SD) cho phép tính này. Khi đó, độ lệch chuẩn (SD) của các giá trị trung bình sẽ chính là sai số chuẩn (SEM). Vậy theo định nghĩa, SEM là độ lệch chuẩn của các giá trị trung bình (means), chứ không phải là độ lệch chuẩn của mẩu.

Trên thực tế trong các bài báo, người ta ngay cả không có làm theo kiểu đo nhiều lần, mỗi lần 10 mẩu như trên, mà phần lớn là chỉ đo một lần cho 10 mẩu chẳng hạn rồi tính SD cho giá trị trung bình của mẩu. Cách dùng này được chấp nhận. Nhưng khi người ta trở nên nhập nhằng gán SEM cho mẩu thì sai lầm phổ biến này sẽ làm người đọc nghĩ là người viết có thể không hiểu thống kê hay cố tình gian lận.

Hy vọng mọi người theo dỏi được và chú ý cách dùng đúng cho SD và SEM cho dữ kiện của mình.

Hồ Minh Lân

AdaptivePlasticity · Feb 12, 2009

Bác Lân có lẽ đã làm ta rõ SD và SEM. Giờ liên quan mấy cái này tôi có 1 câu sau muốn hỏi các bác một phát. Bác nào giải quyết được khúc mắc này thì tui cảm ơn nhìu.

Giả sử giờ ta có 1000 con bò con (PhD candidate?) của 1 giống bò X, nuôi các bò này trong cùng điều kiện chăn nuôi. Lấy một mẫu đo tốc độ tăng trọng của đàn bò này. Từ đó ta tính được trị giá trung bình và đương nhiên là SD của mẫu. Theo lý htuyết thống kê, SD phản ánh mức độ dispersal hay spread của các cá thể trong mẫu nghiên cứu; vậy thì tại sao không dùng ngay SD để thể hiện mức độ variability (biến dị) về tốc độ tăng trọng của các kiểu gen khác nhau trong quần thể bò mà nhất thiết phải dùng phương sai (Variance, Var, chính là bình phương của SD) để đánh giá mức độ biến dị của đàn bò này?

Trịnh Thành Trung · Feb 12, 2009

Cám ơn Đôn va anh Lân về cách giải thích tận tình. Bác Lân nhà ta chắc chắn là cao thủ về biostatistic rùi. Thật là phúc đức cho các anh em làm nghiên cứu tham gia chơi trong SHVN đây.

Chú Hưng nhà ta xưa nay cứ thấy chê bài báo lọ, tạp chí chai. Giờ mới hiểu vì sao chú chê chúng nó. Chú mắc phải cái lỗi mà bác Lương đã nói ấy. Chú chưa phân biệt được cái khái niệm cơ bản của thống kê về 'replica' 'independent'. www.botoanthan.org.

Nguyễn Ngọc Lương · Feb 12, 2009

Bài của Hưng khó hiểu nhỉ. Hình 1 bảo là 10 con chuột cho Experiment/Control cho mỗi lô thí nghiệm, thế mà chỉ có 9 chấm.
Ở đây 10 con chuột này được đo được xem như n = 10 rồi, vì trường hợp replica vô duyên nói đến ở đây là thằng cha tác giả đi đo mỗi khối u của một con chuột 10 lần chẳng hạn. Việc nó lặp lại thí nghiệm 3 lần càng chuẩn nữa bởi giả sử nó đúng thì xác suất sau 3 lần lặp nó cũng đúng sẽ là 1-0,05x0,05x0,05 = 1-0.000125 (vì nó dùng mức ý nghĩa 0,05)
Trường hợp nó làm thí nghiệm 1 lần với hơn 9 con chuột cũng tạm chấp nhận được. Có lẽ Nature bỏ qua điểm yếu này cho nó vì các kết luận khác khá thuyết phục.
Nhưng các bạn thấy là nó trình bày số liệu theo điểm chứ không phải là mean + error bar. Rất tuân thủ.
Nhưng ở cái FACS nó lặp lại thí nghiệm 1 lần mà để error bar thì nguyên tắc là sai rồi. Ít nhất phải 3 thí nghiệm.
Nói chung thống kê ngày càng bị lạm dụng. Mà một nguyên nhân là cả nhà thống kê lẫn người sử dụng thống kê chẳng ai nắm rõ cái mớ bòng bong này. Chả thế mà thỉnh thoảng lại phải có thằng nào đó "sủa" lên một tiếng cho cả báo giới. Và những bài cơ bản như vậy mà vẫn được lên Nature đấy thôi (xem cái bibliography của bài báo Error bars tôi gửi ấy).
Có một thằng cha nó lập mô hình để chứng minh rằng gần như đại bộ phận các nghiên cứu (sử dụng thống kê hay không) đều sai. Các nghiên cứu sử dụng thống kê thì làm không chặt chẽ. Một số nghiên cứu sinh học phân tử/tế bào gốc thì không lặp lại được hoặc tác giả không làm các thí nghiệm độc lập để lặp lại chứng minh của mình. Các lĩnh vực nhỏ quá không ai quan tâm thì nghiên cứu xong "xếp xó", hoặc luôn dùng lại ở "kết quả ban đầu". Các lĩnh vực hot quá thì bị thao túng lũng đoạn bởi một số tay mafia nhằm duy trì giả thuyết của chúng đưa ra...v.v.
Mời các bạn đọc (cách lập mô hình của nó hơi khó hiểu chút):
http://rapidshare.com/files/197207402/why_most_research_finding_are_false.pdf.html

@HoLan: t tùy thuộc vào kích thước mẫu. Với n >=10 thì t=1 tương đương với mức ý nghĩa 0,05, t = 2 tương đương mức ý nghĩa 0,01. Nhưng với n =3 thì t=4 mới tương đương mức ý nghĩa 0.05 (bạn đọc bài Error bar ấy).

Nguyễn Xuân Hưng · Feb 12, 2009

Nguyễn Ngọc Lương said:
Nhưng ở cái FACS nó lặp lại thí nghiệm 1 lần mà để error bar thì nguyên tắc là sai rồi. Ít nhất phải 3 thí nghiệm.
Nói chung thống kê ngày càng bị lạm dụng. Mà một nguyên nhân là cả nhà thống kê lẫn người sử dụng thống kê chẳng ai nắm rõ cái mớ bòng bong này. Chả thế mà thỉnh thoảng lại phải có thằng nào đó "sủa" lên một tiếng cho cả báo giới. Và những bài cơ bản như vậy mà vẫn được lên Nature đấy thôi (xem cái bibliography của bài báo Error bars tôi gửi ấy).
Có một thằng cha nó lập mô hình để chứng minh rằng gần như đại bộ phận các nghiên cứu (sử dụng thống kê hay không) đều sai. Các nghiên cứu sử dụng thống kê thì làm không chặt chẽ. Một số nghiên cứu sinh học phân tử/tế bào gốc thì không lặp lại được hoặc tác giả không làm các thí nghiệm độc lập để lặp lại chứng minh của mình. Các lĩnh vực nhỏ quá không ai quan tâm thì nghiên cứu xong "xếp xó", hoặc luôn dùng lại ở "kết quả ban đầu". Các lĩnh vực hot quá thì bị thao túng lũng đoạn bởi một số tay mafia nhằm duy trì giả thuyết của chúng đưa ra...v.v.
Mời các bạn đọc (cách lập mô hình của nó hơi khó hiểu chút):
http://rapidshare.com/files/197207402/why_most_research_finding_are_false.pdf.html

Đúng rồi, vẫn nhắc lại em chẳng biết gì mấy cái thống kê này. Lấy ví dụ nho nhỏ 1 nature immunoloy paper thôi, trong nature cũng còn cả tá mắc lỗi (à lỗi là theo cảm nhận của em thôi chứ em chả biết bản chất lỗi ở đâu, mù thống kê mà). Kiểu như em nghịch gì đấy với 3 con mice, giết nó xong rồi thấy có gì hay ho đưa boss bảo đây này tao làm thế này thấy cái này mới mẻ quá này mày liệu liệu mà publish đi thì có mà boss tát cho vỡ mặt :twisted:

. Bắt đi làm vài lần với 3 con mice đấy nữa vẫn thấy thế thì hãy ra gặp tao.

Còn tính đến mấy cái báo làng nhàng hơn thì thôi rồi chả bao giờ em để ý mấy cái error bar với SD, SEM chi cho mệt. Thường xử lý số liệu thi quăng vô phần mềm là tự nó hiện ra error bar... thôi cũng chả biết nó tính kiểu gì :lol:

. Em thấy giờ cứ man power là quan trọng, rồi còn trò cố push hệ thống theo 1 hướng để publish nữa, khi nào rảnh nói sau. Lúc nào rảnh cũng sẽ nói thêm 1 chút về man power, sẽ thấy cùng một báo mà có những thằng làm rất làng nhàng cũng nhảy lên đi chợ, còn có thằng để lên được đấy thì cứ gọi là lên bờ xuống ruộng. Ôi cho nên đến tiêu chuẩn khách quan nhất là nhìn vào publications mà cũng còn phải tùy, phức tạp thật.

Trịnh Thành Trung · Feb 12, 2009

Nguyễn Ngọc Lương said:
Ở đây 10 con chuột này được đo được xem như n = 10 rồi, vì trường hợp replica vô duyên nói đến ở đây là thằng cha tác giả đi đo mỗi khối u của một con chuột 10 lần chẳng hạn.

Trường hợp nó làm thí nghiệm 1 lần với hơn 9 con chuột cũng tạm chấp nhận được. Có lẽ Nature bỏ qua điểm yếu này cho nó vì các kết luận khác khá thuyết phục.
Nhưng các bạn thấy là nó trình bày số liệu theo điểm chứ không phải là mean + error bar. Rất tuân thủ.

Nhưng ở cái FACS nó lặp lại thí nghiệm 1 lần mà để error bar thì nguyên tắc là sai rồi. Ít nhất phải 3 thí nghiệm.

Có mấy chỗ không rõ ràng lắm, nhưng có 1 câu em muốn hỏi bác Lương một chút.

Người ta tiến hành 1 thí nghiệm (1 independent experiment) trong một lô có 3 con chuột (3 replications). Sau khi lấy máu 0.1ml từ mỗi con chuột, mỗi con lấy 2 lần (được thêm 2 replications nữa nhé), người ta cho máu vào FACS theo kiểu gì đó, mỗi mẫu máu FACS thêm 2 lần nữa (tiếp tục thêm 2 replications nữa). Kết quả cuối cùng người ta thu được 12 số liệu từ 3 con chuột trên. Vậy khi trình bày kết quả, người ta không thể trình bày mean +/-SD or SEM được hay sao? Nếu người ta muốn biểu diễn đồ thị thì cũng không được dùng erros bar hay sao?

Tất nhiên, có một số 'key experiments' thì người ta cần phải lặp lại một số independent exps trước khi đưa ra kết luận. Có những thí nghiệm thì chỉ cần tư duy thôi cũng biết kết quả do đó việc lặp lại một lần thí nghiệm khác đôi khi là không cần thiết.

Cao Xuân Hiếu · Feb 12, 2009

Trịnh Thành Trung said:
Có mấy chỗ không rõ ràng lắm, nhưng có 1 câu em muốn hỏi bác Lương một chút.

Người ta tiến hành 1 thí nghiệm (1 independent experiment) trong một lô có 3 con chuột (3 replications). Sau khi lấy máu 0.1ml từ mỗi con chuột, mỗi con lấy 2 lần (được thêm 2 replications nữa nhé), người ta cho máu vào FACS theo kiểu gì đó, mỗi mẫu máu FACS thêm 2 lần nữa (tiếp tục thêm 2 replications nữa). Kết quả cuối cùng người ta thu được 12 số liệu từ 3 con chuột trên. Vậy khi trình bày kết quả, người ta không thể trình bày mean +/-SD or SEM được hay sao? Nếu người ta muốn biểu diễn đồ thị thì cũng không được dùng erros bar hay sao?

Tất nhiên, có một số 'key experiments' thì người ta cần phải lặp lại một số independent exps trước khi đưa ra kết luận. Có những thí nghiệm thì chỉ cần tư duy thôi cũng biết kết quả do đó việc lặp lại một lần thí nghiệm khác đôi khi là không cần thiết.

1. Cần phải phân biệt giữa biological replica và technical replica.
2. Chẳng ai thiết kế thí nghiệm như vậy. 1 thí nghiệm ít nhất phải có 2 lô. Sau đó mục tiêu đề ra là xem độ sai khác giữa 2 lô với nhau xem có đáng kể không.
3. VD thử cái thí nghiệm nào chỉ cần tư duy => ko phải lặp lại. Khó hiểu quá

Mean +/- SD or Mean +/-SEM?

0

Senior Member

Senior Member

0

Administrator

Administrator

Administrator

Administrator

0

0

Senior Member

Senior Member

Administrator

Junior Member

Senior Member

0

Administrator

Administrator

0

Administrator

Similar threads

Facebook

Thống kê diễn đàn