Không đồng ý với cách phát biểu chủ quan của bạn Đôn.
Mặc dù có sự sử dụng một cách bừa bãi SD và SEM, trong sinh học, SEM nên được sử dụng thay vì SD. SD chỉ phản ánh sự phân bố của số liệu. Nói cách khác nó là một thông số về thống kê mô tả (M cộng/trừ 2xSE = 95% khoảng số liệu). Trong khi đó SEM là một thông số về thống kê suy diễn, cái mà sinh học và các ngành khoa học thực nghiệm cần (một kết luận nào đó từ các số liệu). Ví dụ muốn biết giá trị thực sự của mean (đại diện cho một population) nằm trong khoảng nào thì người ta sẽ sử dụng công thức M cộng/trừ txSEM, với t phụ thuộc độ lớn của mẫu.
Có hồi tôi ngồi cãi nhau với một cậu bạn làm về xác suất về cái này. Xem ra VN vẫn cứ tương SD vào mean mà không ghi rõ, và cũng không hiểu nó là cái gì.
Tôi hơi chủ quan khi nói rằng người ta dùng độ lệch chuẩn (SD) nhiều hơn sai số chuẩn (SEM) (chắc tại vì thấy nhiều bài báo sử dụng SD). Quả thật là nhiều người dùng SD và SEM "bừa bãi". Tuy nhiên, trong sinh học,
người ta có thể dùng cả hai loại này để biểu diễn số liệu, mỗi thứ đều có lý do của nó.
Dùng độ lệch chuẩn (SD).
- Từ độ lệch chuẩn, người đọc sẽ biết về mức phân bố của mẫu. Anh Lương đã giải thích sự phân bố số liệu (2/3 trong khoảng +/- SD, và 95% trong khoảng +/- 2SD). Từ đây, người ta cũng biết được một số liệu bất kỳ nào đó là bình thường (trong các khoảng lệch chuẩn) hay bất thường (nằm ngoài các khoảng lệch chuẩn) hay không.
- Quan trọng hơn,
người ta phải dùng độ lệch chuẩn (SD) để tính độ khác biệt (effect size). Khi so sánh hai giá trị trung bình của hai nhóm, người ta tính hiệu của hai giá trị này, sau đó lấy hiệu này chia cho SD của nhóm 1, hoặc SD của nhóm 2, hoặc SD chung để tính độ khác biệt (
EF = effect size).
+ EF lớn hơn hoặc bằng 0.8: LỚN
+ EF từ 0.2 trở xuống: NHỎ
+ Khoảng EF còn lại là TRUNG BÌNH.
Bệnh viện đa khoa Hoàn Mỹ tại TP. Hồ Chí Minh có một ví dụ về tầm quan trọng của độ khác biệt trong đường dẫn dưới đây:
http://hoanmysaigon.com/index.php?option=com_content&task=view&id=915&Itemid=123.
Dùng sai số chuẩn (SEM)
Người ta thường dùng sai số chuẩn (SEM) trong thống kê suy luận như anh Lương đã nói. Khi muốn thể hiện độ chính xác của giá trị trung bình (
mean), người ta biểu diễn SEM.
Tuy nhiên, không phải lúc nào sai số chuẩn cũng được "ưa chuộng".
Trong sinh học, ta thường phải so sánh các giá trị trung bình với nhau, nhiều người thường dùng SEM để so sánh. Khi biểu diễn trên đồ thị:
- Nếu thanh SEM của hai giá trị có đoạn chồng lấp: khác biệt giữa hai giá trị trung bình không có ý nghĩa.
- Nếu thanh SEM của hai giá trị không chồng lấp: khác biệt giữa hai giá trị trung bình
có thể có ý nghĩa (mà cũng có thể không).
Như vậy, để biết khác biệt có ý nghĩa hay không, ta phải tính toán thống kê: thể hiện giá trị
p (
p-value), hoặc biểu diễn kiểm nghiệm
t (
t-test), v.v ... còn chỉ nhìn vào thanh SEM thì cũng không nói chắc chắn được gì.
Tóm lại, tuỳ theo "lý luận" và mục đích của người viết báo cáo mà họ sử dụng độ lệch chuẩn (SD) hay sai số chuẩn (SEM). Dù sử dụng SD hay SEM thì người viết cũng phải ghi chú rõ ràng trong các bảng biểu của họ.

Vì không gõ được công thức tính trong này nên tôi phải ghi cách tính độ khác biệt (
effect size) hơi dài dòng lôi thôi.
Trịnh Thành Trung said:
mean tiếng Việt có nghĩa là gì các bác nhỉ? mean hoàn toàn khác với medium ' số trung bình cộng'
"
Mean" chính là giá trị trung bình cộng.
"
Medium" --> Chắc bạn Trung muốn nói "
median"?! "
Median" là số trung bình hoặc số trung tâm của một tập hợp.