Mean +/- SD or Mean +/-SEM?

3. VD thử cái thí nghiệm nào chỉ cần tư duy => ko phải lặp lại. Khó hiểu quá

Em thử lấy cái ví dụ này các bác xem có được không nhé:

Có một anh chàng cao, to, đẹp giai, trên tay cầm một khẩu AK đời mới nhất. Anh chàng này bắn boòm, boòm, boòm 3 phát thế là 3 cái gene của một chú vi khuẩn cần nghiên cứu đi đời. Bằng BLAST, anh ta xác định 3 cái gene có độ tương đồng rất cao (tỉ dụ là 99% chẳng hạn) với 3 cái gene ở loài vi khuẩn nào đó đã nghiên cứu trước đó. 3 cái gene này tham gia vào quá trình chao đổi chất có liên quan đến 3 cái chất A, B, C. Chàng đẹp giai đó tiến hành mỗi một cái thí nghiệm độc lập cho từng chất (với số lần lặp lại là 3 or 5 chẳng hạn) bằng việc so sánh môi trường có chất A, B, C và không có chất A, B, C ở 3 chú vi khuẩn đột biến. Sau đó, chàng trai đó đưa ra được 3 cái đồ thị có cả erros bar hẳn hoi, trông rất chi là hoành tá tràng với giá trị p value < 0.001. Cuối cùng, các bác có biết chàng trai đó kết luận thế nào không? Như thế lày lày: khẩu súng AK mới ra đời có sức công phá rất mạnh, tiêu diệt được gene cần đột biến.

Vậy em hỏi các bác, việc chàng giai kia chỉ làm một cái thí nghiệm độc lập là đúng hay là sai ạ.

Trở lại bài báo của chú Hưng nhà ta, bác nào đúng chuyên môn về ngành đấy, kiểm tra hộ em xem cái thí nghiệm trên 3 chú chuột đó là "key experiments" của bài báo hay chỉ là cái nhằm hỗ trợ, ủng hộ thêm cho cái kết quả chính của tác giả? và trong cái kết luận cuối cùng của bài báo thì 3 chú chuột đó đóng vai trò quan trọng không ạ?

Em không xem qua bài báo đó, nhưng nếu là một bài trên nature, và 3 chú chuột kia đóng vai trò quan trọng trong kết luận cuối cùng của bài báo thì em xin đi đầu xuống dưới đất ạ.
 
1. Cần phải phân biệt giữa biological replica và technical replica.
2. Chẳng ai thiết kế thí nghiệm như vậy. 1 thí nghiệm ít nhất phải có 2 lô. Sau đó mục tiêu đề ra là xem độ sai khác giữa 2 lô với nhau xem có đáng kể không.

Bác Hiếu nói đúng đấy. Thường em rất chú ý sinh viên em dạy để phân biệt giữa 2 loại lặp lại này. Lấy một ví dụ đơn giản ra đây để các em học sinh phổ thông sau này không bị mắc lỗi, cho dù trong những thí nghiệm đơn giản nhất (cũng cho anh xin lỗi những em đã biết rồi nhé).

VD: Nghiên cứu biểu hiện của gene A trong hạch lympho của chuột sau khi tiêm chất B vào 3 ngày.

Thường thì ngay ban đầu mấy đứa khá, biết cách lặp thí nghiệm nó sẽ nuôi độ 6 con chuột, sau đó tiên chất B vào 3 con, 3 con không tiên, 3 ngày sau tách RNA, từ hạch lympho của cả 6 con, tổng hợp cDNA. Với mỗi mẫu cDNA khi chạy realtime PCR lại phải lặp lại 3 lần, rồi phân tích kết quả.

Nghe có vẻ làm rất cẩn thận. Nhưng nkết quả này chưa thể dùng để đăng báo được (thú thật là có đứa lau chau đưa kết quả kiểu này lên xong lại còn cãi chày cãi cối từng bị boss em ném giày như chữ ký ku Cường ý). Gạt bỏ tất cả các phân tích, công thức thống kê rắc rối đi, cần hiểu bản chất của việc lặp lại là để loại trừ các yếu tố "sai số" ảnh hưởng đến thí nghiệm.

Ở đây mỗi mẫu cDNA thực hiện realtime PCR 3 lần để loại bỏ khả năng sai số do thao tác khi thực hiện phản ứng.

Lặp lại với 3 con chuột là để loại bỏ sai số do khác nhau trong bản thân các chú chuột đem lại. Chú ý nữa ở đây là ngay cả với đối chứng âm cũng phải dùng 3 con.

Tuy nhiên vẫn chưa đủ vì tất cả những bước lặp trên chỉ được tính là 1 lần làm thí nghiệm với việc tiêm chất B. Vì sao, rất có khả năng cả lô chuột dùng ở trên đều bị ảnh hưởng của 1 yếu tố nào đó (ví dụ chẳng may nhiễm khuẩn, chẳng may tâm sinh lý bất ổn định do mải tìm cách cắn xé nhau...) làm ảnh hưởng đến sự biểu hiện của gene A. Do vậy người ta phải lặp lại y như trên với 1 lô chuột khác để loại bỏ những yếu tố này.

Nói thêm chút nữa về làm thí nghiệm với chuột. Thông thường thí nghiệm khác lặp lại với 3 mẫu còn được, riêng với chuột chỉ lặp lại có 3 với 5 chú thì không ổn. Còn chưa kể phải tính tới độ tuổi, giới tính, time kinentic của thí nghiệm hic. Nhất là nhiều chú làm với những loại tế bào hiếm chúng nó giết cả trăm con cho một thí nghiệm như chơi. Chuột wild type còn đỡ chứ chúng nó lại làm với knock-out mice, transgenic mice hay adaptive transfer nữa thì cũng phải thông cảm cho việc representative of 1 experiment, mỗi tội cần boss nó phải to 1 tí chứ không thì nghỉ.

À tiện thể đưa publications của bác trưởng nhóm cho biết thế nào là man power, chú ý xem bác ý 1 năm lên mấy báo kiểu như cell hay nature mấy lần thôi nhé, mấy cái làng nhàng thì bỏ đi.

http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=Search&Term=%22Lambris%20JD%22[Author]&itool=EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Pubmed_DiscoveryPanel.Pubmed_RVAbstractPlus
 
Người ta tiến hành 1 thí nghiệm (1 independent experiment) trong một lô có 3 con chuột (3 replications). Sau khi lấy máu 0.1ml từ mỗi con chuột, mỗi con lấy 2 lần (được thêm 2 replications nữa nhé), người ta cho máu vào FACS theo kiểu gì đó, mỗi mẫu máu FACS thêm 2 lần nữa (tiếp tục thêm 2 replications nữa). Kết quả cuối cùng người ta thu được 12 số liệu từ 3 con chuột trên. Vậy khi trình bày kết quả, người ta không thể trình bày mean +/-SD or SEM được hay sao? Nếu người ta muốn biểu diễn đồ thị thì cũng không được dùng erros bar hay sao?.

Thật ra cái vụ lấy 2 lần của bạn Trung được gọi là technical replicate (như Hiếu nói), với mục tiêu là loại bỏ các sai sót về thao tác, dụng cụ (tất nhiên nếu sử dụng 1 pipette thì chỉ bỏ qua được sai sót về thao tác). Và technical replicate chủ yếu nhấn mạnh precision (tính chính xác của việc đo). Trong biological replicate, ta phải chú ý những yếu tố nào ảnh hưởng đến giá trị thực của cái ta cần đo, tức phải xem population là đâu. Trường hợp này thì 3 con chuột được xem là 3 independent replicates. Và trong trường hợp đó n vẫn chỉ là 3 chứ không phải là 3x2 = 6.
Khi trình bày kết quả, theo như thằng tác giả của bài error bar, ta không nên đưa cột và error bar trong trường hợp chỉ làm thí nghiệm này một lần mà nên đưa từng giá trị đo được lên dưới dạng các chấm (như hình 1 trong bài của Hưng).
Như vậy giả sử một bạn làm nuôi cấy mô, muốn so sánh tác động của 1 chất kích thích sinh trưởng lên sự tăng sinh của chồi. Bạn có thể làm 10 replicate trong một ngày hoặc làm 10 replicate trong 10 ngày. Trong 10 cái replicate này, các replicate trong 1 ngày chưa loại bỏ được các yếu tố như yếu tố "ngày" (day bias), hay có thể là yếu tố mẫu (ví dụ mẫu lấy từ cùng một chỗ - location), nhưng việc 10 replicate được làm trong một ngày đảm bảo cho bạn ấy tính chính xác của thao tác thí nghiệm, kỹ năng...v.v. Ngược lại làm 10 replicate trong 10 ngày, với giả định mỗi ngày lấy 1 mẫu ở một chỗ khác nhau thì loại bỏ được các bias về ngày, vị trí lấy mẫu...v.v, nhưng số liệu có được có thể không chính xác (precise). Do đó cách khôn ngoan để có được kết quả thống kê đáng tin cậy là phải giảm số replicate trong một ngày lại và đồng thời giảm số ngày làm replicate lại. Ví dụ có thể làm 3 replicate trong một ngày, và làm 4 ngày như vậy. Trong trường hợp đó nếu chặt chẽ thì n = 4, nhưng đôi khi cũng có thể du di cho n = 3x4 = 12. Trường hợp làm chặt chẽ, tôi nghĩ chỉ lấy giá trị trung bình của replicate trong ngày (không cần quan tâm hoặc không cần trình bày SD hay SE của lần lặp trong ngày) để sử dụng cho mean estimation.

Có thể thấy cái vụ phân biệt giữa independent replicates với independent
experiments cũng rất là "muddy". Trong một số trường hợp một ông bảo thủ có thể cãi cái ông ta đang làm là independent experiment trong khi một ông khác bảo đó chỉ là indepedent replicate.
 
Trường hợp của Hưng, còn phải tính là tìm 6 con chuột có một số đặc điểm tương đồng nhau. Giả sử đấy là 6 con knockout thì coi bộ cũng phải bán nhà để làm thí nghiệm thật.
Nhóm trưởng Hưng mạnh thế mà vẫn đi cầu cạnh Andrew C Chan à?
 
Trường hợp của Hưng, còn phải tính là tìm 6 con chuột có một số đặc điểm tương đồng nhau. Giả sử đấy là 6 con knockout thì coi bộ cũng phải bán nhà để làm thí nghiệm thật.
Nhóm trưởng Hưng mạnh thế mà vẫn đi cầu cạnh Andrew C Chan à?

Đúng rồi, tất nhiên mỗi lô chuột đều phải tính các yếu tố giới tính, độ tuổi, tương đồng.... 6 con knockout thì có gì đâu mà bán nhà bác, em giết như nghóe. Bác rảnh thì đếm thử trong bài em đưa lên chúng nó giết bao nhiêu con knockout hehe, đấy là trên số liệu publish thôi còn để ra được số liệu đấy thường chúng nó giết không ít hơn 3 lần.

Trưởng nhóm em nói là trưởng nhóm cái bài em đưa ra phân tích vụ thống kê chứ không phải chỗ em. Andrew C Chan thật ra không nhiều publications lắm nhưng dân trong nghề đều giơ ngón cái vì bác này làm cho công ty nên nhiều cái không được publish, kiểu như mấy cái lẻ tẻ công ty nó đăng ký bản quyền xong xuôi, hoặc không đưa ra ứng dụng được thì publish tạm cho vui thôi hihi. Đây lại là 1 ví dụ nữa của việc publications là yếu tố khách quan nhất nhưng không phải tất cả.
 
Trưởng nhóm em nói là trưởng nhóm cái bài em đưa ra phân tích vụ thống kê chứ không phải chỗ em. Andrew C Chan thật ra không nhiều publications lắm nhưng dân trong nghề đều giơ ngón cái vì bác này làm cho công ty nên nhiều cái không được publish, kiểu như mấy cái lẻ tẻ công ty nó đăng ký bản quyền xong xuôi, hoặc không đưa ra ứng dụng được thì publish tạm cho vui thôi hihi. Đây lại là 1 ví dụ nữa của việc publications là yếu tố khách quan nhất nhưng không phải tất cả.

Chú Hưng thử rỉ tai hỏi ông Chan xem ông ấy có bao nhiêu Intellectual property? bao nhiêu cái Patent? cái đó lây ra từ đâu?
 
Xin lỗi lạc đề một chút tại shock quá. Bác Lương ơi xem chú K. Christopher Garcia đi, chú này xong PhD năm 1993 thì năm 1992 publish 2 phát trên science, mấy năm nay trung bình chú này 3 tháng lên Nature, science hoặc Cell chơi 1 lần. Riêng năm 2005 lên sicence 4 lần, cell 1 lần, nature 1 lần! Sợ quá!

http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=Search&Term=%22Garcia%20KC%22[Author]&itool=EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Pubmed_DiscoveryPanel.Pubmed_RVAbstractPlus
 
Không sốc nhiều lắm. Hưng biết một con "ranh" :mrgreen: (hơn tôi 1 tuổi) ở Monash nó lên Nature và Nature Immunology 5 lần mà mới lấy PhD năm 2003. Biết nó làm gì không? X ray Crystolography of proteins.:dance:
http://www.med.monash.edu.au/biochem/staff/borg.html
Không biết nó sẽ còn lên bao nhiêu lần nữa. Nhưng dạng này không giống của Hưng vì thằng kia bây giờ nó đứng tên sau rồi (chứng tỏ nó có theory và postulation của nó và các con nô lệ kia đang làm cái việc là chứng minh các theory và postulation này đúng).
 
Không sốc nhiều lắm. Hưng biết một con "ranh" :mrgreen: (hơn tôi 1 tuổi) ở Monash nó lên Nature và Nature Immunology 5 lần mà mới lấy PhD năm 2003. Biết nó làm gì không? X ray Crystolography of proteins.:dance:
http://www.med.monash.edu.au/biochem/staff/borg.html
Không biết nó sẽ còn lên bao nhiêu lần nữa. Nhưng dạng này không giống của Hưng vì thằng kia bây giờ nó đứng tên sau rồi (chứng tỏ nó có theory và postulation của nó và các con nô lệ kia đang làm cái việc là chứng minh các theory và postulation này đúng).

Vâng, lab toàn thằng to đầu, mỗi đứa phụ trách một mảng rồi mỗi mảng/loại kỹ thuật sau đó rút ra tí tập hợp lại thành paper thì số lần lên cũng nhiều. Nhưng cứ 3 tháng 1 lần thì cũng sợ thật, bình thường thằng nào đăng 1 phát mỗi năm là nổi lắm rồi. Tần số đi chợ cao như vậy chứng tỏ không chỉ tư duy tốt, làm việc trâu mà còn có kiến thức/nghiên cứu rộng với nhiều mảng nữa, việc có nhiều khám phá lớn trong 1 hướng hẹp trong một năm gần như là không tưởng.

Kiểu này phải cố thiết lập/duy trì quan hệ sao đó, sau này mà con mình nó vẫn dở hơi đòi theo khoa học khoa hèo thì đi cửa sau gửi gắm cho mấy lab này thì mới nở mày nở mặt được bác Lương nhỉ. Cùng 1 công/thời gian làm mà vào mấy nơi làng nhàng, boss cả đời không bước chân lên nổi mấy cái báo xịn thì chỉ tổ thêm mệt, phí công.

À chết hơi lạc đề, quay lại chủ đề chính tí. Bác Lương hay dùng chương trình gì để xử lý số liệu thống kê? Em dùng GraphPad Prism v4.02, tiện lắm. Quăng số liệu vào là khi dựng đồ thị tự nó ra error bar chẳng biết nó tính kiểu gì nữa :)).
 
À chết hơi lạc đề, quay lại chủ đề chính tí. Bác Lương hay dùng chương trình gì để xử lý số liệu thống kê? Em dùng GraphPad Prism v4.02, tiện lắm. Quăng số liệu vào là khi dựng đồ thị tự nó ra error bar chẳng biết nó tính kiểu gì nữa :)).

thằng này chỉ được cái vẽ hình đẹp thôi Hưng ạ. Xử lý thống kê của nó yếu lắm.

SPSS thì vẽ hình dở ẹc, chưa bao giờ em sử dụng hình của nó.
 
Bác Lân có lẽ đã làm ta rõ SD và SEM. Giờ liên quan mấy cái này tôi có 1 câu sau muốn hỏi các bác một phát. Bác nào giải quyết được khúc mắc này thì tui cảm ơn nhìu.

Giả sử giờ ta có 1000 con bò con (PhD candidate?) của 1 giống bò X, nuôi các bò này trong cùng điều kiện chăn nuôi. Lấy một mẫu đo tốc độ tăng trọng của đàn bò này. Từ đó ta tính được trị giá trung bình và đương nhiên là SD của mẫu. Theo lý htuyết thống kê, SD phản ánh mức độ dispersal hay spread của các cá thể trong mẫu nghiên cứu; vậy thì tại sao không dùng ngay SD để thể hiện mức độ variability (biến dị) về tốc độ tăng trọng của các kiểu gen khác nhau trong quần thể bò mà nhất thiết phải dùng phương sai (Variance, Var, chính là bình phương của SD) để đánh giá mức độ biến dị của đàn bò này?

Không ai có hứng thú tham gia vào bài toán này à?
 
1. Cần phải phân biệt giữa biological replica và technical replica.
2. Chẳng ai thiết kế thí nghiệm như vậy. 1 thí nghiệm ít nhất phải có 2 lô. Sau đó mục tiêu đề ra là xem độ sai khác giữa 2 lô với nhau xem có đáng kể không.
3. VD thử cái thí nghiệm nào chỉ cần tư duy => ko phải lặp lại. Khó hiểu quá

Giả sử mỗi con chuột lấy 3 mẫu máu (3 technical replica) để phân tích một chỉ tiêu nào đó, kết quả xảy ra như sau:

Trường hợp 1:

rep 1: 5.25
rep 2: 5.21
rep 3: 5.28

Trường hợp 2:
rep 1: 5.25
rep 2: 5.21
rep 3: 7.42

Trường hợp 3:
rep 1: 5.25
rep 2: 2.80
rep 3: 7.42

Thông thường, nếu 1 nghiệm thức có 10 con chuột thì giá trị trung bình của 3 lần đo sẽ được sử dụng làm giá trị đại diện cho 1 con chuột để đưa vào các phân tích thống kê tiếp theo. Tuy nhiên, khi kết quả của 3 technical replica có biến thiên lớn như trường hợp 2 và 3 thì nên xử lý thế nào (toàn bộ số chuột đã sử dụng hết cho phân tích, không có extra samples)?

@ anh Hiếu giải thích rõ hơn thuật ngữ "lô" được không ạ, em hơi confusing? Lô = treatment?
 
thằng này chỉ được cái vẽ hình đẹp thôi Hưng ạ. Xử lý thống kê của nó yếu lắm.

SPSS thì vẽ hình dở ẹc, chưa bao giờ em sử dụng hình của nó.
Anh dùng phần mềm gì để xử lý số liệu, anh chỉ cho em tham khảo với, em cảm ơn :mrgreen:
 

Facebook

Thống kê diễn đàn

Threads
12,995
Messages
72,869
Members
45,065
Latest member
Go88aa
Back
Top