Xin hỏi về phần mềm thống kê Primer V và STATISTICA 7.0.

Đinh Văn Khương · Jun 8, 2013

vu.hai said:
Tặng lunarkasumi thêm hai cái graph vẽ bằng Excel.
http://www.sendspace.com/filegroup/u90lyzgXIKs0nWwZ770epQ
Trong book1.pdf mình show giá trị median nhé.

Suýt quên 2way Anova test nữa:
http://www.sendspace.com/file/4a0p24

Trước khi viết tiếp trả lời cho bài này xin nói trước là hoàn toàn với mục đích học hỏi và những gì tôi sẽ hỏi là những gì tôi chưa hiểu hoặc chưa rõ, không phải với mục đích bới móc bài viết của bạn vu.hai (một điều lẽ ra tôi không cần phải nói nhưng chợt giật mình khi thấy Thành có một cái note như vậy). Và xin khẳng định là kết quả anova của bạn đưa ra khi xử lý anova = excel không khác so với kết quả tôi đưa ra khi xử lý bằng SAS.

Tôi cứ thắc mắc từ chiều tại sao không có lặp lại (replicates) cho mỗi sampling site/time mà vẫn tính được two-way anova, theo suy nghĩ còn hạn chế của tôi thì two-way anova sẽ đưa ra main effects và interaction. Main effects theo không gian (điểm thu mẫu) và thời gian (tháng thu mẫu) thì đều có lặp lại nên chắc chắn có variation và hiển nhiên sẽ tính được anova (analysis of variance). Nhưng interaction thì sao? Mỗi điểm thu mẫu, tại một tháng nhất định chỉ có một giá trị (e.g., Điểm 1/tháng VIII/2012 có giá trị là 22 vs. Điểm 7/tháng I/2013 có giá trị là 42), không có lặp lại thì không có variation, mà không có 2-way variations thì sao có 2-way anova để biết có interaction hay không có interaction? Xem attached file của bạn thì cũng chỉ có row factor và collum factor chứ không có row x collum, p value. Vậy có thể gọi phân tích đó là two-way anova hay không?

Nếu tôi có gì nói sai thì đó không phải là cố ý.

Hoàng Đức Minh · Jun 8, 2013

Loại kiếm mình dùng (Excel, SAS, statistica hay STATA, SPSS...) tùy thuộc trình độ người dùng kiếm.

Em chỉ dùng được STATA và Excel. Nhưng nói chung khả năng phần mềm thống kê là vô cùng, tùy thuộc vào trình độ của người dùng kiếm và mình dùng nó xử lý vấn đề gì. Có loại giải quyết vấn đề a chỉ mất nửa giây, có loại giải quyết cùng vấn đề mất cả vài ngày.

Lập trình STATA hoặc Excel thì phụ thuộc vào khả năng tưởng tượng và khả năng của mỗi người. Excel lập trình bằng VBA cũng chưa chắc thua kém STATA đâu. Nó là kiếm, vấn đề là người dùng kiếm.

Ưu điểm của STATA là chạy được tuốt luốt 3 hệ điều hành và command ở các hệ điều hành đó đều giống nhau. Còn Microsoft Excel thì em chưa dùng trên MAC nên cũng chưa biết thế nào? Có gì mong các bác chỉ giáo.

vu.hai · Jun 8, 2013

Thư giãn đi, các số liệu thống kê vốn trừu tượng lắm, các vấn đề sâu hơn xin nhường các nhà toán học
http://www.youtube.com/watch?v=XGmgprUGpvU

Đinh Văn Khương · Jun 8, 2013

vu.hai said:
Thư giãn đi, các số liệu thống kê vốn trừu tượng lắm, các vấn đề sâu hơn xin nhường các nhà toán học
http://www.youtube.com/watch?v=XGmgprUGpvU

nếu đây là câu trả lời của bạn dành cho tôi thì đã đủ để biết thế nào là "mèo vờn chuột". Câu trả lời này không nằm trong sự chờ đợi của tôi.

trinhdangmau · Nov 16, 2013

Lâu lắm không vào sinhhocvietnam – thấy mọi người rôm rả quá.
Em thì chưa hề được học gì về thống kê, nhưng em cũng góp thêm chút ý kiến của mình với mọi người. Theo em, với thông kê nói chung, trước khi xử lý bất kỳ dữ liệu nào, chúng ta nên đưa ra một bài toán cho nó, để biết được chúng ta cần biết gì từ bộ sô liệu nào. Sau đó, chúng ta sẻ quyết định sử dụng những phân tích nào để giải quyết nó.
Đối với bộ số liệu của bạn đã đưa ra ở đây, thì em đưa ra một bài toán là Có sự khác biệt về số lượng loài ghi nhận theo địa điểm và thời gian nghiên cứu không?
Nếu có, Kiểm tra giả thiết có giải thích được sự biến động về số lượng loài ghi nhận theo thời gian/địa điểm (với điều kiện thỏa mãn tính liên tục trong các điểm thu mẫu).
Nếu không, bạn nên sắp xếp lại dữ liệu của mình, vd, phân nhóm địa điểm (tùy theo thông tin khảo sát – có thể theo địa lý hay môi trường); và tương tự cho việc phân nhóm thời gian (theo mùa hay theo sự biến động của môi trường)/ Sau đó tiếp tục kiểm tra sự khác biệt.

Đối với bài toán này bạn có thể sử dụng phương pháp so sánh:
Trước đó bạn cần kiểm tra phân bố của số liệu bạn có: Nếu tuân theo normal distribution thì bạn có thể sử dụng t-test (nên sử dụng với số mẫu nhỏ như của bạn).
Nếu không: bạn có nên sủ dụng các phương pháp so sánh non-parametric như Wilcoxon.
Ngoài ra, bạn có thể sử dụng phương pháp chọn mẫu ngẫu nhiên cho t-test (Randomization, sample)

Softw: đối với phần mềm thì mỗi cái có một thế mạnh của nó, quan trọng là chúng ta sử dụng nó hiệu quả tới đâu thôi. Tuy nhiên, em thì em thích sử dụng R nhất – thực ra vì cũng là do điều kiện – R free mà,

Máy của mình đang die card màn hình nên chưa giải cụ thể bài này được,

- nếu cần thiết tuần tới mình sẻ giải bài này cho bạn.

Xin hỏi về phần mềm thống kê Primer V và STATISTICA 7.0.

Đinh Văn Khương

Senior Member

Hoàng Đức Minh

Senior Member

vu.hai

Senior Member

Đinh Văn Khương

Senior Member

trinhdangmau

Senior Member

Similar threads

Facebook

Thống kê diễn đàn