Phần mềm thống kê R

Ho Huu Tho

Senior Member
Tôi có đọc được bài giới thiệu về phần mềm thống kê R tại website mới của thầy Nguyễn Văn Tuấn ở đây. Tôi thấy rất hấp dẫn và muốn hỏi kinh nghiệm thực tế của các bạn đã từng sử dụng nó để có định hướng học về nó. Vậy nếu có bạn nào đã từng sử dụng thì làm ơn chia sẻ với mình đôi điều ở đây nhé.(y)
 
Nếu không thích dùng lệnh thì có thể sử dụng giao diện với R.

Mình nghĩ R rất hữu dụng vì mình có thể làm theo ý mình.
 
Nếu không thích dùng lệnh thì có thể sử dụng giao diện với R.

Mình nghĩ R rất hữu dụng vì mình có thể làm theo ý mình.

Mình cũng nghĩ vậy vì R có nhiều ứng dụng lắm mặc khác là download miễn phí mà k lo ngại và vấn đề bản quyền, tôi thích dùng R để vẽ đồ thị và chạy thống kê.
Tôi đang mài mò cách sữ dụng R để tạo cluster và chạy PCA. Anh chị em nào rành cái này có thể chia sẻ kinh nghiệm nhé.
 
Mình cũng nghĩ vậy vì R có nhiều ứng dụng lắm mặc khác là download miễn phí mà k lo ngại và vấn đề bản quyền, tôi thích dùng R để vẽ đồ thị và chạy thống kê.
Tôi đang mài mò cách sữ dụng R để tạo cluster và chạy PCA. Anh chị em nào rành cái này có thể chia sẻ kinh nghiệm nhé.
Trong năm tới mình cũng sẽ đụng đến vấn đề của bác. Hi vọng sẽ liên lạc và học hỏi từ bác. Lúc trước mình có viết các modun nhỏ dạng linear or generalized linear models cho 1 package của thầy mình.
 
Trong năm tới mình cũng sẽ đụng đến vấn đề của bác. Hi vọng sẽ liên lạc và học hỏi từ bác. Lúc trước mình có viết các modun nhỏ dạng linear or generalized linear models cho 1 package của thầy mình.

Sẵn sàng thôi, nhưng mình cũng đang mày mò dò dẫm từ từ nè, rất khó để viết các câu lệnh như vậy mà tham khảo sách viết vẫn không đủ. Sách của thầy Tuấn k có đề cập vấn đề này. Chờ xem diễn đàn chúng ta sẽ có chuyên gia về vấn đề này xuất hiện.Thanks.
 
Bàn về R language

Sẵn sàng thôi, nhưng mình cũng đang mày mò dò dẫm từ từ nè, rất khó để viết các câu lệnh như vậy mà tham khảo sách viết vẫn không đủ. Sách của thầy Tuấn k có đề cập vấn đề này. Chờ xem diễn đàn chúng ta sẽ có chuyên gia về vấn đề này xuất hiện.Thanks.

Hi tất cả các bạn,

Quả thật, lần đầu tiên đăng nhập và sử dụng forum thật là phiền phức :chui: vì nó yêu cầu xác thực một vài điều. Nhưng đó cũng là thủ tục. Hy vọng mình có thể giúp ích gì cho các thành viên khác.

Mình đang nghiên cứu về Metabolic Network (một mảng trong Bioinformatics), sử dụng thường xuyên R. Quả thật, R là một ngôn ngữ lập trình dạng script và có thể dùng ngay tại trình thông dịch interpreter (giống như hệ điều hành DOS mà các bạn học trong môn Tin học đại cương thời xa xưa - không biết bây giờ có trường ĐH, CĐ nào ở mình dạy không nữa). Nghĩa là, bạn phải nhớ các câu lệnh và gõ gõ... tại dấu nhắc của trình thông dịch.

Qua tham khảo liên kết mà bạn Ho Huu Tho đưa trong bài viết, mình thấy có khá nhiều tài liệu hay và dễ đó. Tuy nhiên, tất cả viết bằng tiếng anh, có thể đó là trở ngại cho nhiều bạn.

Mặc dù vậy, nếu bạn nào có thắc mắc về R language có thể post ở đây, chúng ta cùng giải đáp.
 
Hi tất cả các bạn,

Hi tất cả các bạn,

Cám ơn bạn nhiều lắm mới mong ước có chuyên gia xuất hiện bây giờ là đã xuất hiện rồi. Mình mở hàng câu hỏi đầu tiên cho chuyên gia nhé. Khi vẽ đồ thị như hình đính kèm, làm sao cho các con số của trục tung và trục hoành font là Time Roman và cở số là 10. Đây là scipt mà mình sữ dụng để vẽ đồ thị đó. Thanks


hist(NPK$grain_wt, main=" Histogram of grain weight", col='red',
border='blue', freq=FALSE, xlab="Y class", ylab="probability",xlim=c(0,4),ylim=c(0,1))
x <- seq(from=0, to=20, length=100)
x
y <- dnorm(x, mean(NPK$grain_wt),sd(NPK$grain_wt))
y
lines(x,y)
mtext("Fitting to a normal distribution")
 
Hi tất cả các bạn,

Hi tất cả các bạn,

Cám ơn bạn nhiều lắm mới mong ước có chuyên gia xuất hiện bây giờ là đã xuất hiện rồi. Mình mở hàng câu hỏi đầu tiên cho chuyên gia nhé. Khi vẽ đồ thị như hình đính kèm, làm sao cho các con số của trục tung và trục hoành font là Time Roman và cở số là 10. Đây là scipt mà mình sữ dụng để vẽ đồ thị đó. Thanks


hist(NPK$grain_wt, main=" Histogram of grain weight", col='red',
border='blue', freq=FALSE, xlab="Y class", ylab="probability",xlim=c(0,4),ylim=c(0,1))
x <- seq(from=0, to=20, length=100)
x
y <- dnorm(x, mean(NPK$grain_wt),sd(NPK$grain_wt))
y
lines(x,y)
mtext("Fitting to a normal distribution")

Đoạn mã của bạn mình không test để vẽ thêm được. Nhưng mình tìm một trang có nói về vấn đề đó. Xem liên kết:

http://www.statmethods.net/index.html
 
Chào mọi người, mình cũng đang hơi rắc rối với R. Mình đang viết chương trình clustering. Chương trình clustering built-in của R có sẵn một vài metric thông thường, nhưng không có cái mình cần "correlation." Có bạn nào biết gói thống kê cho phép người dùng định nghĩa metric xin chỉ giáo giùm :D
Viết một chương trình hoàn chỉnh không khó khăn gì nhưng tốc độ so với chương trình built-in giảm hẳn! Cái này dễ hiểu...
Thay đổi code của built-in function lại khá là khó khăn: đa số các chương trình kiểu thế được gọi từ một thư viện C hoặc Fortran, không thể can thiệp vào được.
 
Nhân tiện xem qua ở link bạn Hồ Hữu Thọ post, mình thấy một điểm khá quan trọng cho lập trình là dạng cấu trúc tổng quát của dữ liệu chưa được đề cập đến. Tác giả nhấn mạnh khía cạnh thực hành hơn. Mình học theo kiểu viết đến đâu tra... mạng đến đấy (may là R khá gần gũi với Matlab nên không khó khăn lắm) nên không nắm được chi tiết vấn đề này. Theo mình nếu bạn moi-vao-nghe nắm vững vấn đề này có thể viết một bài nhỏ giúp mọi người tham khảo, sẽ đặc biệt hữu ích cho người mới tiếp cận với R và có chút ít khái niệm về ngôn ngữ lập trình. Thanks :)
 
Tiếp tục thảo luận topic này chút đi :D
Mình không biết gì về object-oriented tuy nhiên có vẻ như R thuận tiện hơn nhiều ngôn ngữ khác, kể cả mathlab, ở chỗ coi tất cả các thứ sử dụng như là 'objects.'
Ấn tượng nhất là functions. Mình thấy functions trong R có thể coi như một objects, ở mức độ nào đó ngang hàng với một biến số thực, chẳng hạn x. Tức là nó có thuộc tính, có qui tắc tương tác với các objects khác. Như vậy lệnh f = function(x){} phải coi là một lệnh gán một đối tượng f cho một object kiểu function. Không biết cái này có phải ý tưởng chính của object-oriented không nhưng đúng là... rất thú vị. Chẳng hạn nhờ đó một function có thể trở thành một biến của function khác. Điều này hình như hoàn toàn không thực hiện được với pascal, thực hiện khó khăn với fortran 77 và 90, với matlab phải dùng cách khác lủng củng hơn (@-functions).
Bác nào có kinh nghiệm object-oriented xin giảng thêm :D
Tóm lại là mình bắt đầu thích R rồi :D
 
Nhân dịp học ở VLOS chỗ bác Hiếu, mình thấy chức năng soạn thảo trong đó phù hợp với các soạn thảo chương mục. Hay ta khởi động một cuốn hướng dẫn về R cùng soạn hoặc dịch từ wikibooks?
 
Nhân dịp học ở VLOS chỗ bác Hiếu, mình thấy chức năng soạn thảo trong đó phù hợp với các soạn thảo chương mục. Hay ta khởi động một cuốn hướng dẫn về R cùng soạn hoặc dịch từ wikibooks?

Rất hữu ích. Tôi cũng đang làm việc với R nên sẽ đóng góp tích cực.
 
Vậy em khởi động viết thử nghiệm bài "basic" trong note cá nhân, sẽ hoàn thiện dần. Mục tiêu cho người bắt đầu và đơn giản hơn wikibooks, làm cơ sở tiếp tục các phần phức tạp hơn, thực ra ta cùng nhau có một sườn và có thể viết trên tất cả các phần đồng thời.

@Em chưa đọc được bài đó, trang web đó chậm quá, có thể đã có viết rồi thì tốt quá, ta xem tài liệu và tóm tắt lại một cách ngắn gọn.
 
Cuốn " Hướng dẫn phân tích số liệu và vẽ biểu đồ bằng R" của thầy Tuấn được in lâu rồi. Tui có mua ở Saigon một cuốn, rất dễ đọc và hướng dẫn chi tiết. Trên website thì khó đọc hơn.
Ai quan tâm có thể hỏi mua ở nhà sách hoặc đến nhà xuất bản Khoa học và Kỹ thuật.
 
Cuốn " Hướng dẫn phân tích số liệu và vẽ biểu đồ bằng R" của thầy Tuấn được in lâu rồi. Tui có mua ở Saigon một cuốn, rất dễ đọc và hướng dẫn chi tiết. Trên website thì khó đọc hơn.
Ai quan tâm có thể hỏi mua ở nhà sách hoặc đến nhà xuất bản Khoa học và Kỹ thuật.

GS Tuấn viết dựa trên kinh nghiệm của người nhiều kinh nghiệm làm thống kê và R. Ngoài ra cuốn sách đó đã lâu rồi. Chúng ta viết dựa trên kinh nghiệm của begginers dành cho begginers, có những giá trị riêng, cập nhật hơn. Tôi thích cách tiếp cận của Thảo vì nó sẽ giúp tôi rất nhiều.
 
Em vừa xem qua tài liệu của thầy Tuấn soạn, đúng là rất hay và thiết thực, khá ngắn gọn nữa. Tuy nhiên em nghĩ tóm tắt theo cách nhìn của người mới tiếp cận một lần nữa cũng vẫn có ích, theo kiểu khoa học phổ thông và giáo dục bác học :D

Hơn nữa, có thể theo khẩu vị riêng, nhưng cái này cũng do những người sáng lập ra R nói, rằng họ muốn nghĩ về R như một ngôn ngữ lập trình, hơn là một phần mềm ứng dụng, tạo cho người dùng ấn tượng và cách suy nghĩ theo ngôn ngữ R, sau đó đi vào các ứng dụng để có cảm giác về những gì thực sự diễn ra sau các câu lệnh gõ vào, theo em sẽ rất có ích khi người dùng có nhu cầu viết code dài, hoặc edit các code sẵn có. Cái đó thực sự đơn giản ở bước tiếp cận mà thôi.

Cuối cùng, theo thời gian chúng ta sẽ tập hợp thêm và ghi lại những kinh nghiệm riêng từ rất nhiều người khi dùng các phần chuyên biệt khác nhau nữa (có rất nhiều packages và chỉ có wiki mới có thể bao hàm được việc đó!).

Dù sao thì cũng đã bắt đầu thử rồi :D
 

Facebook

Thống kê diễn đàn

Threads
12,268
Messages
72,181
Members
56,607
Latest member
s66douste
Back
Top