Dự án Từ điển Hàn lâm tiếng Việt

Cao Xuân Hiếu

Administrator
Staff member
Hi all,

Tôi cùng với một số anh chị nhóm Bio-vn và VietScience đang có kế hoạch xây dựng một bộ từ điển wiki (hơi giống với Wiktionary hoặc Baamboo tra từ) để là nơi phát triển và thống nhất các thuật ngữ mới trong các lĩnh vực công nghệ.

Quá trình xây dựng từ điển rất cần các ý tưởng và ý kiến đóng góp của các bạn để dự án thành công. Xin cám ơn trước.

Một số thông tin có thể đọc ở

Dự án Từ điển Hàn lâm tiếng Việt

Trân trọng,
 
Thật ra ở VN có tình trạng là, dịch hợp lý chưa chắc đã được chấp nhận bởi chưa hình thành thói quen dùng.
Kể cả có một tổ chức có thẩm quyền đứng ra làm chắc gì đã được người ta theo.
Trước hết lãnh đạo cho biết cách làm việc của nhóm được không? Ví dụ sẽ tham khảo và giữ lại những gì (từ điển chuyên ngành phần lớn không có ích lắm bởi nhiều từ khó dịch thì trong từ điển cũng không thấy luôn).
Kể ra một cách làm hay là chỉ dịch lại phần định nghĩa tiếng Anh, còn cứ giữ nguyên từ tiếng Anh cho đến khi nào có ai đó Eureka được một từ gì tuyệt cú thì hãy đưa vào. Hoặc giả đợi đến khi tiếng Việt tiến hóa đến một mức nào đó mới đủ từ ngữ dịch chăng?
 
Thật ra ở VN có tình trạng là, dịch hợp lý chưa chắc đã được chấp nhận bởi chưa hình thành thói quen dùng.
Kể cả có một tổ chức có thẩm quyền đứng ra làm chắc gì đã được người ta theo.

Tôi lựa chọn cách là để lưu hành bộ từ điển miễn phí và thuận tiện tra cứu với hy vọng tạo thói quen sử dụng và dần chấp nhận tính đúng đắn hoặc sẽ tham gia hoàn thiện tính đúng đắn của từ điển.

Trước hết lãnh đạo cho biết cách làm việc của nhóm được không? Ví dụ sẽ tham khảo và giữ lại những gì (từ điển chuyên ngành phần lớn không có ích lắm bởi nhiều từ khó dịch thì trong từ điển cũng không thấy luôn).

Bước 1: lấy hết dữ liệu các bộ từ điển tiếng Việt miễn phí hiện có để biên soạn sao cho hình thức dễ sử dụng và tra cứu.

Bước 2:xây dựng các nhóm chuyên biệt và hoàn thiện các nhóm thuật ngữ cập nhật cũng như đề xuất thuật ngữ mới (vd. nhóm y sinh sẽ cố gằng làm bộ term của Medline.

Kể ra một cách làm hay là chỉ dịch lại phần định nghĩa tiếng Anh, còn cứ giữ nguyên từ tiếng Anh cho đến khi nào có ai đó Eureka được một từ gì tuyệt cú thì hãy đưa vào. Hoặc giả đợi đến khi tiếng Việt tiến hóa đến một mức nào đó mới đủ từ ngữ dịch chăng?

Vâng, để có thể đề xuất một thuật ngữ thì trước đó phải hiểu cho đúng và chính xác đối tượng mà mình muốn mô tả. Một thuật ngữ cũng có đời sống giống như sinh vật nghĩa có cũng trải qua sinh, lão, bệnh, tử. Chỉ những thuật ngữ nào được chấp nhận (hữu dụng) và biến đổi phù hợp (tương thích) mởi có khả năng sinh tồn.

Cám ơn các ý của anh Lương. Xin mời các ý kiến tiếp theo.
 
Theo ý kiến của tôi thì trước mắt mình có thể liên hệ với các Giáo sư đã biên soạn các cuốn từ điển các chuyên ngành khác nhau. Sau đó có thể biên soạn lại dưới dạng Từ điển điện tử để tiện tra cứu và sử dụng rộng rãi hơn (vấn đề này kể cũng hơi khó vì còn bản quyền). Đó là cả một kho tri thức mà chưa được sử dụng. Bản thân tôi cũng có mua một cuốn từ điển chuyên ngành Sinh học Anh-Việt - Việt Anh về nhưng lại toàn sử dụng từ điển internet.

Trong quá trình đó, mình đồng thời bổ sung những thuật ngữ mới hoặc có thể chưa xuất hiện trong các bộ từ điển đã soạn.

VD: - Cuốn từ điển chuyên ngành di truyền sinh học của GS Lê Đình Lương rất hay, dưới dạng PDF file nhưng đôi khi cũng ko tiện tra cứu, vì thời này là thời đại của internet. Những thuật ngữ đó đã được những GS sàng lọc và biên soạn khá chuẩn, đồng thời thống nhất cho cả người học và người dạy.

Một số thuật ngữ mà chưa được sử dụng trong từ điển hoặc mới đưa vào sử dụng chẳng hạn: metagenome, mimivirus...

Vài ý kiến cán nhân, ko biết mọi người nghĩ sao.
 
Xin chào Hiếu

Hiếu có thể giải thích cho tôi một số điểm mà cá nhân tôi chưa thật sáng tỏ, câu hỏi là thế này:
1. Dự án Từ điển Hàn lâm tiếng Việt và thư viện VOLS (thuvienkhoahoc.com) có khác nhau không ? nếu khác nhau thì về sau có nên sát nhập làm một không ?
2. Theo đường Link đến trang web của VAG, tôi thấy lực lượng tham gia vẫn còn đang cập nhật nên tôi có sai không khi phán đoán lực lượng này chínhi là "đội hình chủ lực" của VLOS ? thêm nữa là những dự án như của các anh Phạm Hải, Võ Quang Nhân đều mới là ý tưởng, vậy họ sẽ làm riêng bộ từ điển online độc lập trước, hay xác định là làm như một modul của VAG ?
3. Nếu chúng ta làm một VAG như trong mục tiêu đã đề ra thì đây sẽ là một dự án khổng lồ bởi vì nó bao gồm tất cả các lĩnh vực, vậy nguồn nhân lực và vật lực cơ bản đã được thiết lập hay bây giờ mới bắt đầu. Nói một cách khác, ngôi nhà của VAG đã đào móng,đóng cọc xong chưa hay bây giờ mới bắt đầu thuê thợ, thuê thầy :)

Xin cảm ơn trước, tôi hỏi cho cá nhân tôi thôi nhé, vì tôi muốn hiểu thật rõ trước khi "hăng hái" đóng góp những ý kiến "có ích" cho VAG. Rất rất ủng hộ VAG.
 
Em có ý kiến thế này:

Dự án từ điển Hàn Lâm cho tất cả các lĩnh vực liệu có quá hoành tráng không? Em nghĩ nên thay Hàn Lâm bằng Phổ thông bởi lẽ những cụm từ, thuật ngữ chuyên ngành chuyển ngữ ở cấp độ phổ thông là cần thiết, còn cao hơn sâu hơn nên dùng trực tiếp tiếng Anh.

Em xong MS rồi, sắp tới chắc có thời gian rảnh nên cũng đang định làm module tra từ điển sinh học phổ thông trên SHVN, và khởi động lại ý tưởng xây dựng database Thực vật / Động vật Việt Nam. Liệu có đụng hàng không nhỉ?
 
Định chờ Hiếu trả lời thì mới đưa ý kiến, nhưng thấy Cường post ý kiến gần với của mình nên cũng nói luôn.
- Theo cá nhân mình, Cường cứ triển khai từ điển trên diễn đàn, có thể sẽ đụng hàng với VAG nhưng chắc cũng còn lâu, mà nhu cầu thì lại cần ngay đặc biệt là các bạn học sinh-sinh viên bắt đầu tiếp cận với tài liệu tiếng anh.
- Giống như ý tưởng của Cường, các diễn đàn khoa học khác như toán học, hóa học, vật lý ... có lẽ đã, đang và sẽ phát triển phần từ điển dưới dạng phổ thông, chuyên ngành ... đây chính là một "mỏ dữ liệu" mà VAG có thể sử dụng.
Tôi có "siêu tưởng tượng" :) thế này (có gì góp ý, bổ sung nhé):
B1. Ban lãnh đạo VAG thuyết phục và hỗ trợ ban quản trị của các diễn đàn khoa học, công nghệ tập trung nhân lực, vật lực xây dựng từ điển chuyên ngành theo chuẩn của VAG.
B 2. Có thể có những ngành mà VAG quan tâm hiện nay chưa lập diễn đàn thì ta mời cao thủ, tập hợp người có tâm huyết mở ra những diễn đàn tương ứng rồi tiến hành như bước 1.
B 3. Những bộ từ điển chuyên ngành tương đối hoàn chỉnh và đã có vài lần "tiến hóa" tại các diễn đàn sẽ được tích hợp vào bộ từ điển chính của VAG.
B 4. Khi mà VAG đã "vang danh", mọi sinh hoạt khoa học trên internet sẽ đều gõ cửa VAG, muôn người về một mối, diễn đàn nào cũng dùng VAG làm kho tham khảo kiến thức, không cần từ điển riêng nữa :). Lúc đó thì ai cũng tập trung vào việc xây dựng VAG như là một cuốn bách khoa toàn thư của chính mình.
 
Hi anh Tùng (có phải anh Tùng dưới Vi sinh ko nhỉ) và Cường,

Xin trả lời thêm các thông tin như sau nhé:

1. Dữ liệu: Từ điển VAG cộng hợp 2 bộ từ điển wiki tiếng Việt miễn phí hiện nay vào làm một là bộ Wiktionary và Baamboo tra từ. Bộ từ điển VAG tích hợp nghĩa chuyên ngành cùng vào nhóm nghĩa phổ thông mà ko chia ra làm các bộ từ điển chuyên ngành thành phần.

2. Nhân lực: Hiện giờ VAG gồm nhóm ở VLOS và VietScience hiện đang kêu gọi các bậc lão thành ở bio-vn, SHVN (lấy dân Sinh - Y làm nòng cốt). Như trong bản kế hoạch thì có 2 nhóm nhân lực chính: 1) nhóm cổ cồn trắng là nhóm đóng góp ý tưởng hoặc bàn luận nên hay ko nên dùng thuật ngữ nào; 2) nhóm cổ cồn xanh là nhóm dành thời gian của mình chỉnh sửa lại các chi tiết của từ điển cho hoàn hảo; cũng như dịch qua lại các định nghĩa, khái niệm.

3. Tiến độ: Cọc và móng đang đóng. Data đang được làm đầy. Dự kiến bản beta sẽ ra mắt (giới hạn) trong dịp X-mas và bản chính thức vào dịp tết DL.

4. Hàm Lâm. Tôi chọn chữ Hàn lâm bởi nó được xây dựng bởi những ng có học vị rõ ràng. Và chủ yếu phát triển các công cụ dịch tự động các văn bản văn phong khoa học (academic) chứ ko phải ngôn ngữ chat chít, xì tin.

5. SHVN. Nếu Cường có thời gian cứ xây dựng càng hùng hậu các tốt. Từ điển là thuốc bổ, không bổ chỗ này thì chỗ kia.

6. Tương thích cấu trúc. Khi VAG ra đời thì cũng công bố chuẩn cấu trúc của VAG. Nếu chuẩn này được nhiều dự án lựa chọn thì việc exchange data trở nên dễ dàng hơn. Đúng như anh Tùng phân tích.

Các ý kiến của anh Tùng và Cường rất thú vị. Xin mời các ý kiến hoặc thắc mắc tiếp.
 
Chào mọi người,
Tham gia forum này lâu rồi nhưng ít để ý. Hôm nay tự nhiên thấy cái dự án này, cũng thấy hay.
Em là admin bên forum Vật lý và cũng tham gia viết khá nhiều bài trên wikipedia (em chỉ biết ít về vật lý thuộc chuyên ngành của em nên bài nó hạn hẹp). Bên forum bọn em cũng từng có ý định làm từ điển kiểu này.
Nếu các anh có ý định làm từ điển cho nhiều ngành khoa học, hi vọng dân Vật lý có thể cùng tham gia.
Chào mọi người
http://www.vatlyvietnam.org
 
Chào mọi người,
Tham gia forum này lâu rồi nhưng ít để ý. Hôm nay tự nhiên thấy cái dự án này, cũng thấy hay.
Em là admin bên forum Vật lý và cũng tham gia viết khá nhiều bài trên wikipedia (em chỉ biết ít về vật lý thuộc chuyên ngành của em nên bài nó hạn hẹp). Bên forum bọn em cũng từng có ý định làm từ điển kiểu này.
Nếu các anh có ý định làm từ điển cho nhiều ngành khoa học, hi vọng dân Vật lý có thể cùng tham gia.
Chào mọi người
http://www.vatlyvietnam.org


Hi Thế,

Thật vui khi nhận được tin này. Một dự án cộng đồng chỉ có thể thành công nếu nó được sự hưởng ứng và ủng hộ từ chính những người muốn sử dụng thành quả của dự án. Tôi xin bổ sung SHVN và VLVN vào danh sách những thành viên và tổ chức tham gia sáng lập từ điển VAG.

Cá nhân và tổ chức sáng lập Từ điển Hàn lâm tiếng Việt

Nhân đây tôi cũng nhờ Thế giới thiệu dự án Từ điển VAG trên VLVN cũng như tham khảo các ý tưởng hay kế hoạch từ các bạn trên VLVN về cách thức tổ chức, những danh sách most wanted terms mà cần phải giải thích và chuyển ngữ trong Vật lý .v.v sao cho mảng Vật lý của từ điển VAG đáp ứng được nhu cầu của chính các thành viên VLVN đâu tiên.

PS. Nick tôi trên Wikipedia tiếng Việt là Vietbio. Nếu lên đó thì xin để lại lời nhắn.

Rất mong các ý kiến tiếp theo,
 
vụ từ điển này nếu có phần đa dạng sinh học và quy hoạch nông thông có sự tham gia của người dân thì kể ra cũng có ích đấy nhỉ. Chả là 2 thằng này thường phải thuê dịch tài liệu từ Việt sang Anh sang Việt mà.
Nghiêm túc một tí: trong các từ điển chuyên ngành thường có một phần nhỏ từ không hẳn là chuyên ngành, ví dụ regulate, mediate, upregulate...v.v, những từ này có nên đưa vào không nhỉ?
 
trong các từ điển chuyên ngành thường có một phần nhỏ từ không hẳn là chuyên ngành, ví dụ regulate, mediate, upregulate...v.v, những từ này có nên đưa vào không nhỉ?

Hi anh Lương, từ điển sẽ không giới hạn từ vừng và cho phép insert các từ mới một cách dễ dàng. Các từ sẽ bao gồm nghĩa thông thường và các nghĩa chuyên ngành hoặc các từ dịch thuật tương đương với các văn cảnh khác nhau.

Ngoài ra, từ điển không chỉ gồm từ vựng, phát âm và ngữ pháp mà còn bao gồm ngân hàng các câu ví dụ song song các ngôn ngữ. Nó sẽ giúp ích những dịch giả khá hiệu quả.

@Thế:Cám ơn bạn đã post bài trên VLVN. Tôi đã update link đến VLVN để mọi ng trên VLOS có thể access trực tiếp topic mà bạn tạo ra.

Trên VLVN có 2 thành viên kỳ cựu của Wikipedia là anh TTtrung và anh Dạ trạch (Hải). Hy vọng các anh cũng sẽ tham gia từ điển này.
 
Hiếu có biết cái website này không? http://www.tudientiengviet.net/member.html

Có chứ. Đây là dự án được coi là kế tục dự án của anh Hồ Ngọc Đức. Cái điểm yếu của dự án này là xây dựng các bộ từ điển riêng biệt Việt - Hàn, Việt - Nhật, Việt - Đức riêng biệt nên đã hạn chế sức mạnh của 1 từ điển số hóa, tra chéo và nhanh nhiều ngôn ngữ. Với từ điển Hàn lâm khi bạn gõ từ "cơ chế" thì sẽ có 1 bảng là tương đương với tiếng Đức là gì, tiếng Anh, tiếng Pháp là gì.

Ngoài ra dự án này thích hợp với các ngữ nghĩa phổ thông chứ ko đi sâu vào nghĩa công nghệ. Cũng như từ điển không cung cấp thông tin về ngữ pháp, phải chia động từ ở các thì như thế nào .v.v Thế nên thực chất chỉ là những cuốn từ điển giấy được html hóa.

Đó là một vài điểm khác biệt tuy nhiên em vẫn đang tìm kiếm cơ hội kết hợp các nỗ lực xây dựng vào một dự án để nâng cao sức mạnh cũng nhu suy nghĩ về tính tương thích đẻ việc cập nhận các nỗ lực khác nhau một cách thuận tiện nhất.
 
Cho em hỏi chút:
- Cách viết bài ở từ điển này sẽ theo kiểu của wikipedia hay là theo cách ngắn gọn của các từ điển bách khoa (ví dụ em đọc từ điển bách khoa toàn thư VN, quá nhiều thuật ngữ vật lý viết quá vắn tắt, giải thích còn thiếu chính xác nên ko tán thành kiểu này lắm)? Em thì em thích theo kiểu của wiki, nội dung đầy đủ hơn và khách quan hơn.
- Những người phụ trách cần đủ các lĩnh vực vì thực ra khoa học bây giờ quá rộng, ngay cả trong 1 chuyên ngành hẹp đã chia thành đủ thứ nhỏ hẹp hơn nữa nên rất khó để kiểm tra nội dung và sửa chữa cho tất cả các bài. Vậy làm sao để khắc phục điều này?
- Có bị vướng mắc về các thủ tục bản quyền (nhất là hình ảnh) như kiểu wiki ko? Em ngại nhất trên wiki là cái này, vì có nhiều hình rất quan trọng cho bài viết mà cứ bị dính bản quyền vào mà ko biết làm sao để lấy cái giấy phép sử dụng.
- Có được copy lại các bài viết từ wiki sang ko? Cá nhân em cũng viết được một số lượng bài về chủ đề vật lý thuộc chuyên ngành hẹp của em, nếu mà ko được copy lại sang mà phải viết lại thì chả biết viết ra sao :D
 
- Cách viết bài ở từ điển này sẽ theo kiểu của wikipedia hay là theo cách ngắn gọn của các từ điển bách khoa (ví dụ em đọc từ điển bách khoa toàn thư VN, quá nhiều thuật ngữ vật lý viết quá vắn tắt, giải thích còn thiếu chính xác nên ko tán thành kiểu này lắm)? Em thì em thích theo kiểu của wiki, nội dung đầy đủ hơn và khách quan hơn.

Hi Thế,

Từ điển Hàn lâm sẽ giống một cuốn từ điển từ vựng (Wiktionary) hơn là cuốn từ điển bách khoa (Wikipedia). Từ điển từ vựng thì chỉ cung cấp một đoạn định nghĩa ngắn gọn (khoảng 3 - 5 câu) trong khi trên Wikipedia là một bài viết tương đối dài và nhiều khía cạnh. Tuy nhiên, sẽ có đường liên kết interwiki nối từ điển Hàn lâm với mục từ tương ứng trên Wikipedia.

Tất nhiên là Từ điển Hàn lâm là một wiki nên những giải thích thiếu chính xác hoặc lỗi thời hoàn toàn có thể sửa đổi và hoàn thiện.

- Những người phụ trách cần đủ các lĩnh vực vì thực ra khoa học bây giờ quá rộng, ngay cả trong 1 chuyên ngành hẹp đã chia thành đủ thứ nhỏ hẹp hơn nữa nên rất khó để kiểm tra nội dung và sửa chữa cho tất cả các bài. Vậy làm sao để khắc phục điều này?

Dự án có chiến lược sau để khắc phục điều này:

1. Tính chính danh: nghĩa là người đóng góp nội dung (học giả) là những người có tên họ, học vị và chuyên ngành cũng như địa chỉ liên lạc dễ dàng.
2. Tính thuận tiện: mỗi học giả có thể đứng ra mời cũng như bảo đảm tính chính danh của các học giả khác muốn tham gia. Như vậy theo thời gian, cộng đồng sẽ phát triển theo cấp số mũ.

- Có bị vướng mắc về các thủ tục bản quyền (nhất là hình ảnh) như kiểu wiki ko? Em ngại nhất trên wiki là cái này, vì có nhiều hình rất quan trọng cho bài viết mà cứ bị dính bản quyền vào mà ko biết làm sao để lấy cái giấy phép sử dụng.

Bản quyền là gót chân asin của các dự án miễn phí và là mâu thuẫn đỉnh điểm của copyright và copyleft. Trong đó, các file hình ảnh và multimedia là dễ dàng bị kiểm soát bởi copyright nhất. Dự án từ điển hàn lâm cũng ko có cách nào thoát ra khỏi cái vòng đó để bảo vệ những thành viên của mình. Tuy nhiên, nếu so sánh với Wikipedia thì dự án từ điển hàn lâm có tính rộng rãi hơn vì nó chấp nhận cả những file thuộc luật creative commons và GNUL chứ ko phải chỉ mỗi GNUL như ở Wikipedia.

- Có được copy lại các bài viết từ wiki sang ko? Cá nhân em cũng viết được một số lượng bài về chủ đề vật lý thuộc chuyên ngành hẹp của em, nếu mà ko được copy lại sang mà phải viết lại thì chả biết viết ra sao :D

Em có thể copy từ Wikipedia và Wiktionary hay Baamboo sang từ điển hàn lâm do tính tương thích về luật bản quyền. Tuy nhiên lưu ý về sự khác biệt về nội hàm của từ điển từ vựng (ngôn ngữ) với từ điển bách khoa.

Nếu em mong muốn viết các bài có tính thoải mái, bách khoa với các hình ảnh có bản quyền hoặc em muốn giữ lại bản quyền các bài viết wiki của mình thì hãy đăng nó ở Tủ sách Khoa học VLOS.

http://www.thuvienkhoahoc.com/tusach/

Xem thêm
VLoS so sánh với Wikipedia

Nhân đây cũng xin công bố URL chính thức của dự án http://www.tudienhanlam.org (hiện chưa kích hoạt mà redirect về Tủ sách Khoa học VLOS.

Mail list của dự án http://groups.yahoo.com/group/VAG_mail_group/ . Xin mời tự do tham gia.
 

Facebook

Thống kê diễn đàn

Threads
11,649
Messages
71,550
Members
56,918
Latest member
sv368net
Back
Top