Liên hệ
Định cư Mỹ
Định cư Canada
Định cư Châu Âu & Caribê

GS Lê Tang Hồ và món quà cho đồng bào người Việt tại Canada

Nhận tin tức mới
13/01/2012

Ông Lê Tang Hồ – Ph.D. và Lanteigne Benoit, BSc. Đại Học Moncton, New Brunswick, Canada – đã nhiều năm là giáo sư ngành tin học. Lĩnh vực nghiên cứu của GS là hệ thống quản trị kiến thức (knowledge management systems), hệ thống trợ huấn thông minh (intelligent tutorial systems) và học tập qua mạng Internet (elearning).

Giáo sư Lê Tang Hồ.

Hơn 30 năm trước trong một dịp tình cờ, ông đã dính vào việc nghiên cứu ngữ âm Việt Nam. Vì vậy, tuy là một GS ngành tin học nhưng Le Tang Hồ thường chú ý đến sự phát triển liên quan đến ngữ âm Việt Nam và cũng đã âm thầm thực hiện một vài cong trình. Và, GS Lê Tang Hồ xem phần mềm Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice – VVV) như là món quà mà ông gửi tặng cho đồng bào VN với ước mong nó sẽ giúp ich trực tiếp cho việc tự học và dạy tiếng Việt cho các thế hệ tương lai và đặc biệt là cho người Việt ở hải ngoại và người nước ngoài muốn học tiếng Việt.

Bắt đầu từ một câu chuyện ngày xửa ngày xưa…

Giao diện của Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice – VVV)

Ngày xửa ngay xưa…, vào cuối năm 1974, tại Đà Lạt, GS Le Tang Hồ đã thuyết trình trước một cử tọa gồm khoảng 20 sinh viên ban ngữ học (học với GS Lê Văn Lý) về đề tài phân tích ngữ âm Việt Nam. Qua buổi nói chuyện đó, các sinh viên rất thích thú với cách giải thích có hệ thống của GS về ngữ âm Việt Nam. Thế nhưng hoàn cảnh đất nước đã khiến cho việc làm này bị bỏ dở. Cho đến hôm nay, sau 30 năm, GS Hồ vẫn chưa liên lạc lại được với các bạn sinh viên nói trên. GS cũng mong rằng, có vị nào trong số sinh viên ngày ấy đọc được thì xin cho GS biết tin, đó sẽ là niềm vui lớn của ông.

Rồi hơn 10 năm sau, năm 1986, GS Hồ được tham quan một cơ sở sản xuất thẻ tổng hợp ngữ âm (synthesizer card) của hãng Votrax tại Chicago, được họ tặng không cho một thẻ trị giá 800USD (vào lúc đó) với yêu cầu GS đánh giá và dúng thử sản phẩm của họ. Không chỉ đánh giá và dùng thử sản phẩm mà với chiếc thẻ miễn phí này, GS Hồ đã tổng hợp thành công tiếng Việt trên máy IBM-PC-AT (intel-286). Tuy nhiên, ở bước nghiên cứu đầu tiên này thì giọng nói phát ra rất… “lai Mỹ”, giới hạn trong việc tổng hợp từng văn bản chứ không thể đọc bất cứ văn bản nào… Còn cả một quá trình tổng hợp giọng noi nhân tạo từ những âm tố cơ bản (phonemes sysnthesis) rất vất vả, nhưng bước đầu đã cho GS kiểm nghiệm và minh chứng là đúng đắn hầu hết các giải thích trước đây của ông về ngữ âm Việt Nam như: các dấu giọng, cách ráp vần, cách phát âm một số phụ âm v.v…

Câu chuyện ngày xửa ngày xưa vẫn tiếp tục… Lại gần 10 năm nữa, năm 1994, qua nguyệt san Khoa Học Kỹ Thuật & Đời Sống (Montreal), GS Lê Tang Hồ đã phổ biến một loạt bài viết về vấn đề dạy tiếng Việt, bao gồm cả việc phân tích tỉ mỉ ngữ âm Việt Nam.

Rồi 10 năm nữa lại trôi qua, mùa hè năm 2004, tại đại học Moncton, khi nhận một sinh viên làm phụ tá nghiên cứu, GS Hồ đã thử nghiệm tổng hợp tiếng Việt bằng phương-pháp “nối vần”, hoàn toàn dùng nhu liệu, dựa trên những nhu liệu nền (platform) có tên là FreeTTS do MicroSun và đại học Carnegie Mellon phổ biến trên mạng Internet. Đây là tiếng Việt được tổng hợp từ 410 vần cơ bản được thu âm, phần còn lại là 4820 đơn vị phát âm đã được tạo ra từ cách “rap vần”. Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice) hoạt động theo nguyên tắc: khi máy đọc văn bản, các từ đơn này sẽ tự động được thêm dấu giọng (giọng không dấu và 5 giọng với các dấu sắc, huyền, hỏi, ngã, nặng). Tổng cộng có 28920 từ đơn, gồm cả những từ có nghĩa và không có nghĩa…. Sau 6 tháng làm việc, GS và nhóm cộng sự đã thành công. Phiên bản Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice – VVV) version 1.1 – 2004 được ra mắt lần đầu tiên. Tuy nhiên, phiên bản này còn một số khuyết điểm: nhịp đọc còn thiếu tự nhiên, hoặc một số từ ngữ có dấu nghe hơi ồn, hoặc các từ ngữ viết tắt hay ngoại nhập chưa phát âm được…

Ngoài ra, GS Lê Tang Hồ còn dự tính thực hiện một nhu liệu phụ là “Tiếng Hát Tổng Hợp”. Với “Tiếng Hát Tổng Hợp”, một giọng mẫu cá nhân, sau khi thu âm và phân tích, có thể hát lên (thay vì chỉ đọc) các bản nhạc một cách chính xác về cao độ và trường độ. GS cũng sẽ thực hiện một số dự án khác nhằm khai thác Nhu Liệu Đọc Tiếng Việt VVV: kết hợp tiếng nói vào các trang Web tiếng Việt, kết hợp việc tổng hợp tiếng Việt với việc nhận hiểu tiếng Việt (speech recognition) nghĩa là làm cho máy vừa “nghe” vừa “nói” được tiếng Việt! Rộng hơn nữa là tự động hóa việc đọc tiếng Việt trong các ứng dụng hướng dẫn công cộng, trên đài phát thanh, hay dùng cho người khiếm thị v.v…

Khoa học và tình yêu tiếng mẹ đẻ

Sơ đồ phân tích chữ mai trong tiếng Việt.

Quá trình tổng hợp tiếng Việt cho phần mềm Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice – VVV) không phải là giản đơn. Sau khi đã thu âm 410 đơn vị ngữ âm cơ bản vào một hay nhiều hồ sơ âm thanh (dạng wave), quá trình tổng hợp tiếng Việt sẽ trải qua ít nhất 5 bước sau đây:

– Tách biệt từng đơn vị cơ bản trong hồ sơ thu âm, gồm cả vần thuận và vần ngược.

– Điều chỉnh hay bình thường hóa (normalize) các vần cơ bản, nếu có thể.

– Nối âm hay ráp vần theo từng lọai vần. Đây la công đoạn mất nhiều thì giờ nhất và có thể phải thu âm lại nhiều lần để các từ ngữ ráp nối không bị “vênh” theo các thuộc tính đã nói trên.

– Điều chỉnh các thông số dấu giọng (thanh bậc). Mỗi người có cách phát âm dấu giọng riêng nhưng ta có thể gom chung thành từng “kiểu mẫu” theo vùng, miền trong nước. Đây là đặc điểm rất khó thực hiện và dễ làm cho giọng nói tổng hợp có tính người máy chứ không phải giọng thực.

– Cuối cùng là công đọan kiểm tra. Tất cả 4820 từ đơn không dấu tạo thành sẽ được nghe lại tỉ mỉ để sửa chữa. Mỗi kho dữ kiện giọng nói (voicebase) sẽ chiếm vào khoảng 65MegaBytes trong ổ đĩa.

Tuy nhiên, sau các bước cơ bản đó, khi đọc một bản văn tiếng Việt lại còn một vấn đề khác phải giải quyết, như là việc phần ngữ điệu (phrasing) v.v…

Sau khi phiên bản Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice – VVV) version 1.1 được ra mắt vào Giáng sinh 2004, GS Lê Tang Hồ lại lao vào nghiên cứu thực hiện phiên bản 2 với nhiều ưu điểm hơn. Đầu năm Ất Dậu GS Hồ
lại cho ra mắt phiên bản VVV 2.0.

Ở VVV 2.0, chất lượng của giọng nói tổng hợp đã được cải tiến một bước quan trọng: tất cả dấu giọng đều trung thực 100% so với giọng được thu âm. Dù vẫn còn một vài khuyết điểm nhưng các từ ngữ tổng hợp nghe đã rõ hơn. Kho dữ liệu được tăng lên đạt 81MB, chỉ gồm những từ ngữ có nghĩa trong tiếng Việt mà thôi. Một số chữ viết tắt và một ít từ ngoại quốc thông dụng đã được thêm vào tự điển. Đặc biệt là người dùng có thể bổ sung dữ liệu theo nhu cầu.

Cả hai phiên bản Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice – VVV) version 1.1 va 2.0 đều được GS Lê Tang Hồ trân trọng tặng miễn phi cho tất cả mọi người để đáp ứng nhu cầu dạy và học tiếng Việt, đặc biệt là cho người Việt ở nước ngoài và người nước ngoài học tiếng Việt. Nhu Liệu Đọc Tiếng Việt – Vietnamese Virtual Voice là một trong rất nhiều ứng dụng hữu ích của kỹ thuật đọc tiếng Việt bằng máy tính bên cạnh những ứng dụng khác: dùng giọng đọc cá nhân để gửi tiếng nói đến khách hàng, khởi động VVV để đọc văn bản tiếng Việt đang hiển thị trên màn hình v.v… GS Hồ còn hứa hẹn sẽ tiếp tục phát triển những ứng dụng như vậy theo yêu cầu của người dùng. Phiên bản Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice – VVV) version 2.0 được xem là món quà mừng xuân Ất Dậu 2005 của GS Lê Tang Hồ gửi đến tất cả những ai quan tâm đến tiếng Việt, thứ tiếng nói mà ta đã yêu từ khi mới ra đời… người ơi… Mẹ hiền ru những câu xa vời… A a ơi! Tiếng ru muôn đời… (Ca khuc Tinh ca – Phạm Duy).

Địa chỉ download miễn phi hai phiên bản Nhu Liệu Đọc Tiếng Việt (Vietnamese Virtual Voice – VVV) version 1.1 va 2.0: http://noitiengviet.ca

(Theo Người Viễn Xứ)
http://www.vnn.vn/psks/2005/03/399838/