Giải mã "bộ gien" tiếng Việt

Đó là đúc rút của GS Lê Tang Hồ, Đại học  Moncton (Canada) sau 30 năm nghiên cứu ngôn ngữ tiếng Việt dưới góc nhìn của ngành khoa học máy tính và âm học

Dạy chữ... cơ duyên với tiếng Việt

Tình cờ làm quen với GS Lê Tang Hồ cùng những người bạn của ông, GS Nguyễn Nhạ và GS Phạm Gia Thụ tại TP Moncton, Canada (hai chuyên gia đầu ngành về quản trị phẩm chất và toán thống kê) vào một ngày chớm đông 2008, ấn tượng đầu tiên về người đàn ông vóc dáng nhỏ nhắn rất Á Đông là những phân tích sâu sắc về tiếng Việt.

Trong câu chuyện của ba giáo sư người Việt đang giảng dạy tại ĐH Moncton, thấp thoáng hình ảnh về vài góc phố Hà Nội, dư vị bún riêu cua, chả cá, phở... Chợt chiếc điện thoại di động của GS Hồ bật lên tiếng nói. Cái giọng đọc tiếng Việt còn đậm tiếng máy nhưng đã tròn vành, rõ chữ.

Chiếc điện thoại di động đã đọc được tiếng Việt nhờ phần mềm mà GS Hồ và các cộng sự hoàn thiện suốt từ năm 2004 đến nay. "Điện thoại đã được cài phần mềm đọc tiếng Việt của tôi. Đây là phiên bản thứ 7 của phần mềm này rồi" - GS Hồ giới thiệu về công trình mà ông đã dành bao tâm huyết.

Từ những năm đầu của thập kỷ 70 của thế kỷ trước, khi còn ở Việt Nam, GS Hồ có cơ duyên với tiếng Việt khi đi dạy đọc, viết tiếng Việt. Trong số học sinh của GS Hồ hồi đó, có rất nhiều người đã lớn tuổi đến từ Bắc, Trung, Nam. Những khó khăn trong việc tìm cách truyền thụ tiếng Việt cho các học trò khác biệt về lứa tuổi, khác biệt về phương ngữ đã thôi thúc GS nghiên cứu, đi tìm mẫu số chung của ngữ âm tiếng Việt. "Đó là cơ may của tôi. Hồi đó, thật không dễ khi có quanh mình đủ giọng Bắc, Trung, Nam để giải thích hiện tượng, phân tích, so sánh và tổng hợp" - GS Hồ tâm sự.

Những kiến thức ngành điện toán khi ông theo học ở Canada, cộng với hiểu biết sâu sắc về ngữ âm tiếng Việt đã giúp GS phát triển thành công giọng nói nhân tạo tiếng Việt đầu tiên vào năm 1988 trên máy IBM-PC-AT (intel-286) nhờ chiếc thẻ tổng hợp ngữ âm của hãng Votrax tặng. Đến năm 2004, sau khi một nhóm nghiên cứu của ĐH Oxford (Anh) công bố việc tổng hợp tiếng nói hoàn toàn dựa trên phần mềm, thì GS và các cộng sự cũng hoàn thành phần mềm đọc tiếng Việt VietVoice phiên bản đầu tiên...

Dự kiến, vào tháng 3.2009, GS Hồ sẽ công bố các nghiên cứu của mình về ngôn điệu làm cơ sở cho ngành ngôn ngữ học máy tính trong đó có ngôn điệu.

Ước mơ về Viện công nghệ tiếng nói cho Việt Nam

GS Hồ đã công bố phiên bản VietVoice 6.0 (miễn phí) trên http://noitiengviet.ca với chất lượng đọc tốt. Với phiên bản này, giọng nói nhân tạo đã được tổng hợp bằng phương pháp trực tuyến trong khi phần mềm đang chạy, thay vì tổng hợp từng từ ngữ ở các phiên bản trước. Hiện phiên bản thứ 7 đã cơ bản hoàn thiện, có chất lượng về ngôn điệu gần như giọng tự nhiên.

Ông ấp ủ ước mơ cùng với các nhà khoa học trong nước lập Viện Công nghệ tiếng nói cho VN: "Trong kỹ thuật tiếng nói, ngoài mảng đọc văn bản thành tiếng, còn có nhận dạng chữ viết và nhận dạng tiếng nói. Tây đã có hệ thống tổng hợp và nhận dạng giọng nói từ lâu rồi còn mình thì chưa. Tiếng Việt thì phải người Việt làm thôi".

Theo GS Hồ, ngôn điệu chỉ là một phần cấu thành trong âm sắc (biệt tính giọng nói của mỗi người). Các nhà khoa học vẫn đang đi tìm lời giải cho hiện tượng khác biệt trong giọng nói của mỗi người.

Ông mơ một ngày, các nhà khoa học sẽ tìm ra toàn bộ "bộ gien" tiếng Việt. Khi đó, máy tính có thể giả giọng của bất kỳ ai./.

Mời quý độc giả theo dõi VOV.VN trên