Ra mắt nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng AI

VOV.VN - VAIS và VBee là hai nền tảng tiên phong trong công nghệ lõi xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo (AI) tại Việt Nam.

Chiều 19/6, Bộ Thông tin và Truyền thông (TT&TT) tổ chức ra mắt nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo VAIS và Vbee.

Đánh giá về VAIS và Vbee, Thứ trưởng Bộ TT&TT Nguyễn Thành Hưng cho biết, đây là hai nền tảng tiên phong trong công nghệ lõi xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo (AI) tại Việt Nam.

Thứ trưởng Bộ TT&TT Nguyễn Thành Hưng phát biểu tại lễ ra mắt.

Theo Thứ trưởng Nguyễn Thành Hưng, Xu thế tự động hoá và tương tác giọng nói vào các thiết bị thông minh như nhà thông minh, thiết bị trên ô tô, giao thông thông minh, thành phố thông minh, tương tác người máy…chắc chắn là xu thế bắt buộc trong cuộc cách mạng công nghệ 4.0.

“Cả VAIS và Vbee đều đứng trước thị trường rộng lớn với hơn 96 triệu dân, 700.000 doanh nghiệp, 126 triệu thuê bao điện thoại di động, tỷ lệ người sử dụng internet đạt 68,7% (số liệu thống kê năm 2019)”, Thứ trưởng Nguyễn Thành Hưng cho hay.

Ngoài ra, nền tảng chuyển đổi tiếng nói tiếng Việt thành văn bản VAIS cũng có tiềm năng lớn với khối cơ quan nhà nước với 22 Bộ, cơ quan ngang bộ, 8 cơ quan thuộc Chính phủ, 63 tỉnh, thành phố trực thuộc Trung ương bao gồm toàn bộ các cơ quan hành chính, đơn vị sự nghiệp các cấp.

“Tôi tin tưởng rằng với năng lực sáng tạo của doanh nghiệp công nghệ số Việt Nam và tiềm năng to lớn của thị trường trong nước, sẽ có ngày càng nhiều các nền tảng số tham gia Chương trình chuyển đổi số quốc gia, góp phần thúc đẩy mạnh mẽ tiến trình chuyển đổi số trong chính phủ, kinh tế và xã hội”, Thứ trưởng Nguyễn Thành Hưng khẳng định.

Nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo VAIS và Vbee cũng là 2 nền tảng số Make in Việt Nam tiếp theo được Bộ Thông tin và Truyền thông lựa chọn giới thiệu và bảo trợ về truyền thông trong khuôn khổ Chương trình Chuyển đổi số quốc gia.

Theo đại diện của VAIS, đây là nền tảng công nghệ lõi chuyển giọng nói tiếng Việt thành văn bản (Speech To Text) với những đặc trưng như: Nhận dạng được đầy đủ  giọng nói cả 3 miền Bắc, Trung, Nam có độ chính xác lên đến 95%; Chuyển đổi giọng nói tiếng Việt thành văn bản tức thì; Nhận dạng tốt trong môi trường nhiễu và ở khoảng cách xa. Đặc biệt, nền tảng này có tính năng chuẩn hóa văn bản đầu ra: tên riêng, ngày, tháng, số…, hỗ trợ nhiều loại định dạng âm thanh đầu vào.

Trong khi đó, Vbee lại là nền tảng công nghệ lõi về giọng nói nhân tạo Việt có cảm xúc (chuyển đổi văn bản thành giọng nói trí tuệ nhân tạo tiếng Việt có cảm xúc - Text To Speech) tại Việt Nam.

Công nghệ Vbee sở hữu những đặc trưng như: Học theo bất kỳ giọng của một người nào đó trong vòng 4 giờ đồng hồ với độ tương tự trên 95%. Giọng nói Vbee đa dạng vùng miền (Bắc, Trung, Nam...), giới tính và độ tuổi. Công nghệ giọng nói nhân tạo Vbee cũng có thể dự đoán cách đọc, các từ viết tắt, từ vay mượn, các từ ngữ đặc trưng của tiếng Việt mà các giải pháp nước ngoài không thể./.

Mời quý độc giả theo dõi VOV.VN trên