Nhân bản giọng nói bằng AI, một startup trở thành “kỳ lân” siêu tốc
VOV.VN - Công ty khởi nghiệp ElevenLabs đã đi từ con số 0 lên 1 tỷ USD trong hai năm với công nghệ nhân bản giọng nói bằng trí tuệ nhân tạo (AI).
Nhân bản giọng nói bằng AI “hái ra tiền”
Công ty khởi nghiệp sáng tạo hoạt động trên phần mềm trí tuệ nhân tạo (AI) ElevenLabs đăng ký kinh doanh ở Mỹ và đặt trụ sở chính tại London (Anh) đã đạt được trạng thái "kỳ lân" (được định giá 1,1 tỷ USD) sau vòng gọi vốn mới nhất hồi đầu năm 2024.
ElevenLabs đã sử dụng AI để tạo ra giọng nói với nhiều ngôn ngữ và âm điệu khác nhau. Công ty khởi nghiệp này nhanh chóng gia nhập câu lạc bộ “kỳ lân” khởi nghiệp chỉ trong vòng 2 năm kể từ khi thành lập trong bối cảnh mối quan tâm của nhà đầu tư đối với công nghệ AI ngày càng tăng cao.
Khi các nhà đầu tư đang đổ tiền vào công nghệ AI sáng tạo, công ty khởi nghiệp trẻ ElevenLabs đã huy động được 80 triệu USD (73,4 triệu euro) trong vòng gọi vốn Series B.
Giám đốc điều hành Mati Staniszewski cho biết, ElevenLabs đã chính thức trở thành "kỳ lân" khi sở hữu tư nhân vượt 1 tỷ USD.
Trước khi bước vào sàn chứng khoán để trở thành công ty giao dịch đại chúng, các “ông lớn” như Facebook và Google cũng được xếp vào nhóm “kỳ lân”.
Công ty ElevenLabs đã phát triển các công cụ để người dùng tạo và thiết kế giọng nói AI trên 29 ngôn ngữ. Các sản phẩm nhân bản giọng nói của ElevenLabs đã tìm được chỗ đứng trong lĩnh vực sáng tạo nội dung, trò chơi, xuất bản, giáo dục,…
Giám đốc điều hành Mati Staniszewski chia sẻ: “Chúng tôi đang xây dựng công nghệ tiên tiến để giúp nội dung có thể truy cập được bằng nhiều ngôn ngữ - và giọng nói - nhằm cho phép mọi người kết nối với thông tin và câu chuyện quan trọng”.
Đánh dấu thành công của mình, công ty hai tuổi này cho biết, từ khi ra mắt, người dùng của ElevenLabs đã tạo ra âm thanh trong hơn 100 năm, trong khi số lượng nhân viên công ty tăng vọt từ 5 lên 40 nhân viên.
ElevenLabs đã thu hút được vòng tài trợ mới với sự trợ giúp của quỹ đầu tư mạo hiểm Andreessen Horowitz, cùng với Sequoia Capital, Smash Capital, SV Angel, và một số quỹ khác.
Theo thông cáo báo chí của ElevenLabs, 80 triệu USD mới huy động được sẽ được dùng vào hoạt động nghiên cứu và phát triển. Một trong những dự án mà công ty đang thực hiện là phát triển thêm công cụ phân loại giọng nói AI để có thể xác minh xem mẫu âm thanh có chứa nội dung do ElevenLabs tạo hay không.
ElevenLabs tôn trọng quyền của người sáng tạo và giải quyết vấn đề này bằng một tính năng mới. Thị trường “Thư viện giọng nói” là một nền tảng nơi người dùng có thể kiếm tiền cho bất kỳ phiên bản AI nào mà giọng nói của họ được sử dụng.
Một sản phẩm khác mới được công bố của ElevenLabs có thể chuyển đổi nội dung giọng nói sang các ngôn ngữ khác trong thời gian ngắn, được gọi là lồng tiếng AI.
Ai là “cha đẻ” của ElevenLabs?
Công ty ElevenLabs được đồng sáng lập bởi Piotr Dabkowski, cựu kỹ sư của Google và Staniszewski, cựu chiến lược gia của công ty phần mềm Palantir, cả hai đều lớn lên ở Ba Lan. Theo TechCrunch, hai nhà đồng sáng lập này được truyền cảm hứng từ cách lồng tiếng của những bộ phim Mỹ mà họ đã xem khi lớn lên ở Ba Lan. Từ đó họ bắt đầu thiết kế một nền tảng có thể hoạt động tốt hơn.
Kể từ khi ra mắt công chúng vào năm 2022, ElevenLabs tuyên bố rằng người dùng của họ đã tạo ra âm thanh có giá trị hơn 100 năm. Trong giai đoạn này, công ty đã mở rộng đội ngũ từ 5 lên 40 thành viên. Theo báo cáo của EU-Startups, 41% các công ty trong danh sách Fortune 500 đang sử dụng công nghệ của ElevenLabs.
Nhân bản giọng nói bằng AI có nguy hiểm không?
Vào năm 2023, ElevenLabs cho biết họ đã phát hiện số trường hợp lạm dụng nhân bản giọng nói AI ngày càng tăng trong giai đoạn thử nghiệm.
Một số người dùng đã dùng sản phẩm của ElevenLabs để mô phỏng giọng nói bắt chước một số nhân vật nổi tiếng, phổ biến nội dung phân biệt chủng tộc và nhiều nội dung xúc phạm khác. Do đó, công ty sẽ đưa ra các biện pháp bảo vệ bổ sung để ngăn chặn sự gia tăng của giọng nói giả mạo.
Cũng có phản ứng từ các diễn viên lồng tiếng cho rằng người dùng đã sử dụng phần mềm này để quấy rối. Những kẻ lừa đảo được cho là đã tạo ra giọng nói và sau đó yêu cầu giọng nói giả mạo đọc địa chỉ nhà của nạn nhân, đăng kết quả lên mạng.
ElevenLabs không phải là công ty duy nhất dùng AI để nhân bản giọng nói. Hồi giữa năm 2023, Voice.ai, một công nghệ thay đổi giọng nói theo thời gian thực, cũng gọi vốn thành công 6 triệu USD để phát triển nền tảng của mình.
Startup kỳ lân (unicorn startup) là thuật ngữ chỉ những công ty khởi nghiệp được định giá trên 1 tỷ USD. Kỳ lân là loài vật trong trí tưởng tượng, gắn liền với sự hiếm có. Hiện, các startup kỳ lân đạt được mức định giá 1 tỷ USD trong 10 năm cũng chỉ chiếm 0,07% trên tổng số các công ty khởi nghiệp.
Thuật ngữ “startup kỳ lân” được sử dụng lần đầu tiên bởi Aileen Lee – nhà đồng sáng lập quỹ đầu tư Cowboy Venture – trong bài viết đăng trên TechCrunch năm 2013. Aileen Lee muốn dùng từ “kỳ lân” để miêu tả được bản chất của nhóm các công ty khởi nghiệp công nghệ có giá trị hơn 1 tỷ USD và được thành lập tại Mỹ sau năm 2003. Tại thời điểm bài viết xuất bản, mới chỉ tìm ra được 39 công ty đáp ứng các tiêu chí này.