Thêm một mô hình AI Trung Quốc lọt Top 10 toàn cầu về đánh giá hiệu suất

VOV.VN - Tiếp theo DeepSeek, một mô hình ngôn ngữ lớn (LLM) khác của Trung Quốc là Qwen2.5-Max của Alibaba, đã đạt được kết quả ấn tượng khi lần đầu tiên lọt vào Top 10 toàn cầu, với hiệu suất mạnh mẽ về mã hóa và toán học.

 

Truyền thông Trung Quốc dẫn thông tin trên trang web của Chatbot Arena – một nền tảng đánh giá của bên thứ ba – sáng ngày 4/2 cho biết, cập nhật mới nhất của Bảng xếp hạng về mô hình ngôn ngữ lớn (LLM) của Chatbot Arena đã chứng kiến ​​Qwen2.5-Max của Alibaba Cloud lần đầu tiên lọt vào bảng xếp hạng top 10 toàn cầu, vượt trội hơn các mô hình như DeepSeek-V3, o1-mini và Claude-3.5-Sonnet.

DeepSeek-R1 và ChatGPT-4o vẫn giữ nguyên vị trí thứ ba trong bảng xếp hạng hiệu suất chung, cũng theo trang web Chatbot Arena.

Ngoài ra, trang này cũng cho biết, Qwen2.5-Max còn xếp hạng nhất về toán học và lập trình, đồng thời giành vị trí thứ hai về Hard Prompts. “Qwen-Max của Alibaba mạnh trên mọi lĩnh vực. Đặc biệt là trong các lĩnh vực kỹ thuật (Lập trình, Toán học, Hard Prompts)”, Chatbot Arena cho biết trong một bài đăng trên mạng xã hội X.

Khoảng 1 tuần trước, công cụ AI Qwen2.5-Max của Alibaba đã được đánh giá là còn mạnh hơn cả DeepSeek khi cho kết quả tốt hơn so với DeepSeek-V3 giới thiệu hồi tháng 12/2024. Thậm chí, Qwen2.5-Max còn vượt qua GPT-4o-0806 và Claude-3.5-Sonnet-1022 trong một số trường hợp. Tuy nhiên, kết quả này chưa so sánh với mô hình mới nhất DeepSeek-R1, phiên bản “được đào tạo trên các chip cũ của Nvidia, mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự”.

Mặc dù vậy, đến nay, Australia đã cấm mọi dịch vụ từ công ty công nghệ Trung Quốc DeepSeek trên các hệ thống và thiết bị của chính phủ, sau những động thái tương tự của các cơ quan Mỹ, như NASA và Lầu Năm Góc.

Mời quý độc giả theo dõi VOV.VN trên

Tin liên quan

Google cung cấp chatbot AI Gemini Live miễn phí cho mọi người dùng Android
Google cung cấp chatbot AI Gemini Live miễn phí cho mọi người dùng Android

VOV.VN - Trợ lý AI Gemini Live đã chính thức được triển khai miễn phí cho mọi người dùng Android giúp bất kỳ ai cũng có thể tải xuống ứng dụng Gemini để sử dụng.

Google cung cấp chatbot AI Gemini Live miễn phí cho mọi người dùng Android

Google cung cấp chatbot AI Gemini Live miễn phí cho mọi người dùng Android

VOV.VN - Trợ lý AI Gemini Live đã chính thức được triển khai miễn phí cho mọi người dùng Android giúp bất kỳ ai cũng có thể tải xuống ứng dụng Gemini để sử dụng.

Chatbot Copilot tự xưng là chủ nhân, người dùng là nô lệ
Chatbot Copilot tự xưng là chủ nhân, người dùng là nô lệ

VOV.VN - Chatbot Copilot gần đây đã khuấy động cộng đồng công nghệ bằng cách cho mình là chủ nhân, còn người dùng là nổ lệ và phải tôn thờ nó.

Chatbot Copilot tự xưng là chủ nhân, người dùng là nô lệ

Chatbot Copilot tự xưng là chủ nhân, người dùng là nô lệ

VOV.VN - Chatbot Copilot gần đây đã khuấy động cộng đồng công nghệ bằng cách cho mình là chủ nhân, còn người dùng là nổ lệ và phải tôn thờ nó.

Anh điều tra Chatbot AI của Snapchat đe dọa quyền riêng tư của trẻ em
Anh điều tra Chatbot AI của Snapchat đe dọa quyền riêng tư của trẻ em

VOV.VN - Anh đang mở một cuộc điều tra đối với Chatbot AI của Snapchat  do những lo ngại về quyền riêng tư của thanh thiếu niên.

Anh điều tra Chatbot AI của Snapchat đe dọa quyền riêng tư của trẻ em

Anh điều tra Chatbot AI của Snapchat đe dọa quyền riêng tư của trẻ em

VOV.VN - Anh đang mở một cuộc điều tra đối với Chatbot AI của Snapchat  do những lo ngại về quyền riêng tư của thanh thiếu niên.