Lại thêm một mô hình AI cạnh tranh OpenAI với giá siêu rẻ
VOV.VN - Các nhà nghiên cứu tại Đại học Stanford và Đại học Washington vừa công bố một mô hình lý luận AI mới có tên s1 có thể cạnh tranh với OpenAI với chi phí cực thấp.
Theo báo cáo, mô hình AI này được tinh chỉnh từ một tập dữ liệu nhỏ gồm 1.000 câu hỏi và có chi phí dưới 50 USD, rẻ hơn nhiều so với OpenAI. Để phát triển s1, nhóm nghiên cứu đã áp dụng phương pháp chưng cất cho phép các mô hình nhỏ hơn học hỏi từ các câu trả lời của các mô hình lớn hơn.
Cụ thể, các nhà khoa học đã sử dụng các câu trả lời từ mô hình AI của Google, Gemini 2.0 Flash Thinking Experimental. Tuy nhiên, điều khoản dịch vụ của Google cấm việc sử dụng API của Gemini để phát triển các mô hình cạnh tranh, vì vậy sẽ rất thú vị để xem phản ứng của Google đối với mô hình AI này ra sao.
Mô hình s1 được xây dựng dựa trên Qwen2.5, một mô hình mã nguồn mở từ Alibaba Cloud. Ban đầu, nhóm nghiên cứu đã sử dụng một tập dữ liệu lớn với 59.000 câu hỏi, nhưng sau đó nhận thấy rằng việc thu hẹp xuống còn 1.000 câu hỏi không làm giảm hiệu quả của mô hình. Đáng chú ý, họ đã đào tạo s1 chỉ với 16 GPU Nvidia H100, nhưng không mua trực tiếp mà chỉ “thuê dịch vụ điện toán đám mây”.
Kỹ thuật chưng cất giúp AI suy luận hoạt động với chi phí cực thấp
Một trong những kỹ thuật nổi bật của s1 là thang đo thời gian thử nghiệm, cho phép mô hình “suy nghĩ” lâu hơn trước khi đưa ra câu trả lời. Các nhà nghiên cứu đã thêm từ “wait” (chờ) vào phản hồi của mô hình giúp nó kiểm tra lại câu trả lời và sửa chữa các bước suy luận không chính xác.
Mô hình lý luận o1 của OpenAI cũng sử dụng phương pháp tương tự, và công ty khởi nghiệp AI DeepSeek đã cố gắng sao chép điều này với mô hình R1 cùng tuyên bố rằng chi phí đào tạo của họ chỉ bằng một phần nhỏ. OpenAI đã cáo buộc DeepSeek vi phạm các điều khoản dịch vụ của mình bằng cách chắt lọc thông tin từ các mô hình của họ để phát triển đối thủ cạnh tranh.
Theo các nhà nghiên cứu, mô hình s1 “vượt quá o1-preview về các câu hỏi toán học cạnh tranh tới 27%”. Sự xuất hiện của các mô hình AI nhỏ hơn và rẻ hơn có thể làm thay đổi toàn bộ ngành công nghiệp, cho thấy rằng các công ty lớn như OpenAI, Microsoft, Meta và Google không cần phải chi hàng tỷ USD để phát triển AI trong khi vẫn xây dựng các trung tâm dữ liệu khổng lồ chứa hàng nghìn GPU Nvidia.