Lee Kai-Fu, nhà sáng lập 01.ai, cũng là cựu giám đốc Google Trung Quốc, cho hay, các công ty đại lục cắt giảm chi phí bằng cách xây dựng mô hình được đào tạo dựa trên lượng dữ liệu nhỏ hơn, đòi hỏi ít năng lực tính toán nhưng được tối ưu hóa phần cứng.

Theo bảng xếp hạng của UC Berkeley SkyLab và LMSYS công bố vừa qua, mô hình Yi-Lingtning của startup 01.ai xếp thứ ba đồng hạng với Grok-2 của x.AI, xếp sau OpenAI và Google. Bảng xếp hạng này dựa trên chấm điểm của người dùng với các câu trả lời truy vấn.

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
Giảm chi phí hoạt động của AI là cách để Trung Quốc cạnh tranh với Mỹ. Ảnh: FT

01.ai và DeepSeek là những công ty AI đại lục đang áp dụng chiến lược tập trung vào tập dữ liệu nhỏ hơn để đào tạo mô hình, đồng thời thuê nhân lực tay nghề cao có giá rẻ.

FT cho biết, chi phí suy luận của Yi-Lightning là 14 xu cho mỗi một triệu mã thông báo, so với 26 xu của GPT o1-mini đến từ OpenAI. Trong khi đó, chi phí của GPT 4o lên tới 4,4 USD/mỗi một triệu mã thông báo. Số lượng mã thông báo được sử dụng để tạo phản hồi phụ thuộc vào độ phức tạp của mỗi truy vấn.

Nhà sáng lập Yi-Lightning tiết lộ công ty này tiêu tốn 3 triệu USD để “đào tạo ban đầu”, trước khi tinh chỉnh cho các trường hợp sử dụng khác nhau. Lee nói rằng mục tiêu của họ “không phải tạo ra mô hình tốt nhất”, mà là xây dựng mô hình cạnh tranh “rẻ hơn từ 5-10 lần”.

Phương pháp mà 01.ai, DeepSeek, MiniMax và Stepfun đã áp dụng có tên “mô hình chuyên gia” - chỉ việc kết hợp nhiều mạng nơ-ron được đào tạo trên tập dữ liệu cụ thể chuyên ngành.

Các nhà nghiên cứu coi phương pháp này là cách chính để đạt được mức độ thông minh tương đương như mô hình sử dụng dữ liệu khổng lồ nhưng cần ít sức mạnh điện toán hơn. Tuy nhiên, điểm khó của cách tiếp cận là việc các kỹ sư phải dàn dựng quy trình đào tạo với “nhiều chuyên gia” thay vì chỉ một mô hình chung.

Do gặp khó khăn tiếp cận những con chip AI cao cấp, những doanh nghiệp Trung Quốc đã chuyển hướng phát triển những tập dữ liệu chất lượng cao, để sử dụng đào tạo mô hình chuyên gia, từ đó làm yếu tố cạnh tranh với đối thủ phương tây.

Lee cho biết 01.ai có những cách thu thập dữ liệu phi truyền thống, chẳng hạn như quét sách hay thu thập bài viết trên ứng dụng nhắn tin WeChat vốn không thể truy cập trên website mở.

Nhà sáng lập này tin rằng Trung Quốc có vị thế tốt hơn so với Mỹ, khi sở hữu nguồn nhân tài kỹ thuật giá rẻ khổng lồ.

(Theo FT, Bloomberg)