Google DeepMind vừa tung ra một bản update thú vị cho mô hình AI Gemini của họ: giờ đây các nhà phát triển có thể “vặn nút” điều chỉnh mức độ mà AI cần phải suy nghĩ trước khi trả lời. Nghe có vẻ lạ, nhưng thật ra tính năng này ra đời vì một vấn đề ngày càng rõ ràng: AI hiện đại, nhất là những con bot thiên về “lý luận” — có xu hướng nghĩ quá nhiều, gây tốn tiền điện, thời gian và tài nguyên, đôi khi lại chẳng cần thiết.
Từ năm 2019, các hãng AI thường có hai chiêu quen thuộc để làm model thông minh hơn: hoặc bơm thêm dữ liệu huấn luyện, hoặc dạy nó cách nhận biết câu trả lời “chuẩn chỉnh” hơn. Nhưng gần đây, một cách tiếp cận thứ ba đã lên ngôi: huấn luyện AI biết lý luận.
Theo Jack Rae, nhà nghiên cứu chính tại DeepMind, “Chúng tôi đã thực sự đẩy mạnh chuyện dạy AI tư duy.” Cách này giúp AI không chỉ ném ra câu trả lời cho có mà sẽ dành thời gian phân tích kỹ càng hơn trước khi chốt đáp án. Nghe thì hợp lý, nhưng đổi lại, việc AI “suy nghĩ” kỹ có thể đội chi phí lên tới hàng trăm đô la cho một tác vụ phức tạp — nhất là khi nó phải xử lý code, phân tích dữ liệu, hay tìm kiếm thông tin trong một đống tài liệu.
Nhưng không phải lúc nào “càng nghĩ nhiều càng tốt.” Tulsee Doshi — trưởng nhóm sản phẩm của Gemini — thừa nhận, đôi khi Gemini nghĩ quá kỹ cho mấy câu hỏi đơn giản, khiến kết quả vừa chậm vừa tốn tiền. Chính vì thế, họ đã thêm một thanh trượt để lập trình viên có thể kiểm soát mức độ “tư duy” của AI tuỳ vào nhiệm vụ cụ thể.
Nathan Habib, kỹ sư tại Hugging Face, cũng nói thẳng: nhiều lúc các công ty AI cứ ép model lý luận ngay cả khi vấn đề chẳng cần. Thậm chí, có lần AI được giao giải một bài hoá hữu cơ, giữa chừng nó bị “loop” vào trạng thái lặp lại vô nghĩa kiểu: “Chờ đã, nhưng…” cả trăm lần — mất thời gian hơn cả model bình thường.
Giải pháp của Google: nếu bài toán đơn giản, hãy “vặn nhỏ” thanh lý luận để tiết kiệm chi phí và giảm tác động môi trường. Còn khi gặp các tác vụ phức tạp như viết code, phân tích tài chính, hoặc viết báo cáo chuyên sâu, có thể tăng mức lý luận lên cho xứng đáng đồng tiền.
Thú vị là việc “bơm thêm lý luận” đang thay thế tư duy cũ: thay vì cứ đào tạo model to hơn, các hãng giờ tin rằng AI thông minh hơn nhờ dành thêm thời gian nghĩ sâu, không phải nhờ phình to. Điều này cũng lý giải vì sao chi phí vận hành AI ngày càng tăng, bởi “suy nghĩ” (thực chất là tính toán) đang ăn điện và tài nguyên khủng khiếp.
Và một lưu ý nhỏ: dù người ta cứ gọi nó là “suy nghĩ” hay “lý luận”, thật ra AI chẳng hề suy nghĩ kiểu con người đâu nhé. Jack Rae giải thích: “Chúng tôi dùng từ này cho dễ hiểu, chứ AI không có nhận thức thật sự.”
Ngoài Google, thị trường còn có DeepSeek — một mô hình “trọng lượng mở” gây bão cuối 2024 vì giá rẻ mà mạnh mẽ, thậm chí từng khiến giá trị thị trường của một số công ty bay hơi gần 1.000 tỷ USD chỉ vì hiệu suất ấn tượng. DeepSeek cho phép bất kỳ ai cũng có thể tải về và tự vận hành, khác hẳn những mô hình trả phí như Gemini hay ChatGPT.
Vậy cuối cùng nên chọn mô hình nào? Theo Koray Kavukcuoglu từ DeepMind, khi công việc yêu cầu tính chính xác cao, hiểu biết sâu như lập trình, toán học, tài chính — thì AI nào đáp ứng tốt nhất, dù mở hay đóng, sẽ giành chiến thắng.
Với DeepMind, họ tin “lý luận” chính là con đường dẫn đến AI thật sự thông minh. Bởi như Kavukcuoglu nói: “Khi một mô hình bắt đầu biết suy nghĩ, nó bắt đầu có ‘ý chí riêng’.”