Databricks “Hack” AI: Giúp Mô Hình Tự Nâng Cấp Không Cần Dữ Liệu “Sạch”

AI giờ có thể tự học mà không cần dữ liệu “gắn nhãn” chuẩn?

Databricks – công ty chuyên giúp doanh nghiệp xây dựng AI riêng – vừa công bố một kỹ thuật máy học đột phá, cho phép mô hình AI tự cải thiện hiệu suất mà không cần dữ liệu được gắn nhãn cẩn thận. Đây có thể là “chìa khóa” giúp các công ty triển khai AI dễ dàng hơn, đặc biệt khi dữ liệu chất lượng cao là thứ xa xỉ.

Bài Toán Dữ Liệu “Bẩn”

Jonathan Frankle, nhà khoa học AI trưởng tại Databricks, chia sẻ với WIRED: “Mọi công ty đều có dữ liệu và ý tưởng ứng dụng AI, nhưng dữ liệu thực tế thường lộn xộn, không sẵn sàng để ‘nhồi’ vào mô hình.”

Vấn đề này đặc biệt nghiêm trọng với các Large Language Model (LLM) như GPT-4 hay Gemini của Google. Để AI làm tốt việc chuyên biệt (ví dụ: phân tích báo cáo tài chính, chẩn đoán y tế), chúng cần được “tinh chỉnh” (fine-tune) bằng dữ liệu chất lượng. Nhưng thu thập và gắn nhãn dữ liệu tốn kém và mất thời gian.

Giải Pháp: Kết Hợp “Best-of-N” và Học Tăng Cường

Databricks đề xuất phương pháp TAO (Test-Time Adaptive Optimization), dựa trên hai ý tưởng:

  1. “Best-of-N”: Cho AI thử nhiều lần, chọn kết quả tốt nhất.
  2. Học tăng cường (Reinforcement Learning): AI tự học từ phản hồi, như game thủ luyện skill qua thực chiến.

Cụ thể, Databricks dùng một mô hình phụ (DBRM) để đánh giá và chọn output tốt nhất từ AI chính. Những lựa chọn này sau đó được dùng để “đào tạo ngược” giúp AI tự nâng cấp.

Kết quả ấn tượng:

  • Trên bộ benchmark tài chính FinanceBench, mô hình Llama 3.1B (miễn phí của Meta) ban đầu đạt 68.4%, thua xa GPT-4 (82.1%).
  • Sau khi áp dụng TAO, Llama 3.1B nhảy vọt lên 82.8%, vượt mặt cả GPT-4!

Tương Lai Của AI: Tự Học, Ít Phụ Thuộc Vào Dữ Liệu

Christopher Amato (Đại học Northeastern) nhận định: “TAO rất tiềm năng, nhất là khi dữ liệu tốt khan hiếm. Nó có thể giúp AI tự ghi nhãn và ngày càng thông minh hơn.”

Tuy nhiên, ông cảnh báo học tăng cường đôi khi khó kiểm soát, cần thử nghiệm cẩn thận.

Ứng Dụng Thực Tế

  • Y tế: Một ứng dụng theo dõi sức khỏe nhờ TAO đã triển khai được AI vốn trước đó cho kết quả thiếu chính xác.
  • Tài chính: AI có thể tự động phân tích báo cáo, gửi kết quả cho nhà đầu tư.

Nếu thành công, TAO có thể mở ra kỷ nguyên AI “tự lớn” mà không cần quá nhiều dữ liệu “sạch” – bước tiến quan trọng để AI thực sự phổ biến trong doanh nghiệp.

Zalo