Google ra mắt Gemma 3: Mô hình AI mã nguồn mở mạnh nhất cho một GPU

Google vừa công bố Gemma 3, thế hệ mới nhất trong dòng mô hình AI mã nguồn mở Gemma, được đánh giá là mô hình AI mạnh nhất có thể chạy trên một GPU duy nhất.

Gemma 3: Hiệu năng vượt trội trên một GPU

Google gọi Gemma 3 là “mô hình AI mạnh nhất cho một bộ tăng tốc đơn” (single-accelerator model), với khả năng vượt qua các đối thủ như Llama của Meta, DeepSeek, và cả mô hình của OpenAI khi chạy trên một GPU duy nhất, chẳng hạn NVIDIA H100. Theo Google, Gemma 3 được xây dựng dựa trên công nghệ của Gemini 2.0, nhưng được thiết kế nhẹ hơn, phù hợp để triển khai trên nhiều thiết bị từ điện thoại, laptop đến máy trạm (workstation).

Google ra mắt Gemma 3: Mô hình AI mã nguồn mở mạnh nhất cho một GPU

Gemma 3 có các phiên bản 1B, 4B, 12B và 27B (số lượng tham số), đáp ứng nhu cầu đa dạng của nhà phát triển. Mô hình này hỗ trợ hơn 35 ngôn ngữ chính thức và có thể mở rộng đến 140 ngôn ngữ, đồng thời tích hợp khả năng xử lý văn bản, hình ảnh và video ngắn. Theo bài viết trên blog của Google, Gemma 3 đạt hiệu năng ấn tượng trên các bài kiểm tra như Chatbot Arena Elo Score, với phiên bản 27B đạt điểm 1338, ngang ngửa các mô hình lớn hơn cần đến 32 GPU.

Những tính năng nổi bật của Gemma 3

Gemma 3 mang đến nhiều cải tiến đáng chú ý:

Khả năng xử lý dữ liệu lớn: Với context window 128k token, Gemma 3 có thể phân tích và xử lý khối lượng dữ liệu lớn, phù hợp cho các ứng dụng cần hiểu nội dung sâu như phân tích tài liệu hoặc sáng tạo nội dung.
Hỗ trợ hình ảnh và video: Bộ mã hóa hình ảnh (vision encoder) được nâng cấp, hỗ trợ hình ảnh độ phân giải cao và không vuông, cùng với khả năng xử lý video ngắn, mở ra tiềm năng cho các ứng dụng AI đa phương thức.
Tối ưu hiệu năng: Mô hình được cung cấp dưới dạng quantized (tối ưu để nhẹ hơn), giúp giảm kích thước và yêu cầu tính toán mà vẫn giữ độ chính xác, lý tưởng cho thiết bị di động hoặc phần cứng hạn chế.
An toàn nội dung: Google tích hợp ShieldGemma 2, một bộ lọc hình ảnh để kiểm soát nội dung đầu vào và đầu ra, loại bỏ các hình ảnh được phân loại là nhạy cảm, nguy hiểm hoặc bạo lực.

Đọc thêm: AI nhìn thấy chúng ta thế nào? Dự án Analytic Portrait kết hợp công nghệ thị giác AI với chân dung thực

Hỗ trợ nhà phát triển và nghiên cứu

Google tiếp tục khuyến khích cộng đồng phát triển AI với Gemma 3 thông qua các hỗ trợ như:

Cung cấp tín dụng Google Cloud cho nhà phát triển.
Chương trình Gemma 3 Academic, cho phép các nhà nghiên cứu học thuật nhận 10,000 USD tín dụng để đẩy nhanh quá trình nghiên cứu.
Hỗ trợ triển khai trên nhiều nền tảng như Hugging Face, Vertex AI, và NVIDIA API Catalog, với tối ưu hóa cho các GPU từ Jetson Nano đến Blackwell.

Gemma 3 cũng đã tạo được dấu ấn trong cộng đồng, với hơn 100 triệu lượt tải và 60,000 biến thể do cộng đồng phát triển (Gemmaverse), kể từ khi dòng Gemma ra mắt cách đây một năm.

Trách nhiệm và hạn chế

Google cho biết Gemma 3 đã được kiểm tra kỹ lưỡng để giảm nguy cơ lạm dụng, đặc biệt trong việc tạo ra chất gây hại, và kết quả cho thấy mức rủi ro thấp. Tuy nhiên, công ty cũng thừa nhận rằng khái niệm “mô hình mã nguồn mở” của Gemma 3 vẫn gây tranh cãi, do giấy phép sử dụng của Google có một số hạn chế, không cho phép sử dụng mô hình trong các mục đích bị cấm như phát triển vũ khí.

Đánh giá Galaxy A56 5G: Hiệu năng vượt tầm giá, trợ thủ AI mạnh mẽ cho Gen Z

Google mở rộng Gemini Deep Research cho mọi người

Apple thừa nhận Apple Intelligence ‘chưa ấn tượng’ và không thúc đẩy nâng cấp iPhone

Visa triển khai thanh toán “chạm để đi” trên tuyến Metro Số 1 TP. Hồ Chí Minh

Google DeepMind ra mắt Gemini Robotics: Mô hình AI mới cho robot thông minh hơn