Apple vừa công bố một bước đột phá mới trong lĩnh vực trí tuệ nhân tạo khi hợp tác với NVIDIA để tăng tốc đáng kể hiệu suất của các mô hình ngôn ngữ lớn (LLM). Thành tựu này được đạt được nhờ việc áp dụng một kỹ thuật tạo văn bản mới mang tên Recurrent Drafter (ReDrafter), hứa hẹn sẽ cách mạng hóa cách chúng ta tương tác với các ứng dụng AI trong tương lai.
ReDrafter là một phương pháp thông minh kết hợp hai kỹ thuật tiên tiến: tìm kiếm chùm tia (beam search) và chú ý cây động (dynamic tree attention). Tìm kiếm chùm tia giúp mở rộng nhiều khả năng diễn đạt văn bản một cách đồng thời, từ đó tìm ra những kết quả tốt nhất. Trong khi đó, chú ý cây động có nhiệm vụ sắp xếp và loại bỏ các phần trùng lặp không cần thiết trong quá trình tạo văn bản, giúp tăng cường hiệu quả.
Bằng cách tích hợp ReDrafter vào khung công tác TensorRT-LLM của NVIDIA, một nền tảng tối ưu hóa các LLM chạy trên GPU NVIDIA, Apple đã đạt được hiệu suất vượt trội. Theo kết quả thử nghiệm, kỹ thuật này giúp tăng tốc độ tạo văn bản lên đến 2.7 lần so với các phương pháp truyền thống, khi áp dụng trên một mô hình sản xuất quy mô lớn với hàng chục tỷ tham số.
Những lợi ích vượt trội:
- Tăng tốc đáng kể: Người dùng sẽ nhận được phản hồi nhanh hơn và trải nghiệm mượt mà hơn khi sử dụng các ứng dụng AI.
- Giảm chi phí: Việc giảm thiểu thời gian xử lý giúp tiết kiệm năng lượng và tài nguyên máy tính.
- Mở ra nhiều ứng dụng mới: Với hiệu suất được cải thiện, các LLM có thể được ứng dụng rộng rãi hơn trong nhiều lĩnh vực, từ dịch vụ khách hàng đến sáng tạo nội dung.
Sự hợp tác giữa Apple và NVIDIA đánh dấu một cột mốc quan trọng trong sự phát triển của AI. ReDrafter không chỉ là một công nghệ đột phá mà còn là minh chứng cho sức mạnh của sự hợp tác giữa các công ty hàng đầu trong ngành. Trong tương lai, chúng ta có thể kỳ vọng sẽ thấy nhiều ứng dụng AI thông minh và tiện lợi hơn nữa, nhờ vào những tiến bộ không ngừng trong lĩnh vực này.