Trang chủTin tứcAppleHệ thống AI mới của Apple có thể vượt qua cả GPT-4

Hệ thống AI mới của Apple có thể vượt qua cả GPT-4

Các nhà nghiên cứu của Apple đã phát triển một hệ thống trí tuệ nhân tạo (AI) có tên ReALM (Mô hình Ngôn ngữ Giải Quyết Tham Chiếu) với mục tiêu cải thiện đáng kể khả năng hiểu và phản hồi lệnh của trợ lý ảo, dự đoán có thể vượt qua cả GPT-4.

Trong một bài báo nghiên cứu, Apple phác thảo một hệ thống AI mới về cách các mô hình ngôn ngữ lớn xử lý tiến trình “giải quyết tham chiếu”, đây là tiến trình hiểu các tham chiếu trên màn hình, cũng như hiểu bối cảnh hội thoại và bối cảnh tổng thể để đem đến kết quả mong muốn cho người dùng. Kết quả là, ReALM có thể mang đến tương tác trực quan và tự nhiên hơn với các thiết bị.

Giải quyết tham chiếu là một phần quan trọng của việc hiểu ngôn ngữ tự nhiên, cho phép người dùng sử dụng đại từ và các tham chiếu gián tiếp khác trong cuộc trò chuyện mà không bị nhầm lẫn. Đối với các trợ lý kỹ thuật số, khả năng này từ lâu đã là một thách thức đáng kể do bị giới hạn phải giải thích nhiều tín hiệu bằng lời và thông tin trực quan. Hệ thống ReALM của Apple tìm cách giải quyết vấn đề này bằng cách chuyển đổi quá trình phức tạp của việc giải quyết tham chiếu thành vấn đề mô hình ngôn ngữ thuần túy. Bằng cách đó, hệ thống có thể hiểu các tham chiếu đến các yếu tố hình ảnh hiển thị trên màn hình và tích hợp sự hiểu biết này vào luồng hội thoại.

Hệ thống AI mới của Apple có thể vượt qua cả GPT-4

ReALM sẽ tái tạo bố cục trực quan của màn hình bằng cách sử dụng các biểu diễn của văn bản. Điều này liên quan đến việc phân tích các thực thể trên màn hình và vị trí của chúng để tạo ra một định dạng văn bản ghi lại nội dung và cấu trúc trên màn hình. Các nhà nghiên cứu của Apple nhận thấy rằng chiến lược này, kết hợp với việc tinh chỉnh các mô hình ngôn ngữ cụ thể cho các nhiệm vụ giải quyết tham chiếu, sẽ mang đến kết quả vượt trội đáng kể so với các phương pháp truyền thống.

ReALM có thể cho phép người dùng tương tác với trợ lý kỹ thuật số hiệu quả hơn nhiều khi tham chiếu đến những gì đang được hiển thị trên màn hình của họ mà không cần người dùng phải nêu các yêu cầu chi tiết. Điều này có khả năng giúp việc tương tác với trợ lý ảo qua giọng nói hữu ích hơn trong nhiều trường hợp khác nhau, chẳng hạn như giúp tài xế điều hướng hệ thống thông tin giải trí trong khi đang lái xe hoặc hỗ trợ người dùng khuyết tật bằng cách cung cấp phương thức tương tác gián tiếp dễ dàng và chính xác hơn.

Theo dự đoán thì Apple sẽ tiết lộ thêm nhiều thông tin tại sự kiện WWDC 2024 sắp diễn ra vào tháng 6 này.

NguồnMacrumors
Quảng cáospot_img
Quảng cáospot_img

Tin liên quan