OpenAI vừa công bố một tính năng mới mang tên deep research, cho phép ChatGPT tự động lên kế hoạch và thực hiện nhiều bước để tìm kiếm dữ liệu cần thiết, đồng thời có thể quay lại và điều chỉnh kết quả dựa trên thông tin thời gian thực. Đây là bước tiến quan trọng nhằm nâng cao khả năng của AI tác vụ (agentic AI), giúp nó hoạt động như một nhà phân tích nghiên cứu chuyên nghiệp.
Deep research: AI không chỉ tạo nội dung, mà còn phân tích và trích dẫn nguồn
Khác với các tính năng trước đây của ChatGPT, deep research không chỉ tạo văn bản mà còn hiển thị quá trình tìm kiếm thông tin trong một bảng bên cạnh, bao gồm trích dẫn nguồn và tóm tắt các bước nghiên cứu.
Người dùng có thể cung cấp câu hỏi dưới dạng văn bản, hình ảnh hoặc tài liệu như PDF, bảng tính để thêm bối cảnh. Sau đó, ChatGPT sẽ mất từ 5 đến 30 phút để đưa ra phản hồi. Trong tương lai, OpenAI cho biết deep research sẽ có thể hiển thị hình ảnh và biểu đồ nhúng trực tiếp trong kết quả.
Tuy nhiên, OpenAI cũng cảnh báo rằng deep research có thể gặp lỗi “ảo giác AI” (hallucination), khó phân biệt giữa thông tin có thẩm quyền và tin đồn, cũng như đánh giá mức độ chắc chắn của câu trả lời.
Cạnh tranh với Google và nâng cấp mô hình AI
Tính năng deep research được công bố ngay sau khi OpenAI ra mắt Operator, một công cụ có thể sử dụng trình duyệt web để hoàn thành tác vụ thay cho người dùng. Công nghệ này cũng tương tự Project Mariner của Google – một nguyên mẫu AI nghiên cứu mà Google từng giới thiệu vào tháng 12, nhưng chưa có sẵn cho công chúng. Trong khi đó, OpenAI đã triển khai deep research trước tiên cho người dùng gói Pro, sau đó mở rộng cho các gói Plus, Team và Enterprise.
Mức độ truy cập hiện nay như sau:
- Gói Pro (200 USD/tháng): 100 lượt truy vấn deep research mỗi tháng.
- Gói Plus, Team, Enterprise: Quyền truy cập hạn chế, với giới hạn mở rộng trong tương lai.
- Deep research sử dụng nhiều tài nguyên tính toán hơn, nên OpenAI sẽ tối ưu hóa tốc độ và chi phí để nâng cao trải nghiệm người dùng trong các phiên bản sau.
Một thông tin đáng chú ý là mô hình AI đứng sau deep research đã đạt điểm số cao nhất trên bài kiểm tra AI “Humanity’s Last Exam”, một bài đánh giá yêu cầu trả lời các câu hỏi ở cấp độ chuyên gia. Kết quả cho thấy:
- Deep research đạt độ chính xác 26.6% khi có quyền truy cập trình duyệt và công cụ Python, cao hơn nhiều so với GPT-4o chỉ đạt 3.3%.
- Mô hình xếp thứ hai là o3-mini (high) chỉ đạt 13%, khi được đánh giá bằng văn bản mà không có quyền duyệt web.
Với những cải tiến này, OpenAI đang từng bước biến ChatGPT thành một trợ lý nghiên cứu AI thực thụ, giúp phân tích tổng hợp dữ liệu từ nhiều nguồn. Deep research có thể sẽ là tính năng hấp dẫn đối với người dùng chuyên nghiệp, từ các nhà nghiên cứu, nhà báo, đến doanh nghiệp đang cần công cụ phân tích mạnh mẽ hơn, hiệu quả hơn và tiết kiệm thời gian hơn.