Báo cáo hé lộ hậu trường hỗn loạn khiến Siri tụt lại trong cuộc đua AI

Báo cáo từ The Information tiết lộ những thất bại trong cải tiến Siri của Apple, với nhiều luồng thông tin và văn hóa nội bộ cản trở tiến trình phát triển.

Một báo cáo mới từ The Information vừa tiết lộ nhiều thông tin hậu trường đằng sau quá trình tái cấu trúc Siri trong thời đại Apple Intelligence. Theo đó, sự trì trệ và thiếu nhất quán trong định hướng kỹ thuật là nguyên nhân khiến trợ lý ảo của Apple không bắt kịp các đối thủ AI thế hệ mới.

Ban đầu, Apple từng xem xét xây dựng hai mô hình ngôn ngữ: một nhỏ chạy trên thiết bị có tên “Mini Mouse”, một lớn chạy trên nền tảng đám mây là “Mighty Mouse”. Tuy nhiên sau đó nhóm lãnh đạo quyết định hợp nhất thành một mô hình lớn duy nhất – rồi lại tiếp tục thay đổi hướng tiếp cận nhiều lần, khiến kỹ sư bất mãn và một số đã rời khỏi công ty.

Ngoài vấn đề kỹ thuật, văn hóa nội bộ cũng góp phần cản trở tiến trình. Nhiều cựu nhân viên của nhóm AI/ML nói rằng môi trường thiếu quyết đoán, ít tham vọng và không dám chấp nhận rủi ro khiến Siri mãi giậm chân tại chỗ. Nhóm này còn bị gọi đùa là “AIMLess” và Siri bị ví như “gánh nặng” – liên tục được chuyển giao giữa các nhóm mà không có bước tiến thực sự.

Người đứng đầu mảng AI, ông John Giannandrea, được cho là khá tự tin có thể cải thiện Siri nếu có đủ dữ liệu và hệ thống thu thập thông tin tốt hơn. Tuy vậy, phản ứng của đội ngũ cấp cao trước làn sóng ChatGPT năm 2022 lại rất chậm. Chính Giannandrea còn từng nhận định các chatbot như ChatGPT không mang lại giá trị thực sự cho người dùng.

Báo cáo hé lộ hậu trường hỗn loạn khiến Siri tụt lại trong cuộc đua AI

Năm 2023, Apple ra chỉ thị không tích hợp bất kỳ mô hình AI từ bên thứ ba nào vào sản phẩm chính thức, chỉ dùng để đối chiếu. Thế nhưng, chính những mô hình nội bộ lại không thể sánh với OpenAI về chất lượng, khiến hiệu quả ứng dụng thực tế của Siri bị đặt dấu hỏi.

Trong khi đó, Robby Walker – lãnh đạo của Siri – lại dành nhiều thời gian cho các “chiến thắng nhỏ” như bỏ chữ “Hey” khỏi khẩu lệnh “Hey Siri” (mất tới 2 năm để hoàn tất). Ông cũng từng bác bỏ đề xuất ứng dụng LLM để giúp Siri nhận diện cảm xúc người dùng – một bước quan trọng cho trải nghiệm tự nhiên hơn.

Apple cũng từng phát triển dự án “Link” cho Vision Pro – cho phép điều khiển giao diện bằng giọng nói và hỗ trợ nhiều người cùng tương tác trong không gian ảo. Tuy nhiên, phần lớn tính năng đã bị hủy bỏ do nhóm Siri không thể hiện thực hóa ý tưởng.

Đáng chú ý, nhiều tính năng Siri được Apple trình diễn tại WWDC 2024 – như tìm thông tin chuyến bay từ email, nhắc lịch từ tin nhắn, định vị bản đồ – thực tế là… dựng lên. Thành viên trong đội ngũ Siri cho biết họ chưa từng thấy các tính năng đó hoạt động thực sự trên thiết bị thử nghiệm. Trong số các demo tại WWDC, chỉ có hiệu ứng vòng sáng Siri động trên mép màn hình là tồn tại trên bản thử nghiệm.

Dù vậy, vẫn còn hy vọng khi Craig Federighi và Mike Rockwell được cho là đang tiếp quản lại phần Siri. Federighi thậm chí đã bật đèn xanh cho kỹ sư Siri làm “mọi thứ cần thiết” để đưa AI vào sản phẩm, kể cả việc sử dụng mô hình mã nguồn mở từ bên ngoài nếu cần thiết.

Toàn văn báo cáo có thể đọc tại The Information.

NguồnMacrumors
Quảng cáospot_img

Tin liên quan