Trang MacRumors đưa tin kỹ sư phần mềm Andrew Rossignol đã làm điều khó tin: chạy Generative AI (AI tạo sinh) trên chiếc laptop PowerBook G4 từ 2005. Với chip PowerPC G4 1.5GHz và RAM 1GB – phần cứng yếu hơn cả điện thoại rẻ tiền ngày nay – máy vẫn trả lời được câu hỏi nhờ mã nguồn mở và tối ưu thông minh.
PowerBook G4 và Generative AI: Làm sao được?
Andrew kể trong blog cá nhân rằng anh muốn thử xem Generative AI có chạy nổi trên phần cứng cổ không. Anh chọn Llama 2 – một mô hình ngôn ngữ lớn (LLM) của Meta, dung lượng nén chỉ ~500MB – để thử trên PowerBook G4. Máy này dùng hệ điều hành Mac OS X Tiger, kiến trúc 32-bit, RAM ít ỏi, tưởng chừng không thể “gánh” nổi AI.
Anh dùng llama2.c – phiên bản C siêu nhẹ của Llama 2, do Georgi Gerganov phát triển. Sau khi dịch mã sang PowerPC bằng công cụ gcc-4.0 (phiên bản cũ tương thích Tiger), anh chạy thử. Ban đầu, tốc độ xử lý siêu chậm: 0.1 token/giây (token là đơn vị từ nhỏ trong AI). Hỏi “1+1=?” mà máy mất cả phút mới trả lời.
Không bỏ cuộc, Andrew tận dụng AltiVec – công nghệ vector của PowerPC, giống SIMD trên chip hiện đại. Anh tối ưu tính toán ma trận – “trái tim” của Generative AI – đẩy tốc độ lên 0.5-0.8 token/giây với mô hình Llama 2-7B nhỏ nhất. Dù vẫn chậm so với PC mới (hàng trăm token/giây), đây là kỳ tích cho phần cứng 20 năm tuổi. Anh còn thử trên Power Mac G5 (2GHz, RAM 2.5GB), đạt gần 2 token/giây – nhanh hơn nhưng vẫn thua xa chuẩn hiện nay.
Hành trình tối ưu và kết quả
Blog của Andrew kể chi tiết: anh phải biên dịch từng dòng mã, kiểm tra lỗi trên hệ thống cũ và liên tục cải thiện hiệu suất. Anh thử hỏi: “Tổng thống Mỹ năm 2025 là ai?” PowerBook G4 trả lời (dù chậm): “Tôi không có dữ liệu sau 2023, nhưng hiện tại là Joe Biden.” Với anh, tốc độ không quan trọng bằng việc máy chạy được – một chiến thắng của sự kiên trì.
Anh còn so sánh: trên MacBook Pro M2 Max, cùng mã llama2.c đạt 50 token/giây – gấp 60 lần PowerBook G4. Nhưng điều anh tự hào là sự đơn giản của llama2.c: chỉ vài trăm KB mã nguồn, không cần thư viện phức tạp, chứng minh Generative AI không phải lúc nào cũng đòi hỏi siêu máy tính.
Thí nghiệm này không chỉ để khoe tài. Andrew muốn nhấn mạnh: với phần mềm tối ưu, phần cứng cũ vẫn có giá trị. Anh viết: “Tôi thích sự đơn giản – nó làm tôi nhớ đến thời máy tính chưa quá phức tạp.” Dự án gợi nhớ các thử nghiệm tương tự: chạy AI trên PlayStation 3, Xbox 360, hay Raspberry Pi – đều cho thấy mã nguồn nhẹ có thể “hồi sinh” thiết bị xưa.
Với anh, đây còn là câu chuyện về “nghĩ khác đi” (Think Different) – triết lý cũ của Apple – và “nghĩ chậm lại” (Think Slowly) trong thời đại công nghệ đua tốc độ. PowerBook G4 không nhanh, nhưng nó vẫn hiểu và trả lời, như minh chứng rằng không phải cứ mới là tốt nhất.