Bộ đôi nghệ sĩ người Hàn Quốc Shin Seung Back và Kim Yong Hun, đồng thời cũng là kỹ sư, vừa trở lại với một dự án mới mang tên Analytic Portrait. Dự án này tiếp tục khám phá cách trí tuệ nhân tạo (AI) nhìn nhận thế giới, cụ thể là cách các thuật toán thị giác AI phân tích và tái tạo hình ảnh chân dung con người.
Bộ đôi nghệ sĩ người Hàn Quốc Shin Seung Back và Kim Yong Hun, đồng thời cũng là kỹ sư, vừa trở lại với một dự án mới mang tên Analytic Portrait. Dự án này tiếp tục khám phá cách trí tuệ nhân tạo (AI) nhìn nhận thế giới, cụ thể là cách các thuật toán thị giác AI phân tích và tái tạo hình ảnh chân dung con người.
Tiếp nối những thử nghiệm về AI và nghệ thuật
Shinseungback Kimyonghun, nhóm nghệ thuật từng được biết đến qua các dự án trước như Mou ta n, đã nghiên cứu mức độ chỉnh sửa ảnh mà AI vẫn có thể nhận diện được. Trước đó, vào năm 2012, họ thực hiện Cloud Face, một thí nghiệm trong đó AI cố gắng nhận diện khuôn mặt người từ các đám mây đang di chuyển.
Với Analytic Portrait, nhóm tiếp tục thử nghiệm bằng cách sử dụng 14 thuật toán thị giác AI để phân tích ảnh chân dung thực và tạo ra một phiên bản tái hiện bằng khung dây đa sắc. Một trong những tác phẩm đặc biệt trong bộ sưu tập là phiên bản của bức Mona Lisa nổi tiếng của Leonardo da Vinci, được AI tái hiện theo phương pháp này.
Các thuật toán AI được sử dụng
Nhóm nghệ sĩ đã sử dụng 14 thuật toán thị giác AI để tạo ra mỗi bức chân dung trong bộ sưu tập, mỗi thuật toán đóng một vai trò riêng trong quá trình phân tích và tái tạo. Dưới đây là danh sách các thuật toán cùng với chức năng của chúng:
- OpenCV Face Detection: Xác định vị trí và kích thước khuôn mặt.
- Dlib Face Detection: Xác định vị trí, kích thước khuôn mặt và điểm đặc trưng trên khuôn mặt.
- DSFD: Xác định vị trí, kích thước khuôn mặt và mức độ tin cậy của nhận diện.
- Distinctive Image Features from Scale-Invariant Keypoints: Phát hiện điểm đặc trưng trên hình ảnh.
- Keypoint Communities: Nhận diện khuôn mặt, kích thước khuôn mặt, điểm đặc trưng trên mặt và tư thế cơ thể.
- Distribution-Aware Coordinate Representation for Human Pose Estimation: Nhận diện tư thế cơ thể (các bộ phận cơ thể).
- Densepose: Ước lượng hình dạng cơ thể con người trong điều kiện thực tế.
- Ad-Corre (Adaptive Correlation-Based Loss for Facial Expression Recognition in the Wild): Nhận diện cảm xúc trên khuôn mặt.
- Instances as Queries: Phân đoạn đối tượng, xác định ranh giới giữa các vật thể.
- FairFace: Phân loại đặc điểm nhân khẩu học như chủng tộc, giới tính và độ tuổi.
- L2CS-Net: Ước tính hướng nhìn của mắt trong môi trường không bị giới hạn.
- Real-time Deep Hair Matting: Phân tách tóc theo thời gian thực trên thiết bị di động.
- Multi-ethnic MEBeauty dataset and facial attractiveness: Chấm điểm mức độ hấp dẫn của khuôn mặt.
- Google Cloud Vision API: Xác định màu sắc chủ đạo trong hình ảnh.
Cách AI tạo ra những bức chân dung đa sắc
Quá trình tạo ra Analytic Portrait bao gồm tổng hợp dữ liệu từ 14 thuật toán thị giác AI. Các kết quả từ các thuật toán này được xếp chồng lên nhau để tạo nên hình ảnh cuối cùng.
Mỗi tác phẩm có một bảng màu ở góc trên bên phải, thể hiện các màu sắc chủ đạo của ảnh gốc, được xác định bởi Google Cloud Vision API. Các đầu ra từ 13 thuật toán còn lại được chuyển thành màu sắc khác nhau, giúp tạo thành phiên bản chân dung độc đáo.
Tuy nhiên, nhóm nghệ sĩ cũng lưu ý rằng màu sắc không gắn liền với một thuật toán cố định mà có thể thay đổi giữa các bức ảnh khác nhau. Đồng thời, để tránh dư thừa thông tin, một số dữ liệu trùng lặp từ các thuật toán nhận diện khuôn mặt đã được loại bỏ một cách có chọn lọc.
Bộ sưu tập Analytic Portrait hiện đã được công bố và có thể xem trực tiếp trên trang web chính thức của Shinseungback Kimyonghun.