NVIDIA công bố dịch vụ AI tạo sinh microservice NVIDIA ACE để thúc đẩy làn sóng tiếp theo của Human Digital (con người kỹ thuật số), cùng với những đột phá mới trong AI tạo sinh sắp ra mắt trên nền tảng này.
Các công ty trong lĩnh vực dịch vụ khách hàng, trò chơi và chăm sóc sức khỏe là những đơn vị đầu tiên áp dụng công nghệ ACE để đơn giản hóa việc tạo ra hoạt hình và vận hành các Human Digital sống động trong dịch vụ khách hàng, chăm sóc sức khoẻ, game và giải trí.
Bộ công nghệ AI tạo sinh cho Human Digital NVIDIA ACE hiện có bao gồm:
- NVIDIA Riva ASR, TTS và NMT — nhận diện giọng nói tự động, chuyển đổi văn bản thành giọng nói và dịch thuật
- NVIDIA Nemotron LLM — hiểu ngôn ngữ và tạo phản hồi theo ngữ cảnh
- NVIDIA Audio2Face — hoạt hình khuôn mặt chân thực dựa trên các âm nhạc, âm thanh
- NVIDIA Omniverse RTX — cho làn da và tóc chân thực thời gian thực, được chiếu sáng bằng tính năng dò tia
Các công nghệ mới được công bố bao gồm:
- NVIDIA Audio2Gesture — cho việc tạo các cử chỉ cơ thể dựa trên các bản nhạc âm thanh, sắp có mặt
- NVIDIA Nemotron-3 4.5B — một mô hình ngôn ngữ nhỏ mới (SLM) được thiết kế đặc biệt cho suy luận RTX AI PC với độ trễ thấp
“Human Digital sẽ cách mạng hóa các ngành công nghiệp,” ông Jensen Huang, nhà sáng lập và CEO của NVIDIA, cho biết. “Những đột phá trong các mô hình ngôn ngữ lớn đa phương thức và đồ họa thần kinh — được cung cấp bởi NVIDIA ACE cho hệ sinh thái các nhà phát triển của chúng tôi — đang đưa chúng ta đến gần hơn với tương lai của tính toán theo ý định, nơi việc tương tác với máy tính tự nhiên như tương tác với con người.”
Human Digital đến với 100 triệu RTX AI PC
Tính đến nay, NVIDIA đã cung cấp ACE dưới dạng các vi dịch vụ NVIDIA NIM cho các nhà phát triển vận hành trong các trung tâm dữ liệu. Hiện nay, NVIDIA đang xây dựng các vi dịch vụ ACE PC NIM để triển khai trên cơ sở lắp đặt 100 triệu RTX AI PC và laptop.
Những điều này bao gồm NVIDIA Nemotron-3 4.5B, SLM đầu tiên của công ty, được thiết kế đặc biệt để chạy trên thiết bị với mức độ chính xác và độ chính xác tương tự như các mô hình ngôn ngữ lớn (LLM) chạy trên đám mây. Nemotron-3 4.5B SLM hiện đang trong giai đoạn truy cập sớm. Các mô hình trên thiết bị của NVIDIA Audio2Face và NVIDIA Riva ASR sẽ sớm có trong giai đoạn truy cập sớm sắp tới.
Bộ công cụ phát triển phần mềm NVIDIA AI Inference Manager mới đơn giản hóa việc triển khai ACE lên PC. Nó cấu hình sẵn PC với các mô hình AI, các engine và những phụ thuộc cần thiết trong khi điều phối suy luận AI liền mạch trên PC và đám mây.
Phiên bản cập nhật của bản demo công nghệ Covert Protocol, được phát triển cùng với Inworld AI được trình diễn tại triển lãm COMPUTEX. Sử dụng Audio2Face và Riva ASR chạy cục bộ trên GeForce RTX PC, bản demo cho phép người chơi tương tác và ảnh hưởng đến các nhân vật không thể chơi (NPC) kỹ thuật số với ngôn ngữ hội thoại để hoàn thành nhiệm vụ của họ.
Hệ sinh thái Human Digital mở rộng với công nghệ ACE mới nhất
ACE đang tạo làn sóng với các nhà phát triển xây dựng nhiều ứng dụng khác nhau từ các công ty như Aww Inc., Dell Technologies, Gumption,, Hippocratic AI, Inventec, OurPalm, Perfect World Games, Reallusion, ServiceNow, Soulbotix, SoulShell và UneeQ.
Aww Inc., một công ty tiên phong về con người ảo có trụ sở tại Nhật Bản, đã ra mắt ngôi sao ảo đầu tiên của mình, Imma, vào năm 2018. Imma kể từ đó đã trở thành gương mặt của các thương hiệu toàn cầu lớn tại hơn 50 quốc gia. Hiện tại, Aww Inc. có kế hoạch tận dụng dịch vụ microservice ACE Audio2Face để hoạt hình thời gian thực, cho phép trải nghiệm giao tiếp tương tác cao với người dùng của mình.
Perfect World Games, một nhà phát triển và phát hành trò chơi, đang áp dụng ACE trong bản demo công nghệ thần thoại của mình, Legends. Người chơi có thể tương tác với một nhân vật AI NPC đa ngôn ngữ, sống động, tương tác hoàn toàn bằng tiếng Anh và tiếng Trung. Sử dụng NVIDIA Audio2Face NIM, các phản hồi âm thanh của nhân vật tạo hoạt hình khuôn mặt chân thực trong thời gian thực.
Inventec, một công ty công nghệ lớn đang đầu tư mạnh vào AI, đang sử dụng NVIDIA Audio2Face NIM để nâng cao đại lý AI chăm sóc sức khỏe trong nền tảng VRSTATE của mình. Sự tích hợp này cung cấp trải nghiệm tư vấn ảo hấp dẫn, thoải mái hơn. Tại COMPUTEX, Inventec đang trình diễn một đại lý AI có thể giúp bệnh nhân truy cập thông tin về sức khỏe của họ.
ServiceNow, nền tảng AI cho chuyển đổi doanh nghiệp, gần đây đã trình diễn ACE NIM trong bản demo đại lý dịch vụ AI tạo sinh của mình cho Now Assist Gen AI Experience, làm nổi bật tiềm năng của các avatar kỹ thuật số để nâng cao tương tác khách hàng và nhân viên trong các ngành công nghiệp bao gồm bán lẻ, du lịch và hơn thế nữa.
Dell Technologies đã ra mắt Giải pháp Dell Generative AI cho Trợ Lý Kỹ Thuật Số tiên tiến tại Dell Technologies World tháng trước. Sản phẩm này cho phép các doanh nghiệp tận dụng trợ lý kỹ thuật số thông minh để tương tác với khách hàng thông qua các cuộc trò chuyện tự nhiên trên nhiều ngành công nghiệp như bán lẻ, chăm sóc sức khỏe và dịch vụ khách hàng.
NVIDIA tôn vinh các startup Human Digital tại COMPUTEX 2024
Các đội nghệ thuật của NVIDIA đã sử dụng các công cụ AI tạo sinh dựa trên ACE, bao gồm Synthesia và Hour One, để tạo ra một avatar “Jensen kỹ thuật số” được tạo từ video từ văn bản.
Avatar đa ngôn ngữ này có giọng nói và phong cách độc đáo của Huang, được tạo bởi công nghệ giọng nói AI độc quyền của ElevenLabs bằng tiếng Trung và tiếng Anh. NVIDIA cũng hợp tác với Voicemod, một thành viên của NVIDIA Inception chuyên về công nghệ giọng nói AI, để soạn bài hát kết thúc cho bài phát biểu của Huang.
ACE NIM hiện đã có sẵn
Các dịch vụ microservice ACE NIM của NVIDIA cho triển khai máy chủ bao gồm Riva và Audio2Face hiện đã được sản xuất, thêm phần mềm NVIDIA AI Enterprise để các nhà phát triển nhận hỗ trợ đẳng cấp doanh nghiệp. Bạn có thể đăng ký truy cập sớm các dịch vụ microservice ACE NIM chạy trên RTX AI PC tại đây.