Tại Hội nghị Siêu máy tính Quốc tế (ISC) năm 2021, Intel tiếp tục thể hiện vị thế dẫn đầu trong lĩnh vực điện toán hiệu năng cao (HPC) khi công bố một loạt các phát kiến công nghệ, quan hệ đối tác và ứng dụng của khách hàng. Bộ xử lý Intel là kiến trúc điện tóan được triển khai rộng rãi nhất trong các siêu máy tính trên thế giới, tạo tiền đề cho nhiều khám phá y học toàn cầu và những đột phá khoa học khác. Đồng thời, Intel đã trình bày những tiến bộ trong bộ xử lý Xeon cho điện toán hiệu năng cao và trí tuệ nhân tạo, cũng như những đổi mới về bộ nhớ, phần mềm, lưu trữ siêu máy tính exascale và công nghệ mạng cho một loạt các ứng dụng HPC.
Bà Trish Damkroger, Phó chủ tịch kiêm Tổng giám đốc Điện toán Hiệu suất cao của Intel cho biết: “Để tối đa hóa hiệu suất HPC, chúng tôi phải tận dụng tất cả các nguồn tài nguyên máy tính và tiến bộ công nghệ có sẵn.” Bà Damkroger bổ sung: “Intel là động lực thúc đẩy ngành công nghiệp hướng tới điện toán exascale và những tiến bộ tuyệt vời mà chúng tôi đạt được với CPU, XPU, bộ công cụ oneAPI, bộ nhớ DAOS loại exascale và mạng tốc độ cao đang dần hiện thực hóa mục tiêu đó”.
Dẫn đầu trong cuộc đua Điện toán hiệu năng cao (HPC)
Đầu năm nay, Intel đã khẳng định vị trí dẫn đầu của mình trong lĩnh vực Điện toán hiệu năng cao với việc ra mắt bộ vi xử lý Intel Xeon Scalable thế hệ thứ 3. So với thế hệ trước, bộ xử lý mới nhất mang lại hiệu suất cao hơn tới 53% trên nhiều đầu việc của HPC, bao gồm các lĩnh vực như khoa học sự sống, dịch vụ tài chính và sản xuất.
So với đối thủ cạnh tranh gần nhất là bộ vi xử lý x86, bộ xử lý Intel Xeon Scalable thế hệ thứ 3 mang lại hiệu suất cao hơn trên rất nhiều khối lượng công việc phổ biến nhất của lĩnh vực HPC. Cụ thể, khi so sánh bộ xử lý Xeon Scalable 8358 với bộ xử lý AMD EPYC 7543, các tác vụ như NAMD, LAMMP, RELION và mô hình định giá tùy chọn nhị thức đều đưa ra kết quả tốt hơn, với hiệu suất cao hơn lần lượt là 62%, 57%, 68% và 37%. Ngoài ra, thuật toán Monte Carlo có tốc độ nhanh gấp đôi, cho phép các công ty tài chính đạt được kết quả định giá chỉ với một nửa thời gian bỏ ra. Bộ xử lý Xeon Scalable 8380 cũng vượt trội hơn bộ xử lý AMD EPYC 7763 đối với những tác vụ quan trọng liên quan đến Trí tuệ nhân tạo (AI), với hiệu suất tốt hơn 50% trên 20 điểm chuẩn chung. Nhiều phòng thí nghiệm HPC, trung tâm siêu máy tính, trường đại học và các nhà sản xuất thiết bị gốc đã đưa nền tảng máy tính mới nhất của Intel vào sử dụng, bao gồm Dell Technologies, HPE, Cục quản lý khí tượng Hàn Quốc, Lenovo, Cơ sở dữ liệu và máy tính Max Planck, Tập đoàn Oracle, Đại học Osaka và Đại học Tokyo.
Tích hợp Bộ nhớ băng thông cao trong Bộ vi xử lý Intel Xeon Scalable Thế hệ mới
Những đầu việc cần mô hình hóa và mô phỏng (ví dụ: tính toán động lực học chất lưu , dự báo thời tiết và báo hiệu biến đổi khí hậu, thuyết động lực học lượng tử, trí tuệ nhân tạo (ví dụ: đào tạo và suy luận nhờ deep learning, phân tích dữ liệu lớn), cơ sở dữ liệu trong bộ nhớ, lưu trữ, v..v. đều góp phần tạo nên tính đột phá trong những phát minh khoa học. Bộ vi xử lý Intel Xeon Scalable thế hệ mới (tên mã “Sapphire Rapids) tích hợp bộ nhớ băng thông cao (HBM) sẽ nâng cấp đáng kể băng thông bộ nhớ và cải thiện hiệu suất cho các ứng dụng Điện toán hiệu năng cao, đặc biệt là với các tác vụ cần sử dụng băng thông bộ nhớ lớn. Người dùng có thể xử lý công việc một cách hiệu quả chỉ bằng Bộ nhớ băng thông cao hoặc kết hợp với DDR5.
Khách hàng cũng đang phản ứng rất tốt đối với bộ xử lý Sapphire Rapids tích hợp HBM, sau khi chứng kiến những thành tựu đầu tiên như sự ra mắt siêu máy tính Aurora của Bộ Năng lượng Hoa Kỳ tại Phòng thí nghiệm Quốc gia Argonne và siêu máy tính Crossroad tại Phòng thí nghiệm Quốc gia Los Alamos.
Ông Rick Stevens, Phó giám đốc phòng thí nghiệm về Máy tính, Môi trường và Khoa học Sự sống tại Phòng thí nghiệm Quốc gia Argonne cho biết: “Để đạt được kết quả ở phạm vi siêu máy tính exascale đòi hỏi khả năng truy cập và xử lý nhanh chóng một lượng dữ liệu lớn. Tích hợp bộ nhớ băng thông cao vào bộ xử lý Intel Xeon Scalable sẽ tăng đáng kể băng thông bộ nhớ của Aurora và cho phép chúng tôi tận dụng sức mạnh của trí tuệ nhân tạo và phân tích dữ liệu để thực hiện mô phỏng nâng cao và mô hình hóa 3D.”
Ông Charlie Nakhleh, Phó giám đốc phòng thí nghiệm Vật lý Vũ khí tại Phòng thí nghiệm Quốc gia Los Alamos, cho biết: “Siêu máy tính Crossroad tại Phòng thí nghiệm Quốc gia Los Alamos được thiết kế để thúc đẩy việc nghiên cứu các hệ thống vật lý phức tạp cho khoa học và an ninh quốc gia. Bộ xử lý Xeon thế hệ mới của Intel, Sapphire Rapids, kết hợp Bộ nhớ băng thông cao, sẽ cải thiện đáng kể hiệu suất của khối lượng công việc sử dụng nhiều bộ nhớ trong hệ thống Crossroad. Sản phẩm [Sapphire Rapids với HBM] đẩy nhanh tốc độ xử lý các phép tính toán vật lý và kỹ thuật phức tạp nhất, giúp chúng tôi hoàn thành các phạm trù nghiên cứu và phát triển vượt bậc về an ninh toàn cầu, công nghệ năng lượng và khả năng cạnh tranh kinh tế.”
Nền tảng sử dụng bộ xử lý Sapphire Rapids sẽ mang đến những khả năng độc đáo để tăng tốc HPC, bao gồm tăng gấp đôi băng thông I/O với PCI express 5.0 (so với PCI express 4.0) và hỗ trợ Compute Express Link (CXL) 1.1, hỗ trợ các ứng dụng nâng cao xung quanh sử dụng điện toán, mạng và lưu trữ. Ngoài những tiến bộ về bộ nhớ và I/O, Sapphire Rapids được tối ưu hóa cho khối lượng công việc điện toán hiệu suất cao và trí tuệ nhân tạo (AI), với một công cụ tăng tốc AI tích hợp mới có tên là Intel AMX (Advanced Matrix Extensions). Intel AMX được thiết kế để tăng hiệu suất đáng kể cho suy luận và đào tạo deep learning. Một số khách hàng đã bắt đầu thử nghiệm HPC với Sapphire Rapids, bao gồm CINECA, Trung tâm Siêu máy tính Leibniz (LRZ) và Phòng thí nghiệm quốc gia Argonne, cũng như là Hệ thống Crossroads tại phòng thí nghiệm quốc gia Los Alamos và phòng thí nghiệm quốc gia Sandia.
Khởi động Bộ xử lý đồ họa Intel Xe-HPC GPU (mã hiệu Ponte Vecchio)
Đầu năm nay, Intel đã “khởi động” bộ xử lý đồ họa (GPU) dựa trên bộ xử lý Xe-HPC (mã hiệu “Ponte Vecchio”) và đang trong quá trình xác thực hệ thống. Ponte Vecchio là bộ xử lý đồ họa dựa trên kiến trúc Xe được tối ưu hóa cho khối lượng công việc HPC và AI. Sản phẩm này sẽ tận dụng công nghệ đóng gói 3D Foveros của Intel để tích hợp nhiều IP trong gói, bao gồm bộ nhớ HBM và các sản phẩm trí tuệ khác. GPU được cấu thành bởi điện toán, bộ nhớ và kết cấu để đáp ứng nhu cầu ngày càng tăng của các siêu máy tính tiên tiến nhất thế giới, điển hình là Aurora.
Ponte Vecchio sử dụng chuẩn giao tiếp OAM (OCP Accelerator Module) và hệ thống con, với mục đích mở rộng quy mô cần thiết cho các ứng dụng HPC.
Mở rộng khả năng kết nối Ethernet của Intel vào Điện toán hiệu suất cao
Tại ISC 2021, Intel cũng công bố giải pháp Kết nối mạng hiệu suất cao với Ethernet (HPN) mới, giúp mở rộng tiềm năng công nghệ Ethernet cho phân khúc HPC bằng cách sử dụng bộ chuyển đổi mạng và bộ điều khiển tiêu chuẩn Intel Ethernet 800 Series, các thiết bị chuyển mạch dựa trên Intel Tofino với bộ điều khiển Ethernet ASIC có thể lập trình P4 và Phần mềm Intel Ethernet Fabric Suite. So với InfiniBand, Giải pháp kết nối mạng hiệu suất cao với Ethernet (HPN) mang lại hiệu quả ứng dụng tương đương với chi phí thấp hơn và dễ sử dụng hơn nhờ có Ethernet.
Cách mạng hóa DAOS
Intel đang giới thiệu các hoạt động hỗ trợ thương mại cho DAOS (hệ thống lưu trữ phân tán không đồng bộ). DAOS là một kho lưu trữ đối tượng mã nguồn mở do phần mềm xác định được xây dựng để tối ưu hóa việc trao đổi dữ liệu xuyên suốt các kiến trúc Intel HPC. Đây cũng là nền tảng của ngăn xếp lưu trữ Intel Exascale, đã được Phòng thí nghiệm quốc gia Argonne công bố trước đây và đang được sử dụng bởi các khách hàng của Intel như LRZ và JINR (Viện liên hiệp nghiên cứu hạt nhân).
DAOS hiện đã có sẵn dưới dạng cung cấp hỗ trợ L3, giúp các đối tác cung cấp giải pháp lưu trữ hoàn chỉnh bằng cách kết hợp với các dịch vụ của họ. Ngoài các khối xây dựng trung tâm dữ liệu của riêng Intel, các đối tác ban đầu cho hỗ trợ thương mại mới này bao gồm HPR, Lenovo, Supermicro, Brightskyies, Croit, Nettrix, Quanta và RSC Group.