为了使开发人员利用硬件的先进功能,最近,英特尔发表英特尔reg。oneAPI工具包2023年版本已在[英特尔]reg中;正在滚动开发人员云平台并通过现有渠道交付。

新的oneAPI2023工具包支持即将发布的第四代英特尔reg。到(到)强reg;扩展处理器英特尔reg。到(到)强reg;CPU Max系列和英特尔reg;Flex系列和Max系列的数据中心GPU。这些工具提高了性能和工作效率,并添加了对新Codeplay1插件的支持,使开发人员可以轻松编写面向非英特尔 GPU架构的SYCL代码。这些基于标准的工具提供了硬件选择,便于开发在交叉体系结构上运行的高性能应用程序

英特尔oneAPI2023工具包包含完整的最新编译器、库、解析、移植工具、优化AI和机器学习框架,使开发人员能够为oneAPI支持的CPU、GPU和FPGA构建高性能、交叉架构的应用程序。开发人员可以使用这些工具快速实现性能目标,并在单一代码基础上节省时间,因此他们可以将更多的时间花在创新上。

新版本的oneAPI工具包可以帮助开发人员利用硬件的高级功能。

middot;内置第4代“英特尔”扩展处理器和CPU Max系列以及“英特尔”版本。高级矩阵扩展([英特尔]reg;AMX),Quick Assist技术(QAT),英特尔reg;avx-512,bfloat16,更多。

middot;英特尔reg;数据中心GPU包括内置基于硬件的AV1编码器的Flex系列和Max系列。Max系列提供灵活的数据类型支持,并内置“英特尔”reg。Xe矩阵扩展([英特尔]reg;XMX)、矢量化引擎(vector engine)、英特尔reg;xe-link连接扩展和其他功能。

oneAPI2023工具包具有先进的软件性能:

middot;英特尔reg;Fortran编译器(Intelreg;Fortran Compiler)支持完整的Fortran语言,直到Fortran2018标准,扩展了OpenMPGPU的关闭支持,加快了符合标准的应用程序开发。

middot;英特尔reg;oneAPI数学内核库(oneMKL)扩展了OpenMP的流功能,提高了可移植性。

middot;英特尔reg;oneAPI深度神经网络库(oneDNN)从第四代[英特尔]开始支持强大的处理器和Max系列处理器的高级深度学习功能。[英特尔]reg;AMX,英特尔reg;avx-512、VNNI和bfloat16

通过对SYCL的广泛支持和代码迁移和分析工具的增强,可以简化多架构代码开发,提高开发人员的工作效率。

middot;英特尔reg;oneAPI dps++/C++编译器为nvidia和AMD的GPU添加了Codeplay开发的新插件支持,简化了SYCL代码的描述,提高了面向这些处理器架构的代码可移植性。它提供了集成的构建环境,并集成了用于提高跨平台工作效率的工具。作为此解决方案的一部分,英特尔和代码播放将开始为nvidia GPU的oneAPI插件的商用化提供优先支持。

middot;基于开源SYCLomatic的[英特尔]reg;dps++兼容性工具添加了100多个新的CUDA APIs支持,使从CUDA到SYCL的代码迁移变得容易。

middot;用户可以使用英特尔reg。vtunetrade;Profiler识别大型MPI应用程序中的不平衡问题。

middot;英特尔reg;Advisor在英特尔数据中心GPU Max系列中确定存储器、高速缓存或瓶颈,确认其原因并进行优先处理我们添加了一个自动屋顶线分析,为优化从CPU到GPU的工作负载分流中的重复数据传输成本提供了工作建议。

48%4的开发人员面向使用多个处理器的异构系统进行开发,因此需要更高效的交叉体系结构编程,以适应实际工作量的扩大范围和规模。通过结合使用oneAPI的开放编程模型和基于标准的多架构工具,开发人员可以自由选择CPU和加速器的硬件、性能、工作效率和代码可移植性。另一方面,为CUDA这样的专业化编程模式编写的代码缺乏面向其他硬件的可移植性,会孤立开发实践,将企业困在封闭的生态系统中。

同时,开放生态系统oneAPI的利用也扩大着,新oneAPI excellence center陆续被设立。剑桥大学Open Zettascale研究所正在将CASTEP、FEnics和AREPO等重要的兆位候选代码移植到oneAPI中。该中心还提供专家指导的课程和研讨会,帮助您编译和移植代码,以及优化性能的oneAPI使用方法和工具。目前,全球已建立30个oneAPI授权中心。

*产品性能详情可在英特尔的新闻室详细了解。