黄文欢介绍了基于英特尔?深度学习加速(Intel?DL Boost)技术的 AI 性能优化相关内容。首先介绍了英特尔?AVX-512 及深度学习加速技术在各代英特尔?至强?处理器上的演进,包括第一代深度学习加速技术 VNNI;第二代?深度学习加速技术 BFloat16;及下一代深度学习加速技术 AMX。接下来,和大家一起分享了这些深度学习加速技术在龙蜥社区 AI SIG 中的应用及带来的性能提升,包括对深度学习框架 TensorFlow 和 PyTorch 的优化,及用于模型压缩的优化工具 INC。最后介绍了下一代至强可扩展处理器 Sapphire Rapids 上 AMX 技术,并分享了其理论性能提升及相关应用场景。