Article

最大限度提升 CPU 上的 TensorFlow* 性能:推理工作负载的注意事项和建议

本文将介绍使用面向 TensorFlow 的英特尔® 优化* 进行 CPU 推理的性能注意事项
Authored by Nathan Greeneltch (Intel) Last updated on 08/09/2019 - 02:02
Article

面向英特尔® 至强融核™ 处理器(代号“Knights Landing”)的开发人员访问计划

Intel is bringing to market, in anticipation of general availability of the Intel® Xeon Phi™ Processor (codenamed Knights Landing), the Developer Access Program (DAP). DAP is an early access program for developers worldwide to purchase an Intel Xeon Phi Processor based system.
Authored by Mike P. (Intel) Last updated on 03/21/2019 - 12:00
Article

面向英特尔® 至强融核™ 处理器的 Offload over Fabric教程

This tutorial shows how to install Offload over Fabric (OoF) software on 2nd generation Intel® Xeon Phi™ processor, configure the hardware, test the basic configuration, and enable OoF
Authored by Nguyen, Loc Q (Intel) Last updated on 03/21/2019 - 12:00
Article

了解面向三维同性有限差分 (3DFD) 波动方程代码的 NUMA

本文将介绍一些技巧,帮助软件开发人员识别并修复使用最新英特尔软件开发工具时遇到的与 NUMA 相关的应用性能问题。

Authored by Sunny G. (Intel) Last updated on 07/05/2019 - 20:13
Article

解读Intel编译器的offload报告

英特尔编译器在对代码进行编译优化的过程中用户可以通过使用”-opt-report-phase=phase”选项让编译器输出某些特定优化阶段的相关信息。针对至强融核™ 协处理器提供的offload编译模式英特尔编译器提供了”offload”关键字。

Authored by Duan, Xiaoping (Intel) Last updated on 06/07/2017 - 10:36
Article

针对英特尔® 至强™ 处理器 E5 系列的 Caffe* 评分优化

为了不断优化英特尔® 架构的深度学习工作负载,我们的工程师探索不同的路径,以达到最高性能。

Authored by Gennady F. (Blackbelt) Last updated on 03/21/2019 - 12:28
Article

案例研究: 面向神经细胞模拟优化代码

Intel held the Intel® Modern Code Developer Challenge that had about 2,000 students from 130 universities in 19 countries registered to participate in the Challenge. They were provided access to Intel® Xeon Phi™ coprocessors to optimize code used in a CERN openlab brain simulation research project. In this article Daniel Vea Falguera (Modern Code Developer Challenge winner) shares how he...
Authored by Last updated on 07/06/2019 - 16:40
Article

Привязка потоков (affinity) в Intel® Threading Building Blocks на сопроцессоре Intel® Xeon Phi™

Библиотека Intel® Threading Building Blocks (Intel® TBB) [1] [2] предоставляет высокоуровневые интерфейсы для написания программ, использующих параллельные

Authored by Alex (Intel) Last updated on 08/01/2019 - 09:30
Article

面向使用 PME 工作负载的对称英特尔® MPI 的 GROMACS 方案

目标

该文件包(脚本及其说明)提供了针对对称英特尔运行的构建和运行环境。 该文件实际上是自述 (README) 文件包。 对称指采用至强™ 可执行文件和至强融核™ 可执行文件,两者通过英特尔 MPI 同时运行以传输 MPI 消息和集体数据。

Authored by Heinrich Bockhorst (Intel) Last updated on 07/06/2019 - 16:40
Article

使用 TensorFlow* 对象检测 API 实施交通灯检测

本案例研究评估了 TensorFlow* 对象检测 API 处理一个实时任务的能力,即在基于英特尔® 至强® 处理器的机器上进行交通灯检测。
Authored by admin Last updated on 08/13/2018 - 23:08