英特尔开发人员专区文章

16-8月-2017
1:17 上午 PDT
沉浸式虚拟现实体验指南
作者:Susan Michalak (Intel)张贴日期:08/16/20170
Virtual reality’s capabilities have come so far that a remarkably convincing sense of immersion is now possible. Achieving that in a sustainable way requires VR developers to pay careful attention to several categories of possible distractions: foundational issues of safety and comfort, basic sen...
31-7月-2017
12:10 上午 PDT
Unreal* Engine 4 VR应用的CPU性能优化和差异化:第一部分
作者:管理张贴日期:07/31/20170
作者:王文斓 虚拟现实(VR)能够带给用户前所未有的沉浸体验,但同时由于双目渲染、低延迟、高分辨率、强制垂直同步(vsync)等特性使VR对CPU渲染线程和逻辑线程,以及GPU的计算压力较大[1]。如何能有效分析VR应用的性能瓶颈,优化CPU线程提高工作的并行化程度,从而降低GPU等待时间提升利用率将成为VR应用是否流畅、会否眩晕、沉浸感是否足够的关键。Unreal* Engine 4 (UE4) 作为目前VR开发者主要使用的两大游戏引擎之一,了解UE4的CPU线程结构和相关优化工具能够帮助我们开发出更优质的VR应用。本文将集中介绍UE4的CPU性能分析和调试指令、线程结构、优化方法和...
17-五月-2017
1:52 上午 PDT
英特尔® 至强® 处理器 E5 v40 有助于提高百度深度神经网络点击率
作者:Nguyen, Khang T (Intel)张贴日期:05/17/20170
销售产品或服务的新网站如何才能在搜索列表的前几页显示?关键是使用正确的关键字,并与用户搜索产品或服务时使用的关键字相关。百度1 是中国最常用的搜索引擎。为了使广告出现在搜索列表的前几页,广告公司需要向百度支付一定的费用。
08-7月-2015
8:26 上午 PDT
什么是代码现代化?
作者:Mike P. (Intel)张贴日期:07/08/20150
现代高性能计算机由下列资源组合构建而成:多核处理器、众核处理器、大型高速缓存,高带宽进程间通信结构和高速 I/O 功能。 高性能软件需经过设计,以充分利用这些丰富的资源。 无论是重新构建并/或调优现有应用以发挥最高性能,或为现有或未来设备构建新应用,了解编程模型和高效利用资源之间的相互作用极其关键。 以此为起点,全面了解代码现代化。 关于性能,您的代码至关重要! 构建软件的并行版本可使应用在更短的时间内运行指定的数据集,在固定时间内运行多个数据集,或运行非优化软件禁止运行的大型数据集。 并行化的成功通常通过测量并行版本的加速(相对于串行版本)来进行量化。 除了上述比较之外,将并行版本加...
30-1月-2018
9:57 下午 PST
借助英特尔® 优化 Chainer* 管理深度学习网络
作者:Mingxiao H. (Intel)张贴日期:01/30/20180
总结 Chainer 是基于 Python 的深度学习框架,旨在提高灵活性和直观性。它可根据 define-by-run 方法(亦称动态计算图)提供自动差异化 API,并提供面向对象的高级别 API,以构建和训练神经网络。它支持各种网络架构,包括前馈网络、卷积网络、循环网络和递归网络。它还支持 per-batch 架构。正演计算可包含 Python 的所有控制流声明,完全具备反向传播能力。它可使代码更加直观,并易于调试。英特尔® 优化 Chainer* 目前集成了最新版面向深度神经网络的英特尔® 数学核心函数库 (英特尔® MKL-DNN) 2017,专门面向高级矢量扩展指令集 ...
26-1月-2018
2:25 上午 PST
在Windows上的Caffe实战:猫狗大战
作者:管理张贴日期:01/26/20180
作者:Qian, Caihong 文档目的 本文以Kaggle的猫狗大战为例,介绍在Windows上如何利用Caffe对自己的图片进行训练以及进行简单的调参,并且利用训练好的模型进行测试和分类预测。 环境介绍 本文所述的工具和命令适用Windows+BVLC Caffe的CPU或GPU版本 (需要在提前机器上安装BVLC Caffe并成功编译); 以及Windows+ clCaffe的版本, 但clCaffe是基于Intel Skylake及以后的处理器核显做硬件加速的修改版,使用时要注意。 准备原始数据 原始数据即用来做训练的数据,数据可以是自己制作的,也可以在网上找现成的...
14-1月-2018
9:48 下午 PST
基于 CPU 实施高效且快速的医疗影像分析
作者:管理张贴日期:01/14/20180
基于 2017 年阿里巴巴天池医疗 AI 大赛的实验性总结 作者:胡潇、吴慧 和 姚伟峰 概述 本文基于由阿里云、英特尔和零氪科技联合主办的天池医疗 AI 大赛。在大赛中选手挑战通过计算机断层 (CT) 扫描自动检测肺结节。该赛事吸引了全球 2,887 支参赛队伍,经过 7 个月的紧张角逐,在 2017 年 10 月成功落下帷幕。大赛托管于阿里巴巴的公有云服务,此服务完全基于英特尔的深度学习软硬件堆栈而构建。在整个比赛过程中,英特尔积极参与了架构设计、软硬件开发、性能优化和在线支持,因此积累了有关医疗 AI 的丰富洞察。本文将以实验方式阐述这些重要发现。 首先,我们吸收了所有天池...
22-12月-2017
2:14 上午 PST
Caffe学习笔记 第二部分 - Windows* 下基于Intel核显加速的clCaffe的安装,配置与性能提升
作者:管理张贴日期:12/22/20170
作者:Gu, Jianjun 点击访问Caffe学习笔记 第一部分 - Windows*下BVLC Caffe的安装与配置 clCaffe编译与配置 Intel clCaffe (https://github.com/01org/caffe)是利用基于Intel Skylake及以后的处理器核显(即Gen9架构以上)做硬件加速的一个修改版。如果你当前机器是基于Nvdia显卡,请用NV cuda加速版本;如果你的显卡是AMD的,请check out 官方BVLC caffe的opencl分支。 clCaffe的编译 安装编译所需要的软件 Visual Studio 2015 ...
22-12月-2017
12:10 上午 PST
Caffe学习笔记 第一部分 - Windows*下BVLC Caffe的安装与配置
作者:管理张贴日期:12/22/20170
作者:Gu, Jianjun Tensorflow和Caffe是机器学习初学者常用的2种深度学习框架。相对于Tensorflow有简单的python pip一键安装包,Caffe的安装更考验开发者的计算机编译水平,需要自己下载源码编译。尽管caffe的配置教程网上很多,但是网上caffe的各个分支版本也很多,所以初学者在编译时总是会碰到各种奇怪的问题。本文会针对初学者常用的Windows* + Intel CPU的平台上安装配置Caffe做一个较为完整的总结。 Caffe的各个版本简介 官方版本:伯克利BVLC(Berkeley Vision And Learning Center...
18-12月-2017
1:36 上午 PST
如何将针对英特尔硬件平台优化编译的TensorFlow和Caffe部署到Movidius NCS SDK中
作者:管理张贴日期:12/18/20170
作者:裴凡江 概要 目前Movidius NCS SDK (版本号1.10.01)同时支持Caffe和TensorFlow两种机器学习框架。在Ubuntu 16.04版本的SDK安装过程中,SDK安装程序默认会下载官方的Caffe和TensorFlow,这样确保SDK安装完成之后,示例代码一定够顺利跑起来,对新手开发者非常友好。然而对于有经验的开发者,他们的机器中往往已经存在针对本机优化编译过的TensorFlow/Caffe,比如加入了AVX/MKL/OpenCL等优化的TensorFlow,这比Google开源的CPU编译版本性能有巨大的提升。比如针对Intel多核CPU专门优化...
订阅 英特尔开发人员专区文章