Artigo técnico

粒度与并行性能

One key to attaining good parallel performance is choosing the right granularity for the application. Granularity is the amount of real work in the parallel task. If granularity is too fine, then performance can suffer from communication overhead.
  • Linux*
  • Microsoft Windows* (XP, Vista, 7)
  • Servidor
  • Intermediário
  • Intel® Parallel Studio XE
  • Intel® Parallel Studio XE Composer Edition
  • Compilador C++ Intel®
  • Compilador Fortran Intel®+
  • Computação paralela
  • Головная гарнитура Helios использует технологию Intel® RealSense™ для помощи людям с нарушениями зрения

    Using Computer Vision, Artificial Intelligence, and Intel® RealSense™ technology, the Helios project is focused on the development of smart headgear to assist with partial or complete vision loss.The HELIOS headgear provides a series of accessibility features for visually impaired individuals, empowering them to perform actions and tasks with more ease and confidence.
  • Microsoft Windows* 10
  • Tecnologia Intel® RealSense™
  • Principiante
  • SDK de Intel® RealSense™
  • Tecnologia Intel® RealSense™
  • The Intel® XDK and Node.js* IoT Apps

    Some of you may know that the Intel® XDK mobile app development tool was previously produced in multiple flavors:

    With our August 2016 release of the Intel XDK we moved to a simpler product offering: a single development tool known simply as the Intel XDK. Same name but with several new features. Most importantly:

    面向 NUMA 优化应用

    优化面向 NUMA 的应用 (PDF 225KB)

    摘要

    NUMA (非一致性内存访问)是一种共享内存架构,描述如何在多处理器系统中放置与处理器相关的主要内存模块。 与其他大多数处理器架构特性一样,忽略 NUMA 可能会导致应用内存性能降低。 但幸运的是,我们可以采取一些步骤缓解基于 NUMA 的性能问题,也可使用 NUMA 架构充分利用并行应用。 其中需要考虑的因素包括处理器关联、基于隐式操作系统策略的内存分配,以及使用系统 API 以通过显式指令分配和迁移内存页。

    本文是“英特尔® 多线程应用开发指南”系列的一部分,该系列介绍了针对英特尔® 平台开发高效多线程应用的指导原则。

  • NUMA
  • Otimização
  • Computação paralela
  • 避免并发现线程之间的假共享

    避免并发现线程之间的假共享 (PDF 218KB)

    摘要

    在对称多处理器 (SMP) 系统中,每个处理器均有一个本地高速缓存。 内存系统必须保证高速缓存的一致性。 当不同处理器上的线程修改驻留在同一高速缓存行中的变量时就会发生假共享, 结果导致高速缓存行无效,并强制执行更新,进而影响系统性能。 本文介绍了检测和更正假共享的方法。

    本文是“英特尔多线程应用开发指南”系列的一部分,该系列介绍了针对英特尔® 平台开发高效多线程应用的指导原则。

    背景

  • Linux*
  • Microsoft Windows* (XP, Vista, 7)
  • Intermediário
  • Intel® Parallel Studio XE
  • Intel® VTune™ Amplifier
  • Data Alignment
  • programming tools
  • cache coherence
  • profiler
  • Computação paralela
  • Thread
  • 检测线程应用中的内存带宽饱和度

    检测线程应用中的内存带宽饱和度 (PDF 231KB)

    摘要

    内存子系统组件在很大程度上影响着应用的性能特征。 现在,随着越来越多的线程和进程共享有限的高速缓存容量和内存带宽等资源,线程化应用的可扩展性受到了极大限制。 内存密集型线程化应用在运行多个线程时可能会出现内存带宽饱和的问题。 在这种情况下,线程化应用将无法像预期一样扩展,性能也可能有所下降。 本文介绍了在线程化应用中检测内存带宽饱和度的技巧。

    本文是“英特尔多线程应用开发指南”系列的一部分,该系列介绍了针对英特尔® 平台开发高效多线程应用的指导原则。

  • Linux*
  • Microsoft Windows* (XP, Vista, 7)
  • Servidor
  • Principiante
  • Intel® Parallel Studio XE
  • Intel® VTune™ Amplifier
  • Intel® Inspector
  • Intel® Performance Tuning Utility
  • memory
  • scalability
  • Computação paralela
  • Thread
  • 借助线程局部存储减少同步处理

    借助线程局部存储减少同步处理 (PDF 241KB)

    摘要

    同步化处理通常是一个昂贵的操作,它限制一个多线程程序的性能。 使用线程局部数据结构来代替由线程共享的数据结构可在某些情况下减少同步化处理,使一个程序运行得更快。

    本文是“英特尔多线程应用开发指南”系列的一部分,该系列介绍了针对英特尔® 平台开发高效多线程应用的指导原则。

    背景

    当数据结构由一组线程共享时,至少有一个线程写入其中,线程之间的同步化处理有时需要确保是否所有线程均会看到一致的共享数据。 这种情况下,线程的一个典型同步化访问制度是一个线程获取锁,读取或写入共享数据结构,然后释放锁。

  • Computação paralela
  • Thread
  • Assine o Artigo técnico