Intel® Developer Zone:
Coprocessador Intel® Xeon Phi™

Produtividade via inovação de arquitetura em conjunto com software conhecido. Coprocessador Intel® Xeon Phi™:

  • Estende o suporte de hardware para níveis mais altos de paralelismo com economia de energia
  • Usa modelos de programação conhecidos e padronizados para preservar os investimentos
  • Compartilha a programação paralela com processadores de uso geral
Primeiros passos
O Intel® Xeon Phi™ é o coprocessador certo para você?
Arquitetura do coprocessador Intel® Xeon Phi™
Mapas do site: Administradores, Desenvolvedores, Investigadores
Guias e manuais
Guia de Início Rápido para o Desenvolvedor do Coprocessador Intel® Xeon Phi™
Manual de Referência da Arquitetura do Conjunto de Instruções do Coprocessador Intel® Xeon Phi™
Guia de Administração do Sistema

A programação paralela é parte da evolução para o futuro. Os processadores e coprocessadores Intel oferecem um método convergente, de modo que você pode usar modelos e ferramentas comuns de programação.

  • Modelos de programação paralela baseados em padrões, que são poderosos hoje e no futuro
  • Usam fluxos de trabalho e base de código de desenvolvimento bem estabelecidos que são escalonáveis para aplicações do futuro
  • Técnicas que beneficiam processadores e coprocessadores, preservando investimentos passados e futuros
Programação para produtos Multicore e Many-core
Receitas de código para o Coprocessador Intel® Xeon Phi™

Programação

Guia do desenvolvedor de software para o coprocessador Intel® Xeon Phi™

Criação de aplicativos nativos

Programação e compilação

Dicas: Diretivas e funções

Descarregamento automático de bibliotecas do kernel matemático

Uso da Intel® MPI

Uso de extensões OpenMP*

Design e programação com OpenCL*

Interface binária de aplicativo do sistema V

Diferenças em aritmética de ponto flutuante

Reprodutibilidade de execução para execução

Configuração e análise de potência

Migração de projetos Fortran

Depuração

Depuração no Linux*

Depuração no Windows*

Otimização

Otimização – Parte 1: Aspectos essenciais

Otimização – Parte 2: Eventos de hardware

Unidades de monitoração de desempenho

Otimização de loop

Os métodos mais conhecidos para aumento de desempenho

Vídeos sobre oficinas para o desenvolvedor de software

Um guia técnico sobre o ambiente de desenvolvimento de software para o processador Intel® Xeon Phi™

Nome / Descrição Linguagem de programação Nível de experiência do usuário

BeginningSlides_ExtractedCode.zip
Amostras extraídas de slides da apresentação Oficina de nível introdutório sobre o coprocessador Intel® Xeon Phi™, incluindo traduções de Fortran.

C++, Fortran Principiante

BeginningLabs_FortranVersion.zip
Exercícios de laboratório da Oficina de nível introdutório sobre o coprocessador Intel® Xeon Phi™ - versão Fortran.

Fortran Principiante

BeginningLabs_CVersion.zip
Exercícios de laboratório da Oficina de nível introdutório sobre o coprocessador Intel® Xeon Phi™ - versão C++.

C/C++ Principiante

Laboratórios de oficinas avançadas
Laboratórios que cobrem conceitos mais avançados, como Intel® MKL, Intel® MPI, depuração, otimização de memória, ajuste e vetorização.

C/C++, Fortran Avançado

A importância da vetorização (exemplo em Fortran)
Para obter bom desempenho da arquitetura Intel® Many Integrated Core (Intel® MIC) e de sistemas que usam os coprocessadores Intel® Xeon Phi™, os aplicativos precisam tirar proveito dos registradores SIMD de 16 bits e dos recursos many core.

Fortran Avançado

As muitas faces do paralelismo
Este laboratório contém vários exemplos (Riemann Sums, SGEMM, Fibonacci, Qsort, Cholesky Decomposition, Algorithm, Mandelbrot Set) que descrevem as etapas entre um problema serial e uma solução paralela rodando no coprocessador Intel® Xeon Phi™.

C/C++ Avançado

Exemplos do Intel® SDK for OpenCL* Applications XE

OpenCL Básico, intermediário

Conferência iXPTC 2013 de Serviços Financeiros

C/C++ Básico, intermediário

Exercícios de laboratório SHOC MD
Uso de uma implementação simples do algoritmo nbody usando o potencial de Lennard-Jones em dinâmica molecular como exemplo de portagem e otimização de aplicativos.

C/C++ Básico, intermediário

Structured Parallel Programming: Patterns for Efficient Computation
Michael McCool, James Reinders e Arch Robison - Data da publicação: 09 de julho de 2012 | ISBN-10: 0124159931 | ISBN-13: 978-0124159938


Intel® Xeon Phi™ Coprocessor High Performance Programming
Jim Jeffers e James Reinders – Já disponível!


Parallel Programming and Optimization with Intel® Xeon Phi™ Coprocessors
Colfax International


Intel® Xeon Phi™ Coprocessor Architecture and Tools - The Guide for Application Developers
Reza Rahman

Este artigo contém um compêndio crescente de códigos comumente acessíveis que podem ser executados nos coprocessadores Intel® Xeon Phi™.

Se você tiver feito uma promoção de upstream de um código de comunidade, publique uma linha de discussão ("thread") no fórum Intel® Many Integrated Core Architecture para que nós possamos atualizar a lista.

Você quer receber atualizações quando novos códigos são publicados? Clique no botão 'Assinar' na parte de baixo desta página para ser notificado quando este documento for atualizado.

Código (em ordem alfabética) Descrição Segmento Onde fazer o download Instalar e exemplo (se necessário)
GEMM, STREAM, Linpack GEMM e Linpack executam operações básicas de matriz densa para aumentar o desempenho de ponto flutuante do coprocessador. STREAM é um teste de largura de banda de memória para melhorar o desempenho de memória GDDR. Acadêmico Estes benchmarks podem ser obtidos durante o download de Intel® MPSS - eles são incluídos nos pacotes de desempenho opcionalmente instalados que colocam os benchmarks e a documentação relacionada em /opt/intel/mic/perf na versão 2.x do MPSS  ou em  /usr/share/micperf na versão 3.1.* do MPSS

Usuários do Intel® MPSS 2.1:  Sigam as instruções contidas no Capítulo 5 do arquivo Readme do Intel® MPSS sobre instalação e configuração.

Usuários do Intel® MPSS 3.1:  Sigam as instruções contidas no Capítulo 4 do guia do usuário do Intel® MPSS sobre instalação e configuração.

Para STREAM, se preferir fazer você mesmo o download da fonte, as instruções de compilação e otimização estão aqui

LBS3D Ferramentas de simulação para múltiplos fluxos baseados no método Lattice Boltzmann de energia livre, importante para a dinâmica computacional de fluidos. O código permite a simulação de fluxos bifásicos aparentemente incompreensíveis e usa modelos multifásicos que trabalham com razões de alta densidade. Fabricação mplabs

Siga as instruções de compilação que estão aqui

(Consulte também este documento técnico)

Mantevo MiniFE

Mini aplicativo independente que encapsula as mais significativas características de desempenho (geração, montagem, solução) de uma aplicação implícita de métodos de elementos finitos em código C++. O domínio físico é uma caixa tridimensional modelada por elementos hexaédricos (às vezes chamados de elementos "blocos"). A caixa é representada como uma grade estruturada mas é tratada como não estruturada. O domínio é decomposto para execução paralela com o uso de bissecção coordenada recursiva.

Acadêmico mantevo.org > Download

Siga as orientações contidas neste estudo de caso de MiniFE para entender quais flags e opções devem ser usadas para executar o MiniFE no host, no coprocessador ou em ambos

MPI-HMMER

A versão d HMMER, um modelo Markov oculto para a análise de sequências de proteínas. Nesta versão, duas rotinas , hmmsearch e hmmpfam, foram modificadas para usar o MPI para paralelismo.

Acadêmico

http://mpihmmer.org

Veja esta receita para obter informações sobre compilação e otimização
SHOC

O SHOC (Scalable Heterogeneous Computing Benchmark Suite), ou SHOC GitHub, pode ser usado para medir o desempenho e a estabilidade de sistemas baseados em coprocessadores. As referenciais de excelência foram portadas para suportar o Intel® Xeon Phi™ usando construções de programação de descarregamento implementados no compilador Intel® que está disponível como parte do pacote Intel® Composer XE 2013.

Acadêmico

GitHub

Veja esta receita para obter informações sobre configuração e compilação
WRF O modelo WRF (Weather Research and Forecasting) é um sistema numérico de previsão do tempo criado para atender necessidades de pesquisa atmosférica e de previsão operacional. O WRF é usado por cientistas académicos do campo de fenômenos atmosféricos, equipes de previsão do tempo, cientistas de aplicações, etc. Visite o site http://www.wrf-model.org/index.php para obter mais informações sobre o WRF. Tempo (clima), acadêmico Página dos usuários do WRF Veja esta receita para obter informações sobre configuração e compilação
  • Arquitetura Intel® Many Integrated Core
  • Mais recentes posts

    List of Useful Power and Power Management Articles, Blogs and References
    By Taylor Kidd (Intel)Posted 04/17/20142
    INTRODUCTION AND PURPOSE: This article endeavors to provide a single point of reference to Power Management blogs, articles and other resources relevant to the Intel® Xeon Phi™ coprocessor. There are many excellent resources out there on power, power management and tools; this article cannot ho...
    Power Management States: P-States, C-States, and Package C-States
    By Taylor Kidd (Intel)Posted 04/17/20140
    (For a PDF version of this article, download the attachment.) Contents Preface: What, Why and from Where. 1 Chapter 1: Introduction and inquiring minds. 2 Chapter 2: P-States, Reducing power consumption without impacting performance. 3 Chapter 3: Core C-States, The Details. 5 Chapter 4: ...
    Resolving Symbols for Intel® Manycore Platform System Stack (Intel® MPSS) in Intel® VTune™ Amplifier XE Analysis
    By Sumedh Naik (Intel)Posted 04/09/20140
    Background Whenever Intel VTune Amplifier XE is unable to resolve symbols for libraries or the operating system, it lumps all the counts for that module together. Often, these lumped counts end up at the top of the hotspot list, skewing the analysis. By setting the correct search library path in...
    Recipe: Building and Optimizing the Hogbom Clean Benchmark for Intel® Xeon Phi™ Coprocessors
    By Sumedh Naik (Intel)Posted 04/09/20140
    Overview This article provides a recipe for compiling and running the Hogbom Clean benchmark for the Intel® Xeon Phi™ coprocessor and discusses the various optimizations applied to the code.  Introduction Hogbom Clean is a part of the ASKAP benchmark package. The ASKAP benchmark package is use...

    Páginas

    Assine o
    Intel(R) Xeon Phi(tm) Coprocessor -- Cluster training - call for demand!
    By BELINDA L. (Intel)16
    Intel is evaluating to offer a 4 hour web-based basic tutorial covering the fundamental principles of how to integrate an Intel Xeon Phi coprocessor into a Linux based cluster. During the course each attendant would have remote access to a Linux server and be able to do each step as shown in the outline below.  The course will be given free of charge. Requirements are an Internet connection, a web browser, and Putty.   We are settling on the sharing technology we will be using, and will publish that at a later date. If you are interested in such an offer please reply to this forum thread -- you have the ability to reply privately, if you don't want to be identified. If we have enough interest, we'll pull it together! Topics: Finding information on Intel Xeon Phi coprocessor on the web Download the driver software Unpacking the driver software package, explanation of components Discussion on prerequisites of the compute server (for instance what software needs to be installed, reserv...
    Invitation to evaluate Intel® MKL Sparse Matrix Vector Multiply Format Prototype Package for Intel® Xeon Phi™ coprocessors
    By Zhang Z (Intel)0
    We are seeking interested parties to evaluate Intel® MKL SpMV Format Prototype Package for Intel® Xeon Phi™ coprocessors. Sparse Matrix Vector Multiply (SpMV) is an important operation in many scientific applications, and its performance can be a critical part of overall application performance. On Intel® Xeon Phi™ coprocessors, Intel® MKL 11.0 and later provide highly-tuned SpMV kernels for the compressed sparse row (CSR) sparse matrix storage format. But the existing standard (NIST*) sparse BLAS interface has limitations that prevent us from realizing  further performance improvements, especially for matrices with non-uniform sparsity structures. The Intel® MKL SpMV Format Prototype Package tries to address these limitations by introducing a new interface that supports a staged approach: First, the input matrix structure is analyzed and an appropriate computational kernel and workload balancing algorithm are chosen. Then, repeated SpMV calls can be made for matrices of the same st...
    MICRAS Log User Guide
    By MARC B. (Intel)0
    The attached document describes how to interpret the messages in the micras.log file.
    Flash Issues & Remedies
    By MARC B. (Intel)0
    The attached document describes some common issues and questions that have been reported and how they might be addressed.
    New Tools: Simple Performance Tools for the Intel® Xeon® processor line and the Intel® Xeon Phi™ coprocessor
    By Sumedh Naik (Intel)0
    Larry Meadows from Intel Corporation has developed two simple tools for the Intel® Xeon® processor line as well as the Intel® Xeon Phi™ coprocessor that allow a user to determine how well their application is using the machine. Speedometer: Speedometer measures the resource usage of a system while running an application and reports that usage as a percentage of the peak value of the corresponding resource. The resources that are tracked include memory bandwidth, instruction bandwidth, and vector or floating-point unit use. Average values for each resource are reported after the program executes. It is also possible to record the resource usage over time, and GUI tools are provided to plot such recordings. Speedometer is intended to give you a general idea of how well your code is using the system. Overhead: Overhead uses statistical profiling to determine how the application's CPU time is allocated. The hardware periodically interrupts the application and saves the current instruc...
    Troubleshooting HOWTO: Bad hardware? MPSS? Configuration?
    By BELINDA L. (Intel)32
    Are you having problems with your hardware (Cannot see your Intel(R) Xeon Phi(tm) coprocessor?  Sporadic accessibility?) or with the Intel(R) Manycore Platform Software Stack (Intel(R) MPSS) running reliably? Attached to this post is a PDF "flowchart" that explains how you can troubleshoot the problem (note:  this applies if you are running the Linux* operating system on your host), and shows what information you will want to collect if you need to escalate your issue to your OEM provider or Intel. We hope this is is useful to you!   Please let us know if you have found a boundary condition not comprehended properly by this "flow".
    What collateral/documentation do you want to see?
    By BELINDA L. (Intel)49
    Do you have questions that you are not finding the answers for in our documentation?  Need more training, source code examples, on what specifically?   Help us understand what's missing so that we can make sure we develop documentation you care about (what is important, and what is nice to have)!   Thank you
    FAQS: Compilers, Libraries, Performance, Profiling and Optimization.
    By Sumedh Naik (Intel)6
    In the period prior to the launch of Intel® Xeon Phi™ coprocessor, Intel collected questions from developers who had been involved in pilot testing. This document contains some of the most common questions asked. Additional information and Best-Known-Methods for the Intel Xeon Phi coprocessor can be found here. The Intel® Compiler reference guides can be found at: C/C++: http://software.intel.com/sites/products/documentation/doclib/stdxe/2013/composerxe/compiler/cpp-lin/index.htm Fortran: http://software.intel.com/sites/products/documentation/doclib/stdxe/2013/composerxe/compiler/fortran-lin/index.htm Addendum: http://software.intel.com/sites/default/files/article/327178/intelmpi4.1-releasenotes-linux-addendum-for-mic.pdf The Intel® Math Kernel Libraries (Intel® MKL) reference guide can be found at: http://software.intel.com/sites/products/documentation/doclib/mkl_sa/11/mkl_userguide_lnx/index.htm ______________________________________________________________________________________...

    Páginas

    Assine o Fóruns
    Intel presente no SECOMP 2013 da UNIFEI
    By Luciano Palma (Intel)Posted 05/31/20130
    A Intel estará presente no Seminário em Computação da Universidade Federal de Itajubá, que acontece entre os dias 3 e 7 de junho de 2013. O Community Manager para Servidores e HPC da Intel, Luciano Palma, realizará um palestra sobre Computação Paralela (dia 4, 13h30). Participe do evento, conheç...
    Assine o Blogs do Intel® Developer Zone