Extensões ISA

A Instruction Set Architecture (ISA) da Intel continua a evoluir e expandir em funcionalidade, a enriquecer a experiência do usuário e a criar sinergia entre indústrias.

INTEL® AVX

Intel® Advanced Vector Extensions (Intel® AVX)

A necessidade de desempenho computacional maior continua a crescer em todos os segmentos da indústria. Para atender a esta demanda crescente e para desenvolver modelos de uso, nós continuamos com o nosso histórico de inovação com o Intel® Advanced Vector Extensions (Intel® AVX) nos produtos de hoje.

O Intel® AVX é uma nova extensão do conjunto de instruções de 256 bits para Intel® SSE e foi criado para aplicativos que usam ponto flutuante intensamente. Foi lançada no início de 2011 como parte da segunda geração da família de processadores Intel® Core™, e está presente em plataformas que vão de notebooks a servidores. O Intel AVX aumenta o desempenho por causa do uso de vetores mais amplos, uma nova sintaxe extensível e uma poderosa funcionalidade. As extensões Intel AVX2 foram lançadas em 2013 com a quarta geração da família de processadores Intel® Core e expande ainda mais a capacidade de processamento vetorial em domínios de dados inteiros e de ponto flutuante. Isso resulta em desempenho superior e gerenciamento de dados mais eficiente em uma ampla gama de aplicativos, como processamento de áudio/vídeo e imagem, simulações científicas, análises financeiras e modelagem e análise em 3D.

 

Intel® Advanced Vector Extensions 512 (Intel® AVX-512)

No futuro, alguns novos produtos darão um salto significativo em direção ao suporte para SIMD de 512 bits. Os programas podem processar oito números de ponto flutuante de precisão dupla e 16 de precisão simples com vetores de 512 bits, bem como oito inteiros de 64 bits e 16 inteiros de 32 bits. Isto permite o processamento do dobro do número de elementos de dados que as extensões Intel AVX/AVX2 podem processar com uma instrução simples e quatro vezes a capacidade das instruções Intel SSE.

As instruções Intel AVX-512 são importantes por que elas fornecem recursos de maior desempenho para as tarefas computacionais mais exigentes. As instruções Intel AVX-512 oferecem o mais alto grau de suporte para compiladores, pois elas incluem um nível sem precedentes de abrangência das capacidades das instruções.

Os recursos do Intel AVX-512 incluem 32 registradores vetoriais com largura de 512 bits e oito registradores de máscara dedicados. O Intel AVX-512 é um conjunto flexível de instruções que suporta difusão, mascaramento integrado para habilitar a predicação, controle integrado de arredondamento de ponto flutuante, supressão integrada de falhas de ponto flutuante, instruções de espalhamento, instruções matemáticas de alta velocidade e representação compactada de valores de alto deslocamento.

O Intel AVX-512 oferece um nível de compatibilidade com o Intel AVX maior do que as transações anteriores para novas larguras de operações SIMD. Ao contrário das Intel SSE e Intel AVX, que não podem ser misturadas sem perda de desempenho, a mistura de instruções Intel AVX e Intel AVX-512 é suportada sem penalidades de desempenho. Os registradores YMM0 a YMM15 da Intel AVX correspondem aos registradores ZMM0 a ZMM15 da Intel AVX-512 (no modo x86-64), de modo muito semelhante ao mapeamento entre os registradores das Intel SSE e os registradores das Intel AVX. Portanto, nos processadores que suportam o Intel AVX-512, as instruções Intel AVX e Intel AVX2 operam nos 128 ou 256 bits inferiores dos primeiros 16 registradores ZMM.

Mais informações sobre as instruções Intel AVX-512 podem ser encontrados no blog "Instruções AVX-512". As instruções estão documentadas na Referência de Programação Para as Extensões do Conjunto de Instruções da Arquitetura Intel® (PDF) (veja a aba "Inicie-se" nesta página).

Palestra: Como otimizar seu código sem ser um "ninja" em Computação Paralela Não perca a palestra "Como otimizar seu código sem ser um "ninja" em Computação Paralela" da Intel que será ministrada durante a Semana sobre Programação Massivamente Paralela em Petrópolis, RJ, no Laboratório Nacional de Computação Científica. Data: 02/02/2016 - 11h30 Local: LNCC - Av. Getúlio...
O que é o Intel® Xeon Phi™ e como ele atinge o impressionante processamento de 1 TFlops Intel® Xeon Phi™ - 61 cores, 244 threads, 8 GB de memória DDR5 e 1 TFlops. Antes de mais nada, gostaria de apresentar o Intel® Xeon Phi™ e mostrar como esta pequena obra de arte tecnológica pode lhe trazer benefícios.