Intel® Deep Learning Boost

O que é o Intel® Deep Learning Boost (Intel® DL Boost)?

Os processadores escaláveis Intel® Xeon® da segunda geração apresentaram uma série de recursos para aprendizagem profunda, agrupados como Intel® Deep Learning Boost. Esses recursos incluem Instruções de Rede Neural Vetorial (VNNI - Vector Neural Network Instructions), que aumentam a taxa de transferência para aplicativos de inferência com suporte para convoluções INT8, combinando múltiplas instruções de máquina das gerações anteriores em uma única instrução de máquina.

Saiba mais

Primeiros resultados de inferência MLPerf

Descrição técnica sobre as VNNI

Frameworks e ferramentas

Esses frameworks e ferramentas incluem suporte para Intel DL Boost em processadores escaláveis Intel Xeon de segunda e terceira gerações.

Quantização de modelo

A maioria dos modelos de aprendizagem profunda é criada usando a precisão de ponto flutuante de 32 bits (FP32). Quantização é o processo para representar o modelo usando menos memória com perda mínima de precisão. Nesse contexto, o foco principal é a representação no INT8.