Intel® Streaming SIMD Extensions

Оптимизировали, оптимизировали, да не выоптимизировали!

Оптимизация? Конечно, каждый сталкивался с данной задачей при разработке своих, сколь-нибудь значительных, требующих определённых вычислений, приложений. При этом способов оптимизировать код существует огромное множество, и, как следствие, различных путей сделать это в автоматическом режиме с помощью опций компилятора. Вот здесь и возникает проблема – как выбрать то, что нужно нам и не запутаться?

Links to instruction documentation

Простая методика оптимизации с использованием Intel System Studio (VTune, компилятор C++, Cilk Plus)


В этой статье мы описываем простую методику оптимизации с использованием Intel® Cilk™ Plus и компилятора Intel® C++ на основе результатов анализа производительности, проведенного с помощью Intel® VTune Amplifier. Intel® System Studio 2015 содержит упомянутые компоненты, использованные для этой статьи.

  • Разработчики
  • Партнеры
  • Профессорский состав
  • Студенты
  • Microsoft Windows* 8.x
  • Коммерческие клиентские решения
  • Cloud Services
  • Разработка игр
  • Интернет вещей
  • Windows*
  • C/C++
  • Продвинутый
  • Начинающий
  • Средний
  • Intel® System Studio
  • Intel System Studio
  • intel cilk plus
  • Intel VTune Amplifier for systems
  • C++ Compiler Windows Host
  • Intel® Advanced Vector Extensions
  • Intel® Streaming SIMD Extensions
  • Образовательные учреждения
  • Инструменты для разработки
  • Процессоры Intel® Core™
  • Оптимизация
  • Параллельные вычисления
  • Анализ платформы
  • Многопоточность
  • Векторизация
  • Accelerating texture compression with Intel® Streaming SIMD Extensions

    Improving ETC1 and ETC2 texture compression


    What is texture compression?

    Texture compression has been used for some time now in computer graphics to reduce the memory consumption and save bandwidth on the graphics pipeline. It is supported by modern graphics APIs, such as OpenGL* ES and DirectX*. The process of compressing a texture is lossy. Existing algorithms must not only achieve the best speedups but also preserve as much of the original information as possible.

  • Разработчики
  • Google Chrome OS*
  • Intel® Streaming SIMD Extensions
  • SDE debugtrace output incomplete

    I am running SDE to trace a program, and the output stops without explanation.

    I used -dt_filter_start 0x100401000 and -dt_filter_end 0x100409000 to enclose the portion of the program to trace.

    In case the problem is dependent on the program being traced, here are the last several lines of output:

    AVX512 for mobile?

    OK, so Skylake has been out for a month, and IDF is long past - but I still don't have an answer to one basic question: will there be any mobile chips that support a AVX512? At first my hopes had been dashed with the announcement that AVX would only be in available on Skylake Xeon, but then they were raised again when we found out that there would be a mobile Xeons for Skylake. 

    IA-32e 64-bit and compatibility mode


    From Intel developer manual I see

    IA-32e mode allows software to operate in one of two sub-modes:

    •          64-bit mode supports 64-bit OS and 64-bit applications
    •          Compatibility mode allows most legacy software to run; it co-exists with 64-bit applications under a 64-bit OS

    I have a quad-core with HT enabled i.e. 8 logical cores

    With KVM I want to run 32 bit and 64 bit VMs on a 64 bit Host OS. I want to allocate resources as follows

    Intel® X86 Encoder Decoder (Intel® XED) - new release site


    Until mid-2015, Intel XED had been distributed externally via Pin kits. However, with a recent change to Pin's C-runtime, it is now required that users of Intel XED obtain Intel XED compiled against a conventional C-runtime from a new site. The Intel XED library that comes with Pin is compiled only to work with the Pin C-runtime and not the standard runtime libraries available on every system. 

    The new site for distributing Intel XED is: 

    Подписаться на Intel® Streaming SIMD Extensions