Фильтры

Article

Три этапа подготовки к оптимизации параллельных программ

Повышение производительности параллельных программ требует хорошо структурированного подхода, активно использующего инструменты разработчика и быстро дающего положительные результаты. В данной статье приведены три этапа данного подхода.
Автор: aaron-tersteeg (Intel) Последнее обновление: 05.07.2019 - 10:13
Article

Планирование параллельной оптимизации

Параллельная оптимизация может обеспечить значительный рост производительности, однако для этого необходим план действий, оптимальный именно для вашего приложения. Вот несколько рекомендаций, которые помогут вам приступить к делу.
Автор: Diana B. (Intel) Последнее обновление: 05.07.2019 - 10:47
Article

Оптимизация структур данных и моделей доступа к памяти для улучшения локальности данных

Мы постараемся минимизировать число «непопаданий» в кэш, посредством разработки алгоритмов и структур данных, использующих локальность данных.
Автор: Victoria Gromova (Intel) Последнее обновление: 30.05.2018 - 07:40
Article

Оптимизация приложений под архитектуру NUMA

Optimizing Applications for NUMA [Eng., PDF 225KB]

Автор: Последнее обновление: 30.05.2018 - 07:40
Article

Особенности оптимизации вычислений в прикладных программах на языке С на примере оценивания опционов европейского типа

С.И. Бастраков, Р.В. Донченко, И.Б. Мееров, А.Н. Половинкин Нижегородский государственный университет им. Н.И. Лобачевского
Автор: Последнее обновление: 14.06.2017 - 13:07
Article

Состояния управления электропитанием: P-состояния, C-состояния и пакетные C-состояния

(Вы можете скачать PDF-версию этой статьи во вложении.)

Содержание

Предисловие. Что, почему и откуда? 1

Автор: Alexey Kostadinov (Intel) Последнее обновление: 06.07.2019 - 16:40
Article

GPU-Quicksort в OpenCL 2.0: вложенные параллельные вычисления и сканирование групп обработки

Введение Краткий курс истории алгоритма быстрой сортировки
Автор: Последнее обновление: 31.05.2019 - 14:20
Article

Приводим данные и код в порядок: данные и разметка, часть 2

In this pair of articles on performance and memory covers basic concepts to provide guidance to developers seeking to improve software performance. This paper expands on concepts discussed in Part 1, to consider parallelism, both vectorization (single instruction multiple data SIMD) as well as shared memory parallelism (threading), and distributed memory computing.
Автор: David M. Последнее обновление: 06.07.2019 - 16:40
Article

Чистим лук (но не плачем): методики оптимизации

Эта статья представляет собой формализованный ответ на публикацию на форуме Intel® Developer Zone. См.: (https://software.intel.com/en-us/forums/intel-moderncode-for-parallel-architectures/topic/590710).
Автор: Последнее обновление: 12.12.2018 - 18:00