Использование неблокирующих методов синхронизации
Неблокирующие вызовы позволяют потокам незамедлительно возвращаться к работе после приема/передачи сообщения, что позволяет значительно сократить время простоя вычислительной мощности. Тип: Технические статьи |
|
03.04.2012
|
Учебный курс "Параллельные численные методы"
В курсе рассматриваются подходы к распараллеливанию некоторых известных численных алгоритмов с иллюстрацией применения как на модельных, так и на прикладных задачах. При выполнении работ активно используются инструменты пакета Intel Parallel Studio XE. Тип: Технические статьи |
|
24.02.2012
|
Исправляем дисбаланс нагрузки с помощью Intel® Parallel Amplifier
Одним из критических факторов, отрицательно влияющих на производительность многопоточных приложений, является дисбаланс нагрузки потоков. Его корректировка – важнейший элемент отладки. Тип: Технические статьи |
concurrency scheduling parallel amplifier threading scalability hotspot utilization vcsource_type_techarticle PPGuide vcsource_domain_embedded vcsource_type_casestudy |
10.01.2012
|
Написание первой параллельной программы с Intel Cilk+
Участвуя в конкурсе Acceler8, я столкнулся с проблемой распараллеливания. Начав изучение данного вопроса, я нашёл набор дополнительных инструментов для среды разработки Microsoft* Visual Studio и расширение для языка C++, Intel Cilk Plus. Тип: Технические статьи |
Intel Parallel Studio Cilk Plus Intel VTune Amplifier XE Acceler8 |
22.12.2011
|
Ищем подматрицу с максимальной суммой элементов? - Найдем и распараллелим!
В статье приводится алгоритм решения задачи поиска подматрицы с максимальной суммой элементов. Решение предоставлено в рамках конкурса Acceler8. Основная идея конкурса – получить минимальное время работы программы и хорошую масштабируемость. Тип: Технические статьи |
параллельное программирование конкурс Acceler8 алгоритм кадане |
09.12.2011
|
Шаблон проектирования Producer-Consumer
Шаблон проектирования Producer-Consumer - один из самых распостраненных шаблонов для параллельных и распределенных вычислений. Простая схема обеспечивает высокую надежность и эффективное управление ресурсами. Тип: Технические статьи |
|
08.12.2011
|
Поиск подматрицы с наибольшей суммой: прикладные задачи
В посте приводятся прикладные задачи, сводящиеся к нахождению подматрицы с наибольшей суммой элементов. Задача оптимизации приложения поиска "максимальной" подматрицы решалась в рамках конкурса Acceler8. Тип: Технические статьи |
конкурс Acceler8 матрицы |
30.11.2011
|
Моделирование большого количества игровых юнитов с системой избежания столкновений
Современная игровая индустрия не может позволить задействовать большое количество юнитов в играх-стратегиях из-за повышения издержек на их обработку. На примере Colony мы покажем, как минимизировать издержки с помощью многопоточной обработки на CPU. Тип: Технические статьи |
vcsource_type_techarticle vcsource_domain_graphics vcsource_techsample_colony vcsource_techsample_gamecoderesourcedisk vcsource_index vcsource_product_colony |
23.11.2011
|
Обзор алгоритмов поиска максимальной подматрицы
В этой статье рассмотрены наиболее известные и эффективные алгоритмы для решения задач поиска максимальной подматрицы. Тип: Технические статьи |
конкурс Acceler8 обзор алгоритмов время работы |
15.11.2011
|
Выбор примитивов синхронизации для минимизации издержек
Choosing Appropriate Synchronization Primitives to Minimize Overhead [Eng., PDF 237KB]
Аннотация
Когда потоки ожидают своей очереди в точке синхронизации, они не выполняют никакой полезной работы. К ... Тип: Технические статьи |
atomic operations synchronization threading Win32 threads system overhead mutual exclusion PPGuide |
04.11.2011
|
Use Synchronization Routines Provided by the Threading API Rather than Hand-Coded Synchronization
Очень часто при разработке приложения программист предпочитает самостоятельно дописывать некоторые средства синхронизации потоков. В данной статье описываются плюсы и минусы такого решения. Тип: Технические статьи |
Hyper-Threading OpenMP synchronization threading Pthreads Win32 threads spin-wait PPGuide |
04.11.2011
|
Устранение конфликта блокировок: размер критических секций
В данной статье рассматривается проблема определения размера критических секций и их влияние на общую производительность приложения. Тип: Технические статьи |
|
04.11.2011
|
Использование параллелизма в упорядоченных потоках данных
В данной статье рассказывается о некоторых сложностях параллельной обработки упорядоченных наборов данных. Тип: Технические статьи |
data parallelism I/O threading order dependence PPGuide |
04.11.2011
|
Баланс нагрузки и производительность в параллельном режиме
Баланс нагрузки - критичный фактор в повышении производительности приложения. Основная цель данной статьи - показать как можно минимизировать время простоя потоков. Тип: Технические статьи |
|
04.11.2011
|
Модификация циклов для повышения производительности параллельной обработки данных
Обычно в приложениях с параллельной обработкой данных основной объем вычислений приходится на циклы, поэтому оптимизация циклов оказывает непосредственное влияние на общую производительность приложения. Тип: Технические статьи |
|
04.11.2011
|
Оптимизация структур данных и моделей доступа к памяти для улучшения локальности данных
Мы постараемся минимизировать число «непопаданий» в кэш, посредством разработки алгоритмов и структур данных, использующих локальность данных. Тип: Технические статьи |
|
02.11.2011
|
Оптимизация приложений под архитектуру NUMA
Optimizing Applications for NUMA [Eng., PDF 225KB]
Аннотация
NUMA (Non-Uniform Memory Access) – это архитектура совместного доступа к памяти в многопроцессорных системах, в которой время доступа к уч ... Тип: Технические статьи |
NUMA PPGuide |
02.11.2011
|
Ответы на часто задаваемые вопросы по конкурсу Acceler8
Что нужно делать?
Всё написано на официальной странице конкурса.
Как получить доступ к многопроцессорной системе Intel® Manycore Testing Lab (MTL)?
Для получения доступа необходимо зарегистрироватьс ... Тип: Технические статьи |
FAQ конкурс MTL Acceler8 PBS |
31.10.2011
|
Свёртки в Intel® Cilk Plus
Допустим нам зачем-то нужно найти сумму элементов массива. Мы можем разбить массив на две части, просуммировать каждую часть отдельно и сложить результаты. При этом суммировать эти части можно параллел ... Тип: Технические статьи |
|
12.09.2011
|
Цикл лабораторных работ по программированию на многоядерных вычислительных системах
Цикл лабораторных работ по программированию на многоядерных вычислительных системах. Материал каждой лабораторной работы включает описание, постановку задачи, шаблоны и примеры, а так же краткие комментарии к лабораторной работе для преподавателей. Тип: Технические статьи |
|
10.08.2011
|
Как уменьшить вероятность ошибки на этапе написания кода. Заметка N2.
Это вторая статья о том, как можно избежать ряда ошибок еще на этапе написания кода. Тип: Технические статьи |
статический анализ |
22.04.2011
|
Особенности оптимизации вычислений в прикладных программах на языке С на примере оценивания опционов европейского типа
С.И. Бастраков, Р.В. Донченко, И.Б. Мееров, А.Н. Половинкин
Нижегородский государственный университет им. Н.И. Лобачевского
Статья опубликована в журнале "Научно-технический вестник Санкт-Петербургск ... Тип: Технические статьи |
|
11.02.2011
|
Intel® Parallel Composer – расширение для отладки параллельных программ
В статье будет сделан обзор нового инструмента для создания параллельных приложений Intel® Parallel Composer в части расширения отладчика параллельных программ, являющегося одной из компонент пакета продуктов Intel® Parallel Studio. Тип: Технические статьи |
Intel Parallel Composer |
30.01.2011
|
Intel® Parallel Amplifier – профилировщик многопоточных приложений
Обзор нового инструмента профилировки параллельных программ Intel® Parallel Amplifier, являющего частью пакета продуктов для разработки многопоточных приложений Intel® Parallel Studio. Тип: Технические статьи |
Intel Parallel Amplifier |
30.01.2011
|
Параллельный алгоритм моделирования цифровых устройств с неисправностями для многоядерных систем с общей памятью
Предлагается новый алгоритм параллельного моделирования цифровых схем с неисправностями для многоядерных рабочих станций Тип: Технические статьи |
parallel fault simulation digital circuits fault grouping and partitioning |
05.12.2010
|