Xeon Phi, архитектура Knights Corner и улучшение пройденного

Если делаешь что-то хорошо и с душой, оно обязательно сослужит тебе хорошую службу. Иногда сразу, иногда через годы. Но никогда, никогда хорошо сделанное не исчезает бесследно. Я могу привести десятки примеров из собственного опыта, когда статья сразу после публикации оставалась незамеченной, но через некоторое время находила читателя, да какого! Вот и у Intel (нет, нет, никаких параллелей с вашим покорным слугой) нашлось коммерческое применение проекту, который многие считали закрытым и заброшенным. Да какое!

Вчера на International Supercomputing Conference, проходящей в Гамбурге, рассказали о сопроцессорах Xeon Phi. Внешне они до боли напоминают графические ускорители с интерфейсом PCI-Express, и это, в общем, не удивительно. Ведь сопроцессоры ведут родословную от проекта по созданию графических решений с архитектурой x86. С таковыми по ряду причин не сложилось, но вот теперь, спустя несколько лет, идея нашла практическое воплощение.



О первой реализации будущих Xeon Phi я писал два года назад в своем посте на Хабре. Тогда они занимали целый системный блок. Теперь же технологии шагнули "немножко" вперед, и стало возможным уместить всё на плате расширения.

Так что же всё?

Речь идет о старых добрых ядрах P54C, использовавшихся во втором поколении процессоров Pentium. Тогда они работали на частоте от 75 до 200 МГц и изготавливались по технологии 0.6 мкм. Теперь же они стали 22-нанометровыми, заодно обзаведясь более мощными FPU. Еще в 2010-м году 48 P54C, сделанные по 45-нанометровой технологии, вместе с четырьмя контроллерами памяти и 24 специальными маршрутизаторами (роутерами) занимали примерно такую площадь, как оригинальный P54 с его единственным ядром. Теперь, надо думать, места требуется гораздо меньше, а энергопотребление дополнительно сократилось (в 2010 системе под максимальной нагрузкой хватало 125 Вт). Сколько ядер в новых Xeon Phi точно неизвестно, а сама Intel указывает просто «50+». Также известно о 8 гигабайтах набортной памяти типа GDDR5. Вы спросите – какую производительность обеспечивает один такой сопроцессор? Отвечаю: ТЕРАФЛОПС с двойной точностью (FP64). Не поленитесь, сравните – сколько предлагают соседи по бизнесу при сравнимых габаритах и энергопотреблении…

Подобный сопроцессор при возникновении необходимости в высокопроизводительных параллельных вычислениях может быть установлен практически в любой компьютер, хоть в домашний. О более профессиональном применении и говорить не приходится. Сопроцессор работает под собственной Linux-образной операционной системой, а при установке в систему потребуются специальные драйверы.

Интересно, что подобные сопроцессоры или, если называть вещи своими именами, сокомпьютеры существуют довольно давно. Так, на Computex 2012 я видел несколько материнских плат с интерфейсом PCI Express, куда тоже можно было установить Intel Core 2 или 3 поколения, после чего использовать его для различных вычислений и нужд виртуализации. Но Xeon Phi, конечно, решение более цельное и заточено точнее.

Более детально о Xeon Phi и архитектуре Knights Corner можно почитать в англоязычной версии Intel Software Network.

P.S. Кстати, а где, по вашему мнению, Xeon Phi может быть более всего востребован? Именно по вашему, потому что версию Intel мы и так знаем :)
Einzelheiten zur Compiler-Optimierung finden Sie in unserem Optimierungshinweis.