Preview

Труды Института системного программирования РАН

Расширенный поиск

Инструменты анализа и разработки эффективного кода для параллельных архитектур

https://doi.org/10.15514/ISPRAS-2014-26(1)-14

Полный текст:

Аннотация

В работе предлагаются методы поддержки разработки эффективных программ для современных параллельных архитектур, включая гибридные. Описываются специализированные методы профилирования, предназначенные для программиста, занимающегося распараллеливанием существующего кода, либо для поиска неэффективного использования кеша в многопоточных программах. Рассматривается задача автоматической генерации параллельного кода для гибридных архитектур. В задачах, где для повышения производительности на гибридных архитектурах необходима существенная переработка структур данных или алгоритмов, может использоваться автотюнинг для специализации под конкретную задачу и аппаратуру во время выполнения. Показана оптимизация умножения разреженных матриц на GPU и ее применение для ускорения расчётов в пакете OpenFOAM.

Об авторах

Александр Монаков
ИСП РАН
Россия


Владимир Платонов
ИСП РАН
Россия


Арутюн Аветисян
ИСП РАН
Россия


Евгений Велесевич
ИСП РАН
Россия


Список литературы

1. NVIDIA. CUDA Programming Guide. http://docs.nvidia.com/cuda/cuda-c-programming-guide

2. Khronos Group. OpenCL. http://www.khronos.org/opencl/ Coccinelle: A Program Matching and Transformation Tool for Systems Code. http://coccinelle.lip6.fr/

3. E. Berg, H. Zeffer, E. Hagersten. A Statistical Multiprocessor Cache Model. In Proceedings of the 2006 IEEE International Symposium on Performance Analysis of System and Software, Austin, Texas, USA, March 2006.

4. А. Белеванцев, А. Кравец, А. Монаков. Автоматическая генерация OpenCL-кода из гнезд циклов с помощью полиэдральной модели. Труды Института системного программирования РАН, том 21, стр. 5-22. Москва, 2011

5. A. Kravets, A. Monakov, A. Belevantsev: GRAPHITE-OpenCL: Generate OpenCL Code from Parallel Loops. In Proceedings of the GCC Developers' Summit: 9-18, Ottawa, October 2010

6. A. Monakov, A. Lokhmotov, A. Avetisyan: Automatically Tuning Sparse Matrix-Vector Multiplication for GPU Architectures. In HiPEAC 2010: 111-125, Italy, January 2010

7. A. Monakov, A. Avetisyan: Specialized Sparse Matrix Formats and SpMV Kernel Tuning for GPUs. In GPU Technology Conference 2012, USA, May 2012

8. A. Monakov, V. Platonov: Accelerating OpenFOAM with Parallel GPU Linear Solver. In 8th OpenFOAM Workshop, South Korea, June 2013

9. А. Монаков. Оптимизация расчётов в пакете OpenFOAM на GPU. Труды Института системного программирования РАН, том 22, Стр. 223-232. Москва, 2012


Для цитирования:


Монаков А., Платонов В., Аветисян А., Велесевич Е. Инструменты анализа и разработки эффективного кода для параллельных архитектур. Труды Института системного программирования РАН. 2014;26(1):357-374. https://doi.org/10.15514/ISPRAS-2014-26(1)-14

For citation:


Monakov A., Velesevich E., Platonov V., Avetisyan A. Analysis and development tools for efficient programs on parallel architectures. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2014;26(1):357-374. (In Russ.) https://doi.org/10.15514/ISPRAS-2014-26(1)-14

Просмотров: 59


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)