Инструменты анализа и разработки эффективного кода для параллельных архитектур

Александр Монаков; Владимир Платонов; Арутюн Аветисян; Евгений Велесевич

doi:10.15514/ISPRAS-2014-26(1)-14

Инструменты анализа и разработки эффективного кода для параллельных архитектур

Александр Монаков, Владимир Платонов, Арутюн Аветисян, Евгений Велесевич

https://doi.org/10.15514/ISPRAS-2014-26(1)-14

Полный текст:

PDF (Rus)

сгенерировать QR код

Аннотация

В работе предлагаются методы поддержки разработки эффективных программ для современных параллельных архитектур, включая гибридные. Описываются специализированные методы профилирования, предназначенные для программиста, занимающегося распараллеливанием существующего кода, либо для поиска неэффективного использования кеша в многопоточных программах. Рассматривается задача автоматической генерации параллельного кода для гибридных архитектур. В задачах, где для повышения производительности на гибридных архитектурах необходима существенная переработка структур данных или алгоритмов, может использоваться автотюнинг для специализации под конкретную задачу и аппаратуру во время выполнения. Показана оптимизация умножения разреженных матриц на GPU и ее применение для ускорения расчётов в пакете OpenFOAM.

Ключевые слова

оптимизация программ, профилирование, OpenCL, CUDA, разреженные матрицы, OpenFOAM

Об авторах

Александр Монаков

ИСП РАН
Россия

Владимир Платонов

ИСП РАН
Россия

Арутюн Аветисян

ИСП РАН
Россия

Евгений Велесевич

ИСП РАН
Россия

Список литературы

1. NVIDIA. CUDA Programming Guide. http://docs.nvidia.com/cuda/cuda-c-programming-guide

2. Khronos Group. OpenCL. http://www.khronos.org/opencl/ Coccinelle: A Program Matching and Transformation Tool for Systems Code. http://coccinelle.lip6.fr/

3. E. Berg, H. Zeffer, E. Hagersten. A Statistical Multiprocessor Cache Model. In Proceedings of the 2006 IEEE International Symposium on Performance Analysis of System and Software, Austin, Texas, USA, March 2006.

4. А. Белеванцев, А. Кравец, А. Монаков. Автоматическая генерация OpenCL-кода из гнезд циклов с помощью полиэдральной модели. Труды Института системного программирования РАН, том 21, стр. 5-22. Москва, 2011

5. A. Kravets, A. Monakov, A. Belevantsev: GRAPHITE-OpenCL: Generate OpenCL Code from Parallel Loops. In Proceedings of the GCC Developers' Summit: 9-18, Ottawa, October 2010

6. A. Monakov, A. Lokhmotov, A. Avetisyan: Automatically Tuning Sparse Matrix-Vector Multiplication for GPU Architectures. In HiPEAC 2010: 111-125, Italy, January 2010

7. A. Monakov, A. Avetisyan: Specialized Sparse Matrix Formats and SpMV Kernel Tuning for GPUs. In GPU Technology Conference 2012, USA, May 2012

8. A. Monakov, V. Platonov: Accelerating OpenFOAM with Parallel GPU Linear Solver. In 8th OpenFOAM Workshop, South Korea, June 2013

9. А. Монаков. Оптимизация расчётов в пакете OpenFOAM на GPU. Труды Института системного программирования РАН, том 22, Стр. 223-232. Москва, 2012

Рецензия

Для цитирования:

Монаков А., Платонов В., Аветисян А., Велесевич Е. Инструменты анализа и разработки эффективного кода для параллельных архитектур. Труды Института системного программирования РАН. 2014;26(1):357-374. https://doi.org/10.15514/ISPRAS-2014-26(1)-14

For citation:

Monakov A., Velesevich E., Platonov V., Avetisyan A. Analysis and development tools for efficient programs on parallel architectures. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2014;26(1):357-374. (In Russ.) https://doi.org/10.15514/ISPRAS-2014-26(1)-14

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Труды Института системного программирования РАН

Инструменты анализа и разработки эффективного кода для параллельных архитектур

Полный текст:

Аннотация

Ключевые слова

Об авторах

Список литературы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов