-
Notifications
You must be signed in to change notification settings - Fork 80
Горячева Ксения. Технология SEQ-MPI. Умножение плотных матриц. Элементы типа double. Алгоритм Штрассена. Вариант 3. #299
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
base: master
Are you sure you want to change the base?
Conversation
Codecov Report❌ Patch coverage is ❌ Your patch status has failed because the patch coverage (72.27%) is below the target coverage (95.00%). You can increase the patch coverage or adjust the target coverage. Additional details and impacted files@@ Coverage Diff @@
## master #299 +/- ##
===========================================
+ Coverage 15.18% 35.93% +20.74%
===========================================
Files 187 261 +74
Lines 7196 10104 +2908
Branches 2784 3906 +1122
===========================================
+ Hits 1093 3631 +2538
- Misses 6028 6230 +202
- Partials 75 243 +168 ☔ View full report in Codecov by Sentry. 🚀 New features to boost your workflow:
|
…-processes-informatics into goriacheva_k_strassen_algorithm
Описание
Разработаны последовательная и параллельная (MPI) реализации алгоритма Штрассена для умножения плотных квадратных матриц с элементами типа double.
Последовательная версия основана на рекурсивной реализации алгоритма Штрассена. Для матриц большого размера выполняется разбиение на подматрицы и вычисление семи вспомогательных произведений вместо восьми, что позволяет снизить асимптотическую вычислительную сложность по сравнению с классическим алгоритмом. При достижении порогового размера используется наивное умножение, так как оно имеет меньшие накладные расходы. Для обработки матриц произвольного размера применяется дополнение до ближайшей степени двойки с последующим обрезанием результата.
Параллельная реализация выполнена с использованием технологии MPI и использует параллелизм верхнего уровня алгоритма Штрассена. Семь независимых вспомогательных произведений распределяются между MPI-процессами, при этом каждый процесс вычисляет одну подзадачу локально. Сбор частичных результатов осуществляется на процессе с рангом 0 с использованием операций MPI_Send и MPI_Recv, после чего итоговая матрица рассылается всем процессам с помощью MPI_Bcast. Корректность реализации подтверждена набором функциональных тестов, а экспериментальное исследование показало, что наибольшая эффективность достигается при числе процессов, близком к количеству независимых подзадач алгоритма.
Чек-лист
<фамилия>_<первая_буква_имени>_<короткое_название_задачи>clang-formatлокально в моем форке (нет ошибок форматирования)clang-tidyлокально в моем форке (нет предупреждений/ошибок)nesterov_a_vector_sum), а не вmaster