-
Notifications
You must be signed in to change notification settings - Fork 80
Николаев Денис. Технология SEQ-MPI. Умножение разреженных матриц. Элементы типа double. Формат хранения матрицы – строковый (CRS). Вариант 4 #288
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
base: master
Are you sure you want to change the base?
Conversation
Codecov Report❌ Patch coverage is Additional details and impacted files@@ Coverage Diff @@
## master #288 +/- ##
==========================================
+ Coverage 15.18% 19.72% +4.53%
==========================================
Files 187 190 +3
Lines 7196 7616 +420
Branches 2784 2918 +134
==========================================
+ Hits 1093 1502 +409
- Misses 6028 6030 +2
- Partials 75 84 +9 ☔ View full report in Codecov by Sentry. 🚀 New features to boost your workflow:
|
| Выход: сумма всех ненулевых элементов результирующей матрицы | ||
|
|
||
| ## 3. Базовый алгоритм (последовательный) | ||
|
|
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
There is no description on base algorithm
| Ускорение = T_seq / T_parallel \ | ||
| Эффективность = Ускорение / Количество процессов * 100% | ||
|
|
||
| #### Измерения "чистого" времени вычислений максимальных элементов по строкам матрицы - task_run |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
We don't count max elements here
Описание
Реализация: SEQ и MPI алгоритмы умножения разреженных матриц в формате CRS. MPI версия распределяет строки матрицы A по процессам, рассылает матрицу B всем процессам, выполняет параллельное умножение и собирает результаты.
Отчёт: Анализ производительности, сравнение SEQ и MPI версий, выявление узких мест (коммуникационные затраты), оценка оптимального числа процессов и общие выводы.
Чек-лист
<фамилия>_<первая_буква_имени>_<короткое_название_задачи>clang-formatлокально в моем форке (нет ошибок форматирования)clang-tidyлокально в моем форке (нет предупреждений/ошибок)nesterov_a_vector_sum), а не вmaster