Skip to content

Conversation

@4elodoy-Molovek
Copy link
Contributor

Описание

Sequential (SEQ)

Последовательная версия умножения разреженных матриц выполняется в одном процессе и не использует межпроцессное взаимодействие. Обе входные матрицы полностью находятся в одном адресном пространстве и хранятся в столбцовом формате CCS (Compressed Column Storage).

Алгоритм последовательно обходит столбцы второй матрицы, извлекает ненулевые элементы и выполняет умножение на соответствующие столбцы первой матрицы. Результаты аккумулируются в выходной структуре, также представленной в формате CCS, при этом нулевые элементы не сохраняются.

SEQ-реализация служит базовым вариантом для проверки корректности и используется для сравнения производительности с параллельной MPI-версией.

Parallel (MPI)

Параллельная версия умножения разреженных матриц реализована с использованием MPI и основана на распараллеливании по столбцам, что естественным образом соответствует формату хранения CCS.

В начале работы столбцы второй матрицы распределяются между процессами. Каждый процесс независимо выполняет умножение выделенной ему части столбцов на первую матрицу и формирует локальный фрагмент результирующей матрицы в формате CCS. Межпроцессные вычисления отсутствуют, так как каждый столбец результата может быть вычислен независимо.

После завершения локальных вычислений частичные результаты передаются корневому процессу и объединяются в итоговую матрицу. Такой подход обеспечивает корректность вычислений и позволяет использовать параллелизм, однако эффективность зависит от плотности матриц и соотношения вычислений и накладных расходов на коммуникации.


Чек-лист

  • Статус CI: Все CI-задачи (сборка, тесты, генерация отчёта) успешно проходят на моей ветке в моем форке
  • Директория и именование задачи: Я создал директорию с именем <фамилия>_<первая_буква_имени>_<короткое_название_задачи>
  • Полное описание задачи: Я предоставил полное описание задачи в теле pull request
  • clang-format: Мои изменения успешно проходят clang-format локально в моем форке (нет ошибок форматирования)
  • clang-tidy: Мои изменения успешно проходят clang-tidy локально в моем форке (нет предупреждений/ошибок)
  • Функциональные тесты: Все функциональные тесты успешно проходят локально на моей машине
  • Тесты производительности: Все тесты производительности успешно проходят локально на моей машине
  • Ветка: Я работаю в ветке, названной точно так же, как директория моей задачи (например, nesterov_a_vector_sum), а не в master
  • Правдивое содержание: Я подтверждаю, что все сведения, указанные в этом pull request, являются точными и достоверными

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant