Optimize `merge_sort` algorithm for largest data sizes #1977

SergeyKopienko · 2024-12-19T09:06:23Z

In this PR we extends the approach from #1933 to merge_sort algorithm.

…introduce new function __find_start_point_in Signed-off-by: Sergey Kopienko <[email protected]>

…introduce __parallel_merge_submitter_large for merge of biggest data sizes Signed-off-by: Sergey Kopienko <[email protected]>

…using __parallel_merge_submitter_large for merge data equal or greater then 4M items Signed-off-by: Sergey Kopienko <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

…fix compile error Signed-off-by: Sergey Kopienko <[email protected]>

…fix Kernel names Signed-off-by: Sergey Kopienko <[email protected]>

…rename template parameter names in __parallel_merge_submitter Signed-off-by: Sergey Kopienko <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

…fix review comment Signed-off-by: Sergey Kopienko <[email protected]>

…introduce __starting_size_limit_for_large_submitter into __parallel_merge Signed-off-by: Sergey Kopienko <[email protected]>

…renames Signed-off-by: Sergey Kopienko <[email protected]>

…introduce _split_point_t type Signed-off-by: Sergey Kopienko <[email protected]>

…remove usages of std::make_pair Signed-off-by: Sergey Kopienko <[email protected]>

…optimize evaluation of split-points on base diagonals Signed-off-by: Sergey Kopienko <[email protected]>

…renames Signed-off-by: Sergey Kopienko <[email protected]>

…extract eval_split_points_for_groups function Signed-off-by: Sergey Kopienko <[email protected]>

…extract run_parallel_merge function Signed-off-by: Sergey Kopienko <[email protected]>

…using SLM bank size to define chunk in the eval_nd_range_params function Signed-off-by: Sergey Kopienko <[email protected]>

…using SLM bank size to define chunk in the eval_nd_range_params function (16) Signed-off-by: Sergey Kopienko <[email protected]>

…restore old implementation of __find_start_point Signed-off-by: Sergey Kopienko <[email protected]>

…rename: base_diag_part -> steps_between_two_base_diags Signed-off-by: Sergey Kopienko <[email protected]>

…fix review comment Signed-off-by: Sergey Kopienko <[email protected]>

…fix an error in __parallel_merge_submitter_large::eval_split_points_for_groups Signed-off-by: Sergey Kopienko <[email protected]>

…onals is too short Signed-off-by: Sergey Kopienko <[email protected]>

…erge_submitter_large` into one `__parallel_merge_submitter` (#1956)

…fix review comment: remove extra condition check from __find_start_point_in Signed-off-by: Sergey Kopienko <[email protected]>

…fix review comment: fix condition check in __find_start_point_in Signed-off-by: Sergey Kopienko <[email protected]>

…apply GitHUB clang format Signed-off-by: Sergey Kopienko <[email protected]>

…or the largest data sizes Signed-off-by: Sergey Kopienko <[email protected]>

….h -remove unused local variable Signed-off-by: Sergey Kopienko <[email protected]>

….h - rename __find_or_eval_sp to __lookup_sp Signed-off-by: Sergey Kopienko <[email protected]>

….h - fix an error in tests Signed-off-by: Sergey Kopienko <[email protected]>

…rge_sort.h - fix an error in tests" This reverts commit 7906635.

…nt earlier Signed-off-by: Sergey Kopienko <[email protected]>

….h - fix an error in tests Signed-off-by: Sergey Kopienko <[email protected]>

….h - refactoring of __merge_sort_global_submitter __lookup_sp Signed-off-by: Sergey Kopienko <[email protected]>

….h - refactoring of __merge_sort_global_submitter::eval_split_points_for_groups Signed-off-by: Sergey Kopienko <[email protected]>

… largest data sizes on GPU only Signed-off-by: Sergey Kopienko <[email protected]>

…nt earlier Signed-off-by: Sergey Kopienko <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

….h - additional explanations in the __merge_sort_global_submitter::__lookup_sp function Signed-off-by: Sergey Kopienko <[email protected]>

….h - fix capture modes in submit() calls Signed-off-by: Sergey Kopienko <[email protected]>

….h - fix self-review comment: refactoring of __temp_sp_storages creation in the __merge_sort_global_submitter::operator() Signed-off-by: Sergey Kopienko <[email protected]>

….h - remove extra static_cast in the __leaf_sorter::sort() Signed-off-by: Sergey Kopienko <[email protected]>

….h - fix self-review comment: refactoring of __temp_sp_storages creation in the __merge_sort_global_submitter::operator() Signed-off-by: Sergey Kopienko <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

….h - avoid if statement inside Kernel's code Signed-off-by: Sergey Kopienko <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

danhoeflinger · 2024-12-31T18:59:51Z