Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

regression TPCC main 28.11-30.11 #12165

Open
naspirato opened this issue Dec 1, 2024 · 5 comments
Open

regression TPCC main 28.11-30.11 #12165

naspirato opened this issue Dec 1, 2024 · 5 comments
Assignees

Comments

@naspirato
Copy link
Collaborator

naspirato commented Dec 1, 2024

REGRESSION: 177150/201000: -11.9%

cluster_monitoring git_branch run_type run_start_datetime git_sha git_commit_timestamp warehouses tpmC efficiency newOrder90p
perf4 origin/main default_volatile_off 30.11.2024 17:28:36 d7f99d9 30.11.2024 14:26:50 16000 177150 86.1 3500
perf4 origin/main default_volatile_off 30.11.2024 10:46:04 c8c54d4 30.11.2024 06:13:12 16000 176471 85.77 3500
perf4 origin/main default 30.11.2024 06:10:03 be00795 29.11.2024 20:40:24 16000 176212 85.64 3750
perf4 origin/main default_volatile_off 01.12.2024 03:44:52 ddcb25a 28.11.2024 06:38:07 16000 203274 98.79 384
perf4 origin/main default_volatile_off 28.11.2024 07:56:33 ddcb25a 28.11.2024 06:38:07 16000 198969 96.7 1250

git log --graph --oneline --pretty=format:'%H - %ad %s %an' ddcb25a^..c8c54d4

@naspirato naspirato self-assigned this Dec 1, 2024
@naspirato
Copy link
Collaborator Author

naspirato commented Dec 1, 2024

perf 4 fed45b0 170000
perf 4 9b2bdb0 203234

cluster_monitoring git_branch run_type run_start_datetime git_sha git_commit_timestamp warehouses tpmC efficiency newOrder90p
perf4 origin/main default_volatile_off 01.12.2024 21:03:15 fed45b0 29.11.2024 10:09:36 16000 170299 82.77 5500
perf4 origin/main default_volatile_off 02.12.2024 05:03:32 9b2bdb0 28.11.2024 09:13:52 16000 203234 98.77 384

perf 4 d6d5488 170000
perf 4 10fc4f2 170000
perf 4 7827174 203 075
perf 4 776b371 203 271

@naspirato naspirato changed the title regression 28.11-30.11 regression TPCC main 28.11-30.11 Dec 2, 2024
@naspirato
Copy link
Collaborator Author

Регрессия началась в 10fc4f2

@naspirato
Copy link
Collaborator Author

дебаг от @eivanov89
Я бы сказал, что скорее всего сломалось вне DQ/YQL. Latency кверей не изменились. Но на дашборде Queries видно, что сильно ухудшились Total time и Client time (который вовсе не client, а почти полностью тоже server time). Даб чек серверных latency.

В "Client" у нас входит GRPC-слой, RPC-актор, пересылка в kqp proxy, походы в tx proxy и scheme cache. Собственно мы и видим жуткий delivery time и ещё чёткие полочки в UserPool на 7 и 8 ядер. При этом в плохой версии слева CurrentThreadCount как раз 7 и 8 потоков. Справа потоков больше.

Мне кажется, что проблема в районе AS: у нас в UserPool не хватает ресурсов и почему-то не накидываются потоки.

@naspirato перепроверь, пожалуйста, что точно проблема в коммите с импортом.

@kruall помоги, пожалуйста, с AS. Либо там рядом есть изменения AS, либо надо понять, почему она так себя стала вести после импорта библиотек.

@naspirato
Copy link
Collaborator Author

naspirato commented Dec 3, 2024

  1. в гитолог потерял следующие коммиты перед mergelib (визуально посчитал, что они относятся к другой ветке)
    10fc4f2 уже с проблемами 170000

7827174 без проблем 203 075
2) @kruall считает, что может быть виноват коммит 97c9f43
3) @kruall сделал реверт 1810b3a
4) @naspirato запустил тесты на реверт

@naspirato
Copy link
Collaborator Author

после реверта вернулось в норму
image
@kruall как разберешься что вызвало такое падение perf напиши, пожалуйста, можно ли было тестом это найти на более раннем этапе

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants