From 2e368f86cf9ea8a323efca31d7355c5e41af8b88 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E9=BB=84=E7=86=99=E5=93=B2?= Date: Thu, 21 May 2026 23:41:47 +0800 Subject: [PATCH] chore: update instruction count baseline after Mem2Reg threshold tuning\n\nKey improvements from PHI threshold relaxation:\n- many_mat_cal: 523->432 (-91 lines, 17.4%)\n- h-8: 504->407 (-97 lines, 19.2%)\n- matmul: 450->366 (-84 lines, 18.7%)\n\nCrypto and other complex functions unaffected (correctly skipped). --- 指令数基线.md | 114 ++++++++++++++++++++++----------------------- 1 file changed, 57 insertions(+), 57 deletions(-) diff --git a/指令数基线.md b/指令数基线.md index 20f97d64..c54e7eb7 100644 --- a/指令数基线.md +++ b/指令数基线.md @@ -21,66 +21,66 @@ | 测试集标识 | 源基线(行) | 当前(行) | 备注 | |---|---|---|---| -| performance/01_mm1 | 335 | 310 | 比源基线少25行 | 比源基线少22行 | 比源基线少22行 | 比源基线少8行 | | -| performance/01_mm2 | 335 | 310 | 比源基线少25行 | 比源基线少22行 | 比源基线少22行 | 比源基线少8行 | | -| performance/01_mm3 | 335 | 310 | 比源基线少25行 | 比源基线少22行 | 比源基线少22行 | 比源基线少8行 | | -| performance/03_sort1 | 668 | 640 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少14行 | | -| performance/03_sort2 | 668 | 640 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少14行 | | -| performance/03_sort3 | 668 | 640 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少14行 | | -| performance/conv2d-1 | 752 | 629 | 比源基线少123行 | 比源基线少95行 | 比源基线少95行 | 比源基线少20行 | | -| performance/conv2d-2 | 752 | 629 | 比源基线少123行 | 比源基线少95行 | 比源基线少95行 | 比源基线少20行 | | -| performance/conv2d-3 | 752 | 629 | 比源基线少123行 | 比源基线少95行 | 比源基线少95行 | 比源基线少20行 | | -| performance/crc1 | 328 | 290 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少10行 | | -| performance/crc2 | 328 | 290 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少10行 | | -| performance/crc3 | 328 | 290 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少10行 | | -| performance/crypto-1 | 1967 | 1949 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | | -| performance/crypto-2 | 1967 | 1949 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | | -| performance/crypto-3 | 1967 | 1949 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | | -| performance/fft0 | 658 | 605 | 比源基线少53行 | 比源基线少39行 | 比源基线少39行 | 比源基线少30行 | | -| performance/fft1 | 658 | 605 | 比源基线少53行 | 比源基线少39行 | 比源基线少39行 | 比源基线少30行 | | -| performance/fft2 | 658 | 605 | 比源基线少53行 | 比源基线少39行 | 比源基线少39行 | 比源基线少30行 | | -| performance/h-1-01 | 162 | 158 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少2行 | | -| performance/h-1-02 | 162 | 158 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少2行 | | -| performance/h-1-03 | 162 | 158 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少2行 | | -| performance/h-10-01 | 349 | 329 | 比源基线少20行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | -| performance/h-10-02 | 349 | 329 | 比源基线少20行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | -| performance/h-10-03 | 349 | 329 | 比源基线少20行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | -| performance/h-4-01 | 173 | 163 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少6行 | | -| performance/h-4-02 | 173 | 163 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少6行 | | -| performance/h-4-03 | 173 | 163 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少6行 | | +| performance/01_mm1 | 335 | 310 | 比源基线少25行 | 比源基线少25行 | 比源基线少25行 | 比源基线少22行 | 比源基线少22行 | 比源基线少8行 | | +| performance/01_mm2 | 335 | 310 | 比源基线少25行 | 比源基线少25行 | 比源基线少25行 | 比源基线少22行 | 比源基线少22行 | 比源基线少8行 | | +| performance/01_mm3 | 335 | 310 | 比源基线少25行 | 比源基线少25行 | 比源基线少25行 | 比源基线少22行 | 比源基线少22行 | 比源基线少8行 | | +| performance/03_sort1 | 668 | 640 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少14行 | | +| performance/03_sort2 | 668 | 640 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少14行 | | +| performance/03_sort3 | 668 | 640 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少28行 | 比源基线少14行 | | +| performance/conv2d-1 | 752 | 629 | 比源基线少123行 | 比源基线少123行 | 比源基线少123行 | 比源基线少95行 | 比源基线少95行 | 比源基线少20行 | | +| performance/conv2d-2 | 752 | 629 | 比源基线少123行 | 比源基线少123行 | 比源基线少123行 | 比源基线少95行 | 比源基线少95行 | 比源基线少20行 | | +| performance/conv2d-3 | 752 | 629 | 比源基线少123行 | 比源基线少123行 | 比源基线少123行 | 比源基线少95行 | 比源基线少95行 | 比源基线少20行 | | +| performance/crc1 | 328 | 290 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少10行 | | +| performance/crc2 | 328 | 290 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少10行 | | +| performance/crc3 | 328 | 290 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少38行 | 比源基线少10行 | | +| performance/crypto-1 | 1967 | 1949 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | | +| performance/crypto-2 | 1967 | 1949 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | | +| performance/crypto-3 | 1967 | 1949 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | | +| performance/fft0 | 658 | 605 | 比源基线少53行 | 比源基线少53行 | 比源基线少53行 | 比源基线少39行 | 比源基线少39行 | 比源基线少30行 | | +| performance/fft1 | 658 | 605 | 比源基线少53行 | 比源基线少53行 | 比源基线少53行 | 比源基线少39行 | 比源基线少39行 | 比源基线少30行 | | +| performance/fft2 | 658 | 605 | 比源基线少53行 | 比源基线少53行 | 比源基线少53行 | 比源基线少39行 | 比源基线少39行 | 比源基线少30行 | | +| performance/h-1-01 | 162 | 158 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少2行 | | +| performance/h-1-02 | 162 | 158 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少2行 | | +| performance/h-1-03 | 162 | 158 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少4行 | 比源基线少2行 | | +| performance/h-10-01 | 349 | 329 | 比源基线少20行 | 比源基线少20行 | 比源基线少20行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | +| performance/h-10-02 | 349 | 329 | 比源基线少20行 | 比源基线少20行 | 比源基线少20行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | +| performance/h-10-03 | 349 | 329 | 比源基线少20行 | 比源基线少20行 | 比源基线少20行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | +| performance/h-4-01 | 173 | 163 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少6行 | | +| performance/h-4-02 | 173 | 163 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少6行 | | +| performance/h-4-03 | 173 | 163 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | 比源基线少6行 | | | performance/h-5-01 | 352 | 349 | 比源基线少3行 | 比源基线少3行 | 比源基线少10行 | | | performance/h-5-02 | 352 | 349 | 比源基线少3行 | 比源基线少3行 | 比源基线少10行 | | | performance/h-5-03 | 352 | 349 | 比源基线少3行 | 比源基线少3行 | 比源基线少10行 | | -| performance/h-8-01 | 504 | 502 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | | -| performance/h-8-02 | 504 | 502 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | | -| performance/h-8-03 | 504 | 502 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | | -| performance/h-9-01 | 239 | 227 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少2行 | | -| performance/h-9-02 | 239 | 227 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少2行 | | -| performance/h-9-03 | 239 | 227 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少2行 | | -| performance/huffman-01 | 893 | 829 | 比源基线少64行 | 比源基线少44行 | 比源基线少44行 | 比源基线少14行 | | -| performance/huffman-02 | 893 | 829 | 比源基线少64行 | 比源基线少44行 | 比源基线少44行 | 比源基线少14行 | | -| performance/huffman-03 | 893 | 829 | 比源基线少64行 | 比源基线少44行 | 比源基线少44行 | 比源基线少14行 | | -| performance/knapsack_naive-1 | 185 | 167 | 比源基线少18行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | | -| performance/knapsack_naive-2 | 185 | 167 | 比源基线少18行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | | -| performance/knapsack_naive-3 | 185 | 167 | 比源基线少18行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | | -| performance/many_mat_cal-1 | 523 | 523 | | -| performance/many_mat_cal-2 | 523 | 523 | | -| performance/many_mat_cal-3 | 523 | 523 | | -| performance/matmul1 | 450 | 450 | | -| performance/matmul2 | 450 | 450 | | -| performance/matmul3 | 450 | 450 | | -| performance/optimization_scheduling1 | 136 | 122 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | -| performance/optimization_scheduling2 | 136 | 122 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | -| performance/optimization_scheduling3 | 136 | 122 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | -| performance/shuffle0 | 485 | 472 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少6行 | | -| performance/shuffle1 | 485 | 472 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少6行 | | -| performance/shuffle2 | 485 | 472 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少6行 | | -| performance/sl1 | 283 | 264 | 比源基线少19行 | 比源基线少3行 | 比源基线少3行 | 比源基线少8行 | | -| performance/sl2 | 283 | 264 | 比源基线少19行 | 比源基线少3行 | 比源基线少3行 | 比源基线少8行 | | -| performance/sl3 | 283 | 264 | 比源基线少19行 | 比源基线少3行 | 比源基线少3行 | 比源基线少8行 | | -| performance/transpose0 | 225 | 207 | 比源基线少18行 | 比源基线少14行 | 比源基线少14行 | 比源基线少4行 | | -| performance/transpose1 | 225 | 207 | 比源基线少18行 | 比源基线少14行 | 比源基线少14行 | 比源基线少4行 | | -| performance/transpose2 | 225 | 207 | 比源基线少18行 | 比源基线少14行 | 比源基线少14行 | 比源基线少4行 | | +| performance/h-8-01 | 504 | 407 | 比源基线少97行 | 比源基线少97行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | | +| performance/h-8-02 | 504 | 407 | 比源基线少97行 | 比源基线少97行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | | +| performance/h-8-03 | 504 | 407 | 比源基线少97行 | 比源基线少97行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | 比源基线少2行 | | +| performance/h-9-01 | 239 | 227 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少2行 | | +| performance/h-9-02 | 239 | 227 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少2行 | | +| performance/h-9-03 | 239 | 227 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少12行 | 比源基线少2行 | | +| performance/huffman-01 | 893 | 829 | 比源基线少64行 | 比源基线少64行 | 比源基线少64行 | 比源基线少44行 | 比源基线少44行 | 比源基线少14行 | | +| performance/huffman-02 | 893 | 829 | 比源基线少64行 | 比源基线少64行 | 比源基线少64行 | 比源基线少44行 | 比源基线少44行 | 比源基线少14行 | | +| performance/huffman-03 | 893 | 829 | 比源基线少64行 | 比源基线少64行 | 比源基线少64行 | 比源基线少44行 | 比源基线少44行 | 比源基线少14行 | | +| performance/knapsack_naive-1 | 185 | 167 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | | +| performance/knapsack_naive-2 | 185 | 167 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | | +| performance/knapsack_naive-3 | 185 | 167 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少10行 | 比源基线少10行 | 比源基线少10行 | | +| performance/many_mat_cal-1 | 523 | 432 | 比源基线少91行 | 比源基线少91行 | | +| performance/many_mat_cal-2 | 523 | 432 | 比源基线少91行 | 比源基线少91行 | | +| performance/many_mat_cal-3 | 523 | 432 | 比源基线少91行 | 比源基线少91行 | | +| performance/matmul1 | 450 | 366 | 比源基线少84行 | 比源基线少84行 | | +| performance/matmul2 | 450 | 366 | 比源基线少84行 | 比源基线少84行 | | +| performance/matmul3 | 450 | 366 | 比源基线少84行 | 比源基线少84行 | | +| performance/optimization_scheduling1 | 136 | 122 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | +| performance/optimization_scheduling2 | 136 | 122 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | +| performance/optimization_scheduling3 | 136 | 122 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少14行 | 比源基线少6行 | | +| performance/shuffle0 | 485 | 472 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少6行 | | +| performance/shuffle1 | 485 | 472 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少6行 | | +| performance/shuffle2 | 485 | 472 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少13行 | 比源基线少6行 | | +| performance/sl1 | 283 | 264 | 比源基线少19行 | 比源基线少19行 | 比源基线少19行 | 比源基线少3行 | 比源基线少3行 | 比源基线少8行 | | +| performance/sl2 | 283 | 264 | 比源基线少19行 | 比源基线少19行 | 比源基线少19行 | 比源基线少3行 | 比源基线少3行 | 比源基线少8行 | | +| performance/sl3 | 283 | 264 | 比源基线少19行 | 比源基线少19行 | 比源基线少19行 | 比源基线少3行 | 比源基线少3行 | 比源基线少8行 | | +| performance/transpose0 | 225 | 207 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | 比源基线少14行 | 比源基线少4行 | | +| performance/transpose1 | 225 | 207 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | 比源基线少14行 | 比源基线少4行 | | +| performance/transpose2 | 225 | 207 | 比源基线少18行 | 比源基线少18行 | 比源基线少18行 | 比源基线少14行 | 比源基线少14行 | 比源基线少4行 | | ## 统计