chore: update instruction count baseline after Module D rewrite\n\n54/60 performance tests reduced. Key improvements:\n- conv2d: -95 lines (12.6%)\n- huffman: -44 lines (4.9%)\n- fft: -39 lines (5.9%)\n- crc: -38 lines (11.6%)\n- 03_sort: -28 lines (4.2%)\n- 01_mm: -22 lines (6.6%)\n\nAlso fix count_asm.sh sed to match any current value.

master
黄熙哲 1 week ago
parent 570253f1f2
commit bef03ec220

@ -39,8 +39,8 @@ for t in "${TESTS[@]}"; do
if [[ "$lines" -lt "$baseline" ]]; then
diff=$((baseline - lines))
echo "performance/${t}: ${lines} (基线:${baseline} 减少${diff}行) ← 更新基线"
# 更新基线文件中的"当前"列
sed -i "s/| performance\/${t} | ${baseline} | ${baseline} |/| performance\/${t} | ${baseline} | ${lines} | 比源基线少${diff}行 |/" "$BASELINE_FILE"
# 更新基线文件中的"当前"列(匹配任意当前值)
sed -i "s/| performance\/${t} | ${baseline} | [0-9]* |/| performance\/${t} | ${baseline} | ${lines} | 比源基线少${diff}行 |/" "$BASELINE_FILE"
UPDATED=$((UPDATED + 1))
elif [[ "$lines" -gt "$baseline" ]]; then
diff=$((lines - baseline))

@ -21,66 +21,66 @@
| 测试集标识 | 源基线(行) | 当前(行) | 备注 |
|---|---|---|---|
| performance/01_mm1 | 335 | 327 | 比源基线少8行 | |
| performance/01_mm2 | 335 | 327 | 比源基线少8行 | |
| performance/01_mm3 | 335 | 327 | 比源基线少8行 | |
| performance/03_sort1 | 668 | 654 | 比源基线少14行 | |
| performance/03_sort2 | 668 | 654 | 比源基线少14行 | |
| performance/03_sort3 | 668 | 654 | 比源基线少14行 | |
| performance/conv2d-1 | 752 | 732 | 比源基线少20行 | |
| performance/conv2d-2 | 752 | 732 | 比源基线少20行 | |
| performance/conv2d-3 | 752 | 732 | 比源基线少20行 | |
| performance/crc1 | 328 | 318 | 比源基线少10行 | |
| performance/crc2 | 328 | 318 | 比源基线少10行 | |
| performance/crc3 | 328 | 318 | 比源基线少10行 | |
| performance/crypto-1 | 1967 | 1953 | 比源基线少14行 | |
| performance/crypto-2 | 1967 | 1953 | 比源基线少14行 | |
| performance/crypto-3 | 1967 | 1953 | 比源基线少14行 | |
| performance/fft0 | 658 | 628 | 比源基线少30行 | |
| performance/fft1 | 658 | 628 | 比源基线少30行 | |
| performance/fft2 | 658 | 628 | 比源基线少30行 | |
| performance/h-1-01 | 162 | 160 | 比源基线少2行 | |
| performance/h-1-02 | 162 | 160 | 比源基线少2行 | |
| performance/h-1-03 | 162 | 160 | 比源基线少2行 | |
| performance/h-10-01 | 349 | 343 | 比源基线少6行 | |
| performance/h-10-02 | 349 | 343 | 比源基线少6行 | |
| performance/h-10-03 | 349 | 343 | 比源基线少6行 | |
| performance/h-4-01 | 173 | 167 | 比源基线少6行 | |
| performance/h-4-02 | 173 | 167 | 比源基线少6行 | |
| performance/h-4-03 | 173 | 167 | 比源基线少6行 | |
| performance/h-5-01 | 352 | 342 | 比源基线少10行 | |
| performance/h-5-02 | 352 | 342 | 比源基线少10行 | |
| performance/h-5-03 | 352 | 342 | 比源基线少10行 | |
| performance/h-8-01 | 504 | 502 | 比源基线少2行 | |
| performance/h-8-02 | 504 | 502 | 比源基线少2行 | |
| performance/h-8-03 | 504 | 502 | 比源基线少2行 | |
| performance/h-9-01 | 239 | 237 | 比源基线少2行 | |
| performance/h-9-02 | 239 | 237 | 比源基线少2行 | |
| performance/h-9-03 | 239 | 237 | 比源基线少2行 | |
| performance/huffman-01 | 893 | 879 | 比源基线少14行 | |
| performance/huffman-02 | 893 | 879 | 比源基线少14行 | |
| performance/huffman-03 | 893 | 879 | 比源基线少14行 | |
| performance/knapsack_naive-1 | 185 | 175 | 比源基线少10行 | |
| performance/knapsack_naive-2 | 185 | 175 | 比源基线少10行 | |
| performance/knapsack_naive-3 | 185 | 175 | 比源基线少10行 | |
| performance/01_mm1 | 335 | 313 | 比源基线少22行 | 比源基线少8行 | |
| performance/01_mm2 | 335 | 313 | 比源基线少22行 | 比源基线少8行 | |
| performance/01_mm3 | 335 | 313 | 比源基线少22行 | 比源基线少8行 | |
| performance/03_sort1 | 668 | 640 | 比源基线少28行 | 比源基线少14行 | |
| performance/03_sort2 | 668 | 640 | 比源基线少28行 | 比源基线少14行 | |
| performance/03_sort3 | 668 | 640 | 比源基线少28行 | 比源基线少14行 | |
| performance/conv2d-1 | 752 | 657 | 比源基线少95行 | 比源基线少20行 | |
| performance/conv2d-2 | 752 | 657 | 比源基线少95行 | 比源基线少20行 | |
| performance/conv2d-3 | 752 | 657 | 比源基线少95行 | 比源基线少20行 | |
| performance/crc1 | 328 | 290 | 比源基线少38 | 比源基线少10行 | |
| performance/crc2 | 328 | 290 | 比源基线少38 | 比源基线少10行 | |
| performance/crc3 | 328 | 290 | 比源基线少38 | 比源基线少10行 | |
| performance/crypto-1 | 1967 | 1949 | 比源基线少18行 | 比源基线少14行 | |
| performance/crypto-2 | 1967 | 1949 | 比源基线少18行 | 比源基线少14行 | |
| performance/crypto-3 | 1967 | 1949 | 比源基线少18行 | 比源基线少14行 | |
| performance/fft0 | 658 | 619 | 比源基线少39行 | 比源基线少30行 | |
| performance/fft1 | 658 | 619 | 比源基线少39行 | 比源基线少30行 | |
| performance/fft2 | 658 | 619 | 比源基线少39行 | 比源基线少30行 | |
| performance/h-1-01 | 162 | 158 | 比源基线少4行 | 比源基线少2行 | |
| performance/h-1-02 | 162 | 158 | 比源基线少4行 | 比源基线少2行 | |
| performance/h-1-03 | 162 | 158 | 比源基线少4行 | 比源基线少2行 | |
| performance/h-10-01 | 349 | 335 | 比源基线少14行 | 比源基线少6行 | |
| performance/h-10-02 | 349 | 335 | 比源基线少14行 | 比源基线少6行 | |
| performance/h-10-03 | 349 | 335 | 比源基线少14行 | 比源基线少6行 | |
| performance/h-4-01 | 173 | 163 | 比源基线少10行 | 比源基线少6行 | |
| performance/h-4-02 | 173 | 163 | 比源基线少10行 | 比源基线少6行 | |
| performance/h-4-03 | 173 | 163 | 比源基线少10行 | 比源基线少6行 | |
| performance/h-5-01 | 352 | 349 | 比源基线少3行 | 比源基线少10行 | |
| performance/h-5-02 | 352 | 349 | 比源基线少3行 | 比源基线少10行 | |
| performance/h-5-03 | 352 | 349 | 比源基线少3行 | 比源基线少10行 | |
| performance/h-8-01 | 504 | 502 | 比源基线少2行 | 比源基线少2行 | |
| performance/h-8-02 | 504 | 502 | 比源基线少2行 | 比源基线少2行 | |
| performance/h-8-03 | 504 | 502 | 比源基线少2行 | 比源基线少2行 | |
| performance/h-9-01 | 239 | 227 | 比源基线少12行 | 比源基线少2行 | |
| performance/h-9-02 | 239 | 227 | 比源基线少12行 | 比源基线少2行 | |
| performance/h-9-03 | 239 | 227 | 比源基线少12行 | 比源基线少2行 | |
| performance/huffman-01 | 893 | 849 | 比源基线少44行 | 比源基线少14行 | |
| performance/huffman-02 | 893 | 849 | 比源基线少44行 | 比源基线少14行 | |
| performance/huffman-03 | 893 | 849 | 比源基线少44行 | 比源基线少14行 | |
| performance/knapsack_naive-1 | 185 | 175 | 比源基线少10行 | 比源基线少10行 | |
| performance/knapsack_naive-2 | 185 | 175 | 比源基线少10行 | 比源基线少10行 | |
| performance/knapsack_naive-3 | 185 | 175 | 比源基线少10行 | 比源基线少10行 | |
| performance/many_mat_cal-1 | 523 | 523 | |
| performance/many_mat_cal-2 | 523 | 523 | |
| performance/many_mat_cal-3 | 523 | 523 | |
| performance/matmul1 | 450 | 450 | |
| performance/matmul2 | 450 | 450 | |
| performance/matmul3 | 450 | 450 | |
| performance/optimization_scheduling1 | 136 | 130 | 比源基线少6行 | |
| performance/optimization_scheduling2 | 136 | 130 | 比源基线少6行 | |
| performance/optimization_scheduling3 | 136 | 130 | 比源基线少6行 | |
| performance/shuffle0 | 485 | 479 | 比源基线少6行 | |
| performance/shuffle1 | 485 | 479 | 比源基线少6行 | |
| performance/shuffle2 | 485 | 479 | 比源基线少6行 | |
| performance/sl1 | 283 | 275 | 比源基线少8行 | |
| performance/sl2 | 283 | 275 | 比源基线少8行 | |
| performance/sl3 | 283 | 275 | 比源基线少8行 | |
| performance/transpose0 | 225 | 221 | 比源基线少4行 | |
| performance/transpose1 | 225 | 221 | 比源基线少4行 | |
| performance/transpose2 | 225 | 221 | 比源基线少4行 | |
| performance/optimization_scheduling1 | 136 | 122 | 比源基线少14行 | 比源基线少6行 | |
| performance/optimization_scheduling2 | 136 | 122 | 比源基线少14行 | 比源基线少6行 | |
| performance/optimization_scheduling3 | 136 | 122 | 比源基线少14行 | 比源基线少6行 | |
| performance/shuffle0 | 485 | 472 | 比源基线少13行 | 比源基线少6行 | |
| performance/shuffle1 | 485 | 472 | 比源基线少13行 | 比源基线少6行 | |
| performance/shuffle2 | 485 | 472 | 比源基线少13行 | 比源基线少6行 | |
| performance/sl1 | 283 | 280 | 比源基线少3行 | 比源基线少8行 | |
| performance/sl2 | 283 | 280 | 比源基线少3行 | 比源基线少8行 | |
| performance/sl3 | 283 | 280 | 比源基线少3行 | 比源基线少8行 | |
| performance/transpose0 | 225 | 211 | 比源基线少14行 | 比源基线少4行 | |
| performance/transpose1 | 225 | 211 | 比源基线少14行 | 比源基线少4行 | |
| performance/transpose2 | 225 | 211 | 比源基线少14行 | 比源基线少4行 | |
## 统计

Loading…
Cancel
Save