I've implemented optimizations to rte_memcpy targeting RISC-V architectures,  <br />achieving an average 10%~15% reduction in execution time for data sizes between<br />129 to 1024 bytes( 1025~1600 gains little).<br />These enhancements draw inspiration from x86 implementations,<br /> specifically focusing on:<br />1)Alignment Handling for Unaligned Scenarios<br />2)Vector Configuration Tuning<br />3)Strategic Prefetching<br /> <br />- Patch 1: Cover letter<br />- Patch 2: Base implementation<br />- Patch 3: Benchmark report<br /> <br /> <br />Tested on Tested on SG2044 (VLEN=128)<br /> <br /> <br />Qiguo Chen (2):<br />  riscv support rte_memcpy in vector<br />  benchmark report for rte_memcpy<br /> <br /> .mailmap                           |   1 +<br /> benchmark_report.txt               | 149 ++++++++++++++<br /> config/riscv/meson.build           |  14 ++<br /> lib/eal/riscv/include/rte_memcpy.h | 310 ++++++++++++++++++++++++++++-<br /> 4 files changed, 472 insertions(+), 2 deletions(-)<br /> create mode 100644 benchmark_report.txt<br /> <br />--  <br />2.21.0.windows.1<br />