<div>Thanks for the answer.</div><div> </div><div>Oops, sorry, some details:</div><div>- one core run generator routine</div><div>- one core run routine to save/display statistic</div><div> </div><div>core run a generator routine like:</div><div> </div><div>while (1) {<!-- --></div><div>get buffer from pool</div><div><div>make eth+ip+udp header (it's static content)</div><div>generate payload like memset(packet.payload , 'A' + something, payload_size);</div><div>generate packet sequence and CRC32C  - and add it to the payload part</div><div>"send" packet to tx_buffer</div><div> </div><div>if (tx_buffer.size == tx_buffer.length)</div><div>do flush()</div></div><div>}</div><div> </div><div>"header; part of the packet : sizeof(eth+ip+udp) -</div><div>"payload" part - 20-1024 octets</div><div> </div><div>RSS - it's on received side, yes ?</div><div> </div><div>testpmd - have not tried, I'll.</div><div> </div><div> </div><div>26.12.2022, 16:07, "Dmitry Kozlyuk" <dmitry.kozliuk@gmail.com>:</div><blockquote><p>Hi,<br /><br />2022-12-26 15:20 (UTC+0300), Ruslan R. Laishev:</p><blockquote> I studying programming with DPDK SDK . So I write a small app to send/receive packets , now I testing it and see next situation:<br /> iperf3 show  9,4 - 9,7 Gbps on TCP<br />  <br /> my app can *send* only at 4+Gbps (I see counters in the rte_eth_stats) .  I have tried to speed-up my app by:<br /> -  using 1+ number of TX queues (device claim support 64)<br /> -  increase size of burst from 32 up to 128  <br /> - turn off any offloads related to checksumming<br />  <br /> No effect.</blockquote><p><br />Please tell more about what your app does and how (w.r.t. DPDK usage).<br />Are you sure that all cores are loaded? E.g. if you send identical packets,<br />RSS can steer them all to a single queue and thus a single core.<br /><br />What performance do you see using testpmd with txonly/rxonly forward mode,<br />if applicable?<br /><br />What is the packet performance, i.e. Mpps, not Gbps, and packet size?<br />Unless you do TCP payload processing (or compute large payload checksums),<br />packets per second usually matter rather than bits per second.</p></blockquote><div> </div><div> </div><div><span style="font-family:'georgia' , 'palatino'">--- </span></div><div><span style="font-family:'georgia' , 'palatino'">С уважением,<br />Ruslan R. Laishev</span></div><div><span style="font-family:'georgia' , 'palatino'">OpenVMS bigot, natural born system/network progger, C contractor.</span></div><div><span style="font-family:'georgia' , 'palatino'">+79013163222</span></div><div><span style="font-family:'georgia' , 'palatino'">+79910009922</span></div><div> </div>