<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:DengXian;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:DengXian;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        text-align:justify;
        text-justify:inter-ideograph;
        font-size:10.5pt;
        font-family:DengXian;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:DengXian;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:DengXian;}
/* Page Definitions */
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 90.0pt 72.0pt 90.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="ZH-CN" link="#0563C1" vlink="#954F72" style="word-wrap:break-word;text-justify-trim:punctuation">
<div class="WordSection1">
<p class="MsoNormal"><span lang="EN-US">Hi experts,<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">I had a traffic throughput test for my dpdk application, with same software and test case, only difference is the number of rx/tx descriptor:<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Rx/tx descriptor 512, test result 3.2mpps<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Rx/tx descriptor 2048, test result 3mpp<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">From perf data, rx descriptor 2048 case has more cache miss, and lower instruction per cycle<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Perf for 512 rx descriptor<o:p></o:p></span></p>
<p class="MsoNormal"><i><span lang="EN-US">      114289237792      cpu-cycles<o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">      365408402395      instructions           
<b>  #    3.20  insn per cycle</b><o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">       74186289932      branches<o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">          36020793      branch-misses             #    0.05% of all branches<o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">        1298741388      bus-cycles<o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">           3413460      cache-misses           
<b>  #    0.723 % of all cache refs</b><o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">         472363654      cache-references<o:p></o:p></span></i></p>
<p class="MsoNormal"><span lang="EN-US">Perf for 2048 rx descriptor:<o:p></o:p></span></p>
<p class="MsoNormal"><i><span lang="EN-US">       57038451185      cpu-cycles<o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">      173805485573      instructions             
<b>#    3.05  insn per cycle</b><o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">       35289607389      branches<o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">          15418885      branch-misses             #    0.04% of all branches<o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">         648164239      bus-cycles<o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">          13170596      cache-misses            
<b> #    1.702 % of all cache refs</b><o:p></o:p></span></i></p>
<p class="MsoNormal"><i><span lang="EN-US">         773765263      cache-references<o:p></o:p></span></i></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">I understand it means more rx descriptor somehow causes more cache miss and then less instruction per cycle, so lower performance.<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Any one observe similar results?<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Any idea to mitigate (or investigate further) the impact? (we want to use 2048 to better tolerate some jitter/burst)<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Any comment?<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Thank you.<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Br, Xiaoping<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
</div>
</body>
</html>