<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:DengXian;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:"\@DengXian";
        panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
p.MsoPlainText, li.MsoPlainText, div.MsoPlainText
        {mso-style-priority:99;
        mso-style-link:"Plain Text Char";
        margin:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.PlainTextChar
        {mso-style-name:"Plain Text Char";
        mso-style-priority:99;
        mso-style-link:"Plain Text";
        font-family:"Calibri",sans-serif;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal">Hi! Thanks for submitting this. Some inline comments follow.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoPlainText">> -----Original Message-----<o:p></o:p></p>
<p class="MsoNormal">> From: <span lang="ZH-CN" style="font-family:DengXian">苏赛</span> <susai.ss@bytedance.com>
<o:p></o:p></p>
<p class="MsoNormal">> Sent: Thursday 31 July 2025 10:55<o:p></o:p></p>
<p class="MsoNormal">> To: jasvinder.singh@intel.com<o:p></o:p></p>
<p class="MsoNormal">> Cc: dev@dpdk.org<o:p></o:p></p>
<p class="MsoNormal">> Subject: [PATCH] net/cksum: compute raw cksum for several segments<o:p></o:p></p>
<p class="MsoNormal">> <o:p></o:p></p>
<p class="MsoNormal">> The rte_raw_cksum_mbuf function is used to compute<o:p></o:p></p>
<p class="MsoNormal">> the raw checksum of a packet.<o:p></o:p></p>
<p class="MsoNormal">> If the packet payload stored in multi mbuf, the function<o:p></o:p></p>
<p class="MsoNormal">> will goto the hard case. In hard case,<o:p></o:p></p>
<p class="MsoNormal">> the variable 'tmp' is a type of uint32_t,<o:p></o:p></p>
<p class="MsoNormal">> so rte_bswap16 will drop high 16 bit.<o:p></o:p></p>
<p class="MsoNormal">> Meanwhile, the variable 'sum' is a type of uint32_t,<o:p></o:p></p>
<p class="MsoNormal">> so 'sum += tmp' will drop the carry when overflow.<o:p></o:p></p>
<p class="MsoNormal">> Both drop will make cksum incorrect.<o:p></o:p></p>
<p class="MsoNormal">> This commit fixes the above bug.<o:p></o:p></p>
<p class="MsoNormal">> <o:p></o:p></p>
<p class="MsoNormal">> Signed-off-by: Su Sai <susai.ss@bytedance.com><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">> diff --git a/lib/net/rte_cksum.h b/lib/net/rte_cksum.h<o:p></o:p></p>
<p class="MsoNormal">> index a8e8927952..aa584d5f8d 100644<o:p></o:p></p>
<p class="MsoNormal">> --- a/lib/net/rte_cksum.h<o:p></o:p></p>
<p class="MsoNormal">> +++ b/lib/net/rte_cksum.h<o:p></o:p></p>
<p class="MsoNormal">> @@ -80,6 +80,25 @@ __rte_raw_cksum_reduce(uint32_t sum)<o:p></o:p></p>
<p class="MsoNormal">>          return (uint16_t)sum;<o:p></o:p></p>
<p class="MsoNormal">>  }<o:p></o:p></p>
<p class="MsoNormal">>   <o:p></o:p></p>
<p class="MsoNormal">> +/**<o:p></o:p></p>
<p class="MsoNormal">> + * @internal Reduce a sum to the non-complemented checksum.<o:p></o:p></p>
<p class="MsoNormal">> + * Helper routine for the rte_raw_cksum_mbuf().<o:p></o:p></p>
<p class="MsoNormal">> + *<o:p></o:p></p>
<p class="MsoNormal">> + * @param sum<o:p></o:p></p>
<p class="MsoNormal">> + *   Value of the sum.<o:p></o:p></p>
<p class="MsoNormal">> + * @return<o:p></o:p></p>
<p class="MsoNormal">> + *   The non-complemented checksum.<o:p></o:p></p>
<p class="MsoNormal">> + */<o:p></o:p></p>
<p class="MsoNormal">> +static inline uint16_t<o:p></o:p></p>
<p class="MsoNormal">> +__rte_raw_cksum_reduce_u64(uint64_t sum)<o:p></o:p></p>
<p class="MsoNormal">> +{<o:p></o:p></p>
<p class="MsoNormal">> +        uint32_t tmp;<o:p></o:p></p>
<p class="MsoNormal">> +<o:p></o:p></p>
<p class="MsoNormal">> +        tmp = __rte_raw_cksum_reduce((uint32_t)sum);<o:p></o:p></p>
<p class="MsoNormal">> +        tmp += __rte_raw_cksum_reduce((uint32_t)(sum >> 32));<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">What if this addition overflows?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">To my taste I would not try to call `__rte_raw_cksum_reduce ` and instead reduce uint64_t directly to uint16_t, but it’s up to you.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">> +        return __rte_raw_cksum_reduce(tmp);<o:p></o:p></p>
<p class="MsoNormal">> +}<o:p></o:p></p>
<p class="MsoNormal">> +<o:p></o:p></p>
<p class="MsoNormal">>  /**<o:p></o:p></p>
<p class="MsoNormal">>   * Process the non-complemented checksum of a buffer.<o:p></o:p></p>
<p class="MsoNormal">>   *<o:p></o:p></p>
<p class="MsoNormal">> @@ -119,8 +138,9 @@ rte_raw_cksum_mbuf(const struct rte_mbuf *m, uint32_t off, uint32_t len,<o:p></o:p></p>
<p class="MsoNormal">>  {<o:p></o:p></p>
<p class="MsoNormal">>          const struct rte_mbuf *seg;<o:p></o:p></p>
<p class="MsoNormal">>          const char *buf;<o:p></o:p></p>
<p class="MsoNormal">> -        uint32_t sum, tmp;<o:p></o:p></p>
<p class="MsoNormal">> +        uint32_t tmp;<o:p></o:p></p>
<p class="MsoNormal">>          uint32_t seglen, done;<o:p></o:p></p>
<p class="MsoNormal">> +        uint64_t sum;<o:p></o:p></p>
<p class="MsoNormal">>   <o:p></o:p></p>
<p class="MsoNormal">>          /* easy case: all data in the first segment */<o:p></o:p></p>
<p class="MsoNormal">>          if (off + len <= rte_pktmbuf_data_len(m)) {<o:p></o:p></p>
<p class="MsoNormal">> @@ -157,7 +177,7 @@ rte_raw_cksum_mbuf(const struct rte_mbuf *m, uint32_t off, uint32_t len,<o:p></o:p></p>
<p class="MsoNormal">>          for (;;) {<o:p></o:p></p>
<p class="MsoNormal">>                  tmp = __rte_raw_cksum(buf, seglen, 0);<o:p></o:p></p>
<p class="MsoNormal">>                  if (done & 1)<o:p></o:p></p>
<p class="MsoNormal">> -                        tmp = rte_bswap16((uint16_t)tmp);<o:p></o:p></p>
<p class="MsoNormal">> +                        tmp = rte_bswap32(tmp);<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">This part probably deserves a comment, since we only need to swap odd and even bytes, but we instead reverse all of them abusing the fact that order of 2-byte pairs does not matter for the algorithm.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">>                  sum += tmp;<o:p></o:p></p>
<p class="MsoNormal">>                  done += seglen;<o:p></o:p></p>
<p class="MsoNormal">>                  if (done == len)<o:p></o:p></p>
<p class="MsoNormal">> @@ -169,7 +189,7 @@ rte_raw_cksum_mbuf(const struct rte_mbuf *m, uint32_t off, uint32_t len,<o:p></o:p></p>
<p class="MsoNormal">>                          seglen = len - done;<o:p></o:p></p>
<p class="MsoNormal">>          }<o:p></o:p></p>
<p class="MsoNormal">>   <o:p></o:p></p>
<p class="MsoNormal">> -        *cksum = __rte_raw_cksum_reduce(sum);<o:p></o:p></p>
<p class="MsoNormal">> +        *cksum = __rte_raw_cksum_reduce_u64(sum);<o:p></o:p></p>
<p class="MsoNormal">>          return 0;<o:p></o:p></p>
<p class="MsoNormal">>  }<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Changes to this function look correct to my eye, but given how many pitfalls we have already found I think we need tests.<o:p></o:p></p>
</div>
</body>
</html>