<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
Hi Ken, here is the error syndrome 0x04 meaning:</div>
<div style="text-align: left; text-indent: 0px; margin: 0cm 0px 0cm 48px; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
0x4: Local_Protection_Error </div>
<div class="elementToProof" style="text-align: left; text-indent: 0px; margin: 0cm 0px 0cm 48px; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
"This event is generated when a user attempts to access an address outside of the registered memory region.</div>
<div class="elementToProof" style="text-align: left; text-indent: 0px; margin: 0cm 0px 0cm 48px; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
For example, this may happen if the Lkey does not match the address in the WR."</div>
<div class="elementToProof" style="text-align: left; text-indent: 0px; margin: 0cm 0px; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
Looks like wrong buffer was passed to the NIC for a packet acquisition.</div>
<div class="elementToProof" style="text-align: left; text-indent: 0px; margin: 0cm 0px; font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
Could you please share more details on your test case? What is the traffic pattern? What is Rx/Tx queues config? mbufs?</div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
<br>
</div>
<div id="appendonsend" style="color: inherit;"></div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
Regards,</div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
Alex</div>
<div class="elementToProof" style="font-family: Aptos, Aptos_EmbeddedFont, Aptos_MSFontService, Calibri, Helvetica, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);">
<br>
</div>
<hr style="display: inline-block; width: 98%;">
<div id="divRplyFwdMsg" dir="ltr" style="color: inherit;"><span style="font-family: Calibri, sans-serif; font-size: 11pt; color: rgb(0, 0, 0);"><b>From:</b> Ken Andrews <ken.andrews@calnexsol.com><br>
<b>Sent:</b> Friday, June 28, 2024 5:22 AM<br>
<b>To:</b> users@dpdk.org <users@dpdk.org><br>
<b>Subject:</b> Mellanox - Unexpected CEQ error, rx stops receiving packets</span>
<div> </div>
</div>
<div style="font-size: 11pt;">Hi,<br>
<br>
I'm seeing an issue previously mentioned on this list in 2022, where my Mellanox NIC is logging an Unexpected CEQ error syndrome. Once this condition is hit, the <br>
rxq->err_state var in the mlx5 PMD is never cleared, and the rx just loops around never receiving any further packets.<br>
<br>
It's not clear what's causing the initial CEQ error, as it can take upwards of an hour to occur.<br>
<br>
The full log entry is:<br>
<br>
Unexpected CQE error syndrome 0x04 CQN = 256 SQN = 4679 wqe_counter = 2149 wq_ci = 3294 cq_ci = 42609<br>
MLX5 Error CQ: at [0x292d26000], len=16384<br>
<br>
The NIC is:  NVIDIA ConnectX-7 HHHL Adapter card, 400GbE / NDR IB (default mode), Single-port OSFP, PCIe 5.0 x16, Crypto Enabled, Secure Boot Enabled<br>
Part number: MCX75310AAC-NEA_Ax<br>
Firmware: 28.36.1010<br>
OFED Version: 24.04-0.6.6.0<br>
DPDK Version: 23.11.0<br>
<br>
This issue was previously mentioned in this post: <a href="https://mails.dpdk.org/archives/users/2022-October/006779.html" id="OWA12e4bca0-0fc2-e2b5-6bda-0d6c65807f61" class="OWAAutoLink" data-auth="NotApplicable">
https://mails.dpdk.org/archives/users/2022-October/006779.html</a><br>
<br>
Can anyone please help shed some light on this?<br>
<br>
Thanks,<br>
Ken AndrewsKen Andrews R&D Departmentt: +44 1506 671416e: ken.andrews@calnexsol.comw: calnexsol.comNew Product<br>
<br>
The SNE-X is a total solution to the problem of real-world Ethernet testing. It combines comprehensive and efficient network emulation for 5G, Data Center, and Cloud applications. Click for more information.<br>
<br>
Calnex Solutions<br>
Oracle Campus<br>
Linlithgow<br>
EH49 7LR<br>
United KingdomCalnex Solutions plc is registered in Scotland. Registration number: SC299625. Registered office: Oracle Campus, Linlithgow, Scotland, EH49 7LR, United Kingdom.</div>
</body>
</html>