Bug 47006 - pverados segfault
Summary: pverados segfault
Status: CLOSED WORKSFORME
Alias: None
Product: Branch p10
Classification: Unclassified
Component: pve-cluster (show other bugs)
Version: не указана
Hardware: x86_64 Linux
: P5 normal
Assignee: Alexey Shabalin
QA Contact: qa-p10@altlinux.org
URL: https://forum.proxmox.com/threads/pve...
Keywords:
Depends on:
Blocks:
 
Reported: 2023-07-22 10:43 MSK by Anton Farygin
Modified: 2023-10-04 10:52 MSK (History)
2 users (show)

See Also:


Attachments

Note You need to log in before you can comment on or make changes to this bug.
Description Anton Farygin 2023-07-22 10:43:13 MSK
при использовании ядра 6.1.38-un-def в логах вылезает:
602913.808614] pverados[2426655]: segfault at 7f26dc648e38 ip 00007f26dc9b9a49 sp 00007fff9f2364e0 error 4 likely on CPU 32 (core 2, socket 1)
[602913.808626] Code: 00 53 49 89 fa 89 f6 48 8d 14 76 48 83 ec 10 48 8b 47 68 48 8b 78 08 49 8b 82 f8 00 00 00 48 8b 40 08 48 8d 34 d0 49 8b 42 70 <48> 8b 4e 08 48 8b 1e 48 8b 40 08 48 89 ca 48 c1 ea 20 4c 8d 04 52
[604163.513460] pverados[2431657]: segfault at 7f26dc648e38 ip 00007f26dc9b9a49 sp 00007fff9f2364e0 error 4 in ld-2.32.so[7f26dc9ab000+21000] likely on CPU 2 (core 2, socket 0)
[604163.513475] Code: 00 53 49 89 fa 89 f6 48 8d 14 76 48 83 ec 10 48 8b 47 68 48 8b 78 08 49 8b 82 f8 00 00 00 48 8b 40 08 48 8d 34 d0 49 8b 42 70 <48> 8b 4e 08 48 8b 1e 48 8b 40 08 48 89 ca 48 c1 ea 20 4c 8d 04 52
Comment 1 Anton Farygin 2023-07-22 10:44:07 MSK
Linux cluster23-3.balabanovo.net 6.1.38-un-def-alt1 #1 SMP PREEMPT_DYNAMIC Mon Jul 10 18:58:02 UTC 2023 x86_64 GNU/Linux
# cat /etc/os-release 
NAME="ALT Server-V"
VERSION="10.1"
ID=altlinux
VERSION_ID=10.1
PRETTY_NAME="ALT Virtualization Server 10.1 (Actinoform)"
ANSI_COLOR="1;33"
CPE_NAME="cpe:/o:alt:server-v:10.1"
BUILD_ID="ALT Server-V 10.1"
HOME_URL="https://basealt.ru/"
BUG_REPORT_URL="https://bugs.altlinux.org/

Все обновления установлены.
Comment 2 Anton Farygin 2023-07-22 10:50:36 MSK
Ошибка сопровождается сообщением
 pmxcfs[3911]: [dcdb] notice: data verification successful
Comment 3 Evgeny Shesteperov 2023-07-29 19:00:38 MSK
Пытаюсь воспроизвести ошибку, никак не получается. Скажите, после каких действий возникает Segfault? В апстримных багах точных шагов нет.

Proxmox: https://forum.proxmox.com/threads/pverados-segfault.130628/
Kernel: https://lkml.org/lkml/2023/7/25/637
Comment 4 Anton Farygin 2023-07-31 11:44:52 MSK
Никаких действий не надо, просто падает само. 
rdb на сервере нет.
Comment 5 Evgeny Shesteperov 2023-08-01 12:17:00 MSK
Воспроизвелось после длительного простоя примерно 20-30 часов после создания кластера.

Не проверялось в Sisyphus.
Comment 6 Anton Farygin 2023-08-01 14:17:08 MSK
да, воспроизводится при длительном простое.
Comment 7 Evgeny Shesteperov 2023-10-04 10:52:23 MSK
# uname -r
6.1.52-un-def-alt1

Ошибки не наблюдаю. В моём случае был стенд с 3 нодами ALT Server 10.1 с постоянной миграцией (1 -> 2 -> 3 -> 1).

Стенд продолжал работать довольно продолжительное время (c 14 сентября 2023 года)