V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
JarvenI
V2EX  ›  NAS

求助贴, pve 内核报错,如何解决?

  •  
  •   JarvenI · 2023-11-10 15:42:42 +08:00 · 1264 次点击
    这是一个创建于 370 天前的主题,其中的信息可能已经有所发展或是发生改变。

    硬件配置是 i5 7500+华硕 b250M-a + 4*8g 内存(两个品牌,不同频率的 ddr4)

    pve7 报错后重装了 8 ,还是报错,报错代码见图片

    localsend 图片传输也出问题了,拿 b 站动态当图床了,质量有压缩,如果不清楚,请 ctrl+鼠标滚轮 放大看下,理解万岁。

    之前用 pve7.3 就遇到过这个问题,装了 Ubuntu20.04 ,网心云虚拟机,openwrt,ikuai.然后下边就卡死了,只能硬件重启。 然后重装 pve8 后,又报这个错,还是会卡死,装的虚拟机有 ubuntu20.04 openwrt 。

    两次安装 ubuntu 下都直通了 pcie ,以方便调用硬盘。ubuntu cpu 类型是(x86-64-v2-AES),openwrt cpu 类型是 Host

    换了好几个搜索引擎,没找到解决方法,据说是内核报错。

    实在是找不到解决办法了,特来求助,提前感谢

    6 条回复    2023-11-13 08:41:58 +08:00
    JarvenI
        1
    JarvenI  
    OP
       2023-11-10 15:57:12 +08:00
    这个报错,有个伴生的错误,我漏传了,
    在这里说明下,每次报上图的错误后,只能手动重启,然后再进 pve 的 webui ,所有虚拟机就都启动不了了。
    报错如下
    ![报错如下]( https://p.sda1.dev/14/6029755a84fa981947f48237a0824b03/Snipaste_2023-11-10_15-48-11.png)

    pve7 和 8 都有这个问题,不知道是我硬件问题,还是安装的某些软件兼容问题
    Turismo
        2
    Turismo  
       2023-11-10 16:00:00 +08:00
    lspci -v 看一下,之前折腾 pve 的时候发现了的一个小问题,不知道和你的报错是不是有关 可以试试看禁用自带的 8169 驱动改成 8168 试试看

    07:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 15)
    ......
    Kernel driver in use: r8168
    Kernel modules: r8169, r8168
    Yechs
        3
    Yechs  
       2023-11-10 16:05:13 +08:00
    关闭 xmp 试试
    hanssx
        4
    hanssx  
       2023-11-10 16:17:52 +08:00
    你是安装的时候就出现问题了还是用的时候出的问题?第 1 张图咋那么像是安装的时候啊。你贴的第 2 张图没见过,猜测和硬盘有关?

    你贴的第 1 张图不全,call trace 往前应该有东西,你的卡死是不是键盘鼠标也没反应?你查询的内核相关问题是什么?

    莫不成你也是 lockup 报错?如果是的话,恭喜你,大概率能解决,这种情况你看一下我之前发的帖子,https://www.v2ex.com/t/966815#reply21 ,最后我解决了。

    关闭了 acs 就正常了,我猜测开启 acs 之后就触发了内核问题。你如果没开启 acs 的话,先排除一下内存条有没有问题?因为当时查的时候很多也说内存有问题,你先用 2 根甚至 1 根试试。
    JarvenI
        5
    JarvenI  
    OP
       2023-11-10 23:59:01 +08:00
    @hanssx 就是在日常用的时候出问题的,都装完虚拟机和 docker 了,然后再想用 openwrt 布置下旁路由,忽然不行了,一接屏幕,报这个错误。之前报过 watchdog: BUG: soft lockup - CPU#0 stuck for 600s 的错,然后就卡住死机了。键盘鼠标没反应,然后重启还能用。 我试了你的方法,去掉了 pcie_acs_override=downstream ,还是会卡在图二那个启动不了虚拟机。感觉和 lvm 有些关系,明天研究下 lvm 。感谢提供帮助

    @Yechs 现在已经单根内存测试了。报错后,lvm 好像是出问题了,所有虚拟机都启动不了了,明天研究下 lvm 。感谢提供帮助

    @Turismo 报错后,lvm 好像是出问题了,所有虚拟机都启动不了了,明天研究下 lvm 。感谢提供帮助
    totoro625
        6
    totoro625  
       2023-11-13 08:41:58 +08:00
    如果是 SSD ,安装 PVE 系统的时候,硬盘容量选择手动划分,总容量减去 10G 再安装试试
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5947 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 02:06 · PVG 10:06 · LAX 18:06 · JFK 21:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.