欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Readiness probe failed: cat: /jobstatus/jobok: No such file or directory

程序员文章站 2022-07-15 16:50:32
...

问题报错:
 

当我在启动 openpai 中 k8s 集群服务的时候,启动 drivers-one-shot 的时候报错:

Readiness probe failed: cat: /jobstatus/jobok: No such file or directory

ERROR: Failed to run `/usr/sbin/dkms build -m nvidia -v 410.73 -k
       4.4.0-166-generic`: 
       Kernel preparation unnecessary for this kernel.  Skipping...
       
       Building module:
       cleaning build area....
       'make' -j32 NV_EXCLUDE_BUILD_MODULES=''
       KERNEL_UNAME=4.4.0-166-generic IGNORE_CC_MISMATCH=''
       modules.....(bad exit status: 2)
       Error! Bad return status for module build on kernel:
       4.4.0-166-generic (x86_64)
       Consult /var/lib/dkms/nvidia/410.73/build/make.log for more
       information.

问题原因:

[email protected]:~# uname -r      # 内核版本太高,兼容性问题,之前自己手动更新过
4.4.0-166-generic
  
[email protected]:~# ls /var/lib/initramfs-tools/     # 查看本机
4.4.0-142-generic  4.4.0-165-generic  4.4.0-166-generic  4.4.0-21-generic
# 修改 grub 的配置文件,先做个备份(以防出错)
sudo cp /boot/grub/grub.cfg /boot/grub/grub.cfg.bak.zgw
sudo vim  /boot/grub/grub.cfg

找到这两行:
linux   /vmlinuz-4.4.0-166-generic root=UUID=6cb3b416-e7b5-4d56-86c2-731fc74581a4 ro “cgroup_enable=memory quiet splash $vt_handoff
        initrd  /initrd.img-4.4.0-166-generic
# 我的在 148149 行,将这两行中的“-4.4.0-166-generic” 改为“-4.4.0-142-generic”
(这里的 -4.4.0-142-generic 版本并不是固定的,可以换成你自己想换的版本)

然后保存退出,重启服务器就可以了!

这里是只是我遇到的问题的解决办法,如果没有解决您的问题,那很抱歉!

相关标签: Openpai