本文向您介绍出现问题”GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问“时的解决方案。 问题描述GPU弹性云主机启动异常,检查系统日志,发现GPU驱动提示指针访问错误日志,“BUG: unable to handlekernel NULL pointerdereference at ****************”。可能原因GPU驱动状态异常。处理方法卸载驱动。方法一:执行nvidia-uninstall命令,卸载驱动。
执行以下命令,在dmesg日志中,查看telegraf相关日志。dmesg | grep telegraf如果文件dmesg中的日志出现Memory cgroup out of memory字样,则说明资源消耗超过阈值,例如:在云主机监控Agent服务所在目录/usr/lib/systemd/system/(ubuntu系列发行版 /etc/systemd/system/)中,修改文件telegraf.service中资源限制相关参数。