实验室有台GTX 1080的公用电脑,今天用向日葵往里面传了四张图片,因为觉得传的文件少,就没打包(用向日葵向linux传文件时,传过去的文件会带一把锁,使用时提示没有权限,将文件打包发过去后解压出来则不会有锁)然后应该使用命令

sudo chmod 777 ./*

结果少敲了一个点敲成了

sudo chmod 777 /*

直接把根目录下的文件的权限修改了,然后系统卡死了ssh也连不上,好在还能使用向日葵传输文件,所以把电脑中的个人文件全部用向日葵拷贝出来备份。准备重装电脑。
这提醒我们少用 sudo吧?

制作启动盘

准备空U盘

https://mirrors.tuna.tsinghua.edu.cn/

搜索Ubuntu,下载对应的iso镜像文件
image.png
我使用的UltraISO软碟通来写入硬盘映像

安装Ubuntu

插入u盘设置为u盘启动,安装Ubuntu,过程省略。安装后重启电脑,配置网络等其他设置。再安装anaconda、pycharm等软件。

更新显卡驱动

终端输入nvidia-smi显示驱动程序的版本好像是380.xx多,这显然不满足深度学习的条件。

禁用nouveau

如果你是第一次安装nvidia驱动,通常在安装之前,我们需要把默认驱动nouveau给禁掉。
打开终端,输入:

sudo gedit /etc/modprobe.d/blacklist.conf

在blacklist.conf文件末尾加上这两行,并保存:

blacklist nouveau
options nouveau modeset=0

然后执行命令:

sudo update-initramfs -u  //应用更改

重启后电脑,验证是否禁用nouveau:

lsmod | grep nouveau

没有信息返回说明已禁用。

下载驱动程序

中文版nvidia驱动官网https://www.nvidia.cn/geforce/drivers/
image.png

卸载旧驱动

在安装新驱动之前,需要卸载旧的驱动,否则可能会报错。

sudo /usr/bin/nvidia-uninstall
sudo apt-get --purge remove nvidia-*
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*

输入sudo dpkg --list | grep nvidia-* ,没有出现任何内容即可。

安装新驱动

sudo chmod a+x NVIDIA-Linux-x86_64-460.84.run
sudo ./NVIDIA-Linux-x86_64-460.84.run -no-x-check -no-nouveau-check -no-opengl-files

这里,sudo ./xx.run 命令后面必须添加选项-no-x-check -no-nouveau-check -no-opengl-files,否则会报错。

–no-opengl-files 只安装驱动文件,不安装OpenGL文件

–no-x-check 安装驱动时不检查X服务

–no-nouveau-check 安装驱动时不检查nouveau

卸载完旧驱动,在安装新驱动的时候报错了,大概是说GPU被其他程序占用了,我reboot重启了一下电脑,电脑分辨率就变得很低了,重新安装就ok了,安装完成后再重启电脑。

查看新驱动

输入nvidia-smi 查看驱动版本

按理来说要再安装cuda和cudnn,但发现直接在conda的虚拟环境中安装cudatoolkit和cudnn即可

最后修改:2022 年 05 月 29 日
如果觉得我的文章对你有用,请随意赞赏