cuda7 安装 ubuntu14

操他妈。
以为驱动装的挺好的,今天一开机,卧槽,ubuntu进不去了,登陆界面是个黑屏。后来发现ssh可以登陆进去就放心了一些,至少数据没问题。然后开始找原因。
首先怀疑的就是显卡驱动的问题,由于事情比较复杂,设疑一个显卡驱动,还有个之前安装的cuda7,不清楚到底是这俩哪个问题。网上一堆说cuda装完或者显卡驱动装完就黑屏的解决教程,但是情况各异。有的是进桌面后黑屏,但是我的是登陆界面就黑了。
下面是过程,留着以后别忘了。

系统之前就有个问题 ctrl alt fn没法切换到字符ttyn,这让我很纳闷,由于系统刚搞好也没在意。另外装cuda7的时候有个疑问,cuda7里说包含了驱动,那我一应该裸奔着装cuda7呢还是应该先装驱动再装cuda7呢。这一点在nvidia官网上的getting start里也没搞清楚。现在明白了cuda7里包含了的驱动就是显卡驱动,所以一定要裸着装。但是我当时阴差阳错不知道怎么就把nvidia的驱动给装上了。
既然进不了系统了,那有两个办法,一个是ssh过去,还有一个是使用安全模式进入ubuntu,记得选上network。然后一个偶然我apt-get --purge cuda然后重启机器,发现系统不黑屏了,进去了,这下我确认了一点,应该是cuda的问题。加上之前没有搞明白的哪个问题,感觉应该是驱动上的问题。所以我选择一个包一个包的装。首先是apt-get install cuda-tooltik-7-0这个东西。重启,没问题。然后是apt-get install cuda-drivers,完事重启直接黑屏。但是这个里面有几个依赖的包,最后发现是一个叫nvidia-modprobe的包的问题,只要装上这个就黑屏,卸载就ok。现在问题彻底确认了,就是driver的问题。这个东西网上查了下是用来生成/dev/nvidia*设备的东西。并且对比后发现,在黑屏的时候确实在dev目录下没有nvidia的设备生成。
所以解决办法也就明确了。首先干掉现有驱动,比较暴力,但是发现这种方法删掉的包我都仔细看过,确认安全后才干的。

1
2
3
sudo apt-get --purge remove nvidia-*
#此处包括如下几个包:nvidia-346,nvidia-346-dev,nvidia-346-uvm
#nvidia-opencl-icd-346, nvidia-prime, nvidia-settings

然后直接cuda7

1
sudo apt-get install cuda

重启,OK。这样完了之后,字符终端啥的都好了。当然第一次重启后进入界面会报错。第二次就没事了。为了保险,还是执行了以下:

1
dpkg-reconfigure nvidia-346 nvidia-346-uvm nvidia-settings

Imgur