羊毛党的胜利——用Google Colab的免费P100训练deepmd-kit模型

本文于2020年3月12日发表于知乎专栏,查看原文
本文于2020年3月9日发表于微信公众号,查看原文

最近几个月,Google Colab上线了免费的P100。本文介绍如何用Google Colaboratory的免费P100训练deepmd-kit模型。

在Google Drive上传训练需要的文件。为了方便展示,这里以GitHub的库里的example为例,但是stop_batch被调为了20000。

打开Colab网站https://colab.research.google.com/ ,点击下方的“新建笔记本”:

进入Colab界面,点击代码执行程序>更改运行时类型,将硬件设置为GPU:

用!nvidia-smi看一下被分到的卡是什么型号,看看是不是较差的P4,毕竟能否抢到P100也个玄学的事情。如果不是,可以重复执行以上操作。

用!pip install deepmd-kit tensorflow==2.1 配置环境:

挂载Google Drive。点击左侧的“文件”图标,点击“挂载Google云端硬盘”,并且同意访问:

cd到刚才上传目录训练,然后坐等训练完成。

免费的还是挺香的。

保存模型:

测试模型。由于我只训练了20,000个batch,精度没有达到最高水平:

回到Google Drive,我们发现,所有训练文件都在里面了——也就是说如果中途断线也可以继续训练。

本文的colab文件