注:该方法只适用cuda10.2版本的服务器
-
创建虚拟环境:
conda create -n gcc python=3.7
-
激活虚拟环境:
conda activate gcc
-
配置dgl(0.5 > DGL ≥ 0.4.3):
conda install -c dglteam dgl-cuda10.2==0.4.3post2
该命令安装的是cuda10.2 py3.7 dgl-0.4.3,其他版本请查询https://conda.anaconda.org/dglteam/linux-64 -
安装torch:
pip install torch==1.5.1 torchvision==0.6.1
-
clone gcc:
git clone https://github.com/THUDM/GCC.git
-
额外配置gcc所需环境:
pip install -r requirements.txt
-
安装RDKit:
conda install -c conda-forge rdkit=2019.09.2
(解析时间可能会比较久,请耐心等待)
如果你的服务器cuda版本高于11,配置环境则会麻烦一些,因为dgl适配的版本只有>=0.5.3
-
创建虚拟环境:
conda create -n gcc python=3.7
-
激活虚拟环境:
conda activate gcc
-
在conda虚拟环境中安装cuda和cudnn:
conda install cudatoolkit=10.2 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/linux-64/
和conda install cudnn
-
配置dgl:
conda install -c dglteam dgl-cuda10.2==0.4.3post2
-
安装torch:
pip install torch==1.5.1 torchvision==0.6.1
-
clone gcc:
git clone https://github.com/THUDM/GCC.git
-
额外配置gcc所需环境:
pip install -r requirements.txt
-
安装RDKit:
conda install -c conda-forge rdkit=2019.09.2
(解析时间可能会比较久,请耐心等待)
这个时候运行程序会出现"ModuleNotFoundError: No module named 'dgl.nodeflow'". 解决办法参考dmlc/dgl#3083
- 预训练数据集:https://drive.google.com/u/0/uc?id=1JCHm39rf7HAJSp-1755wa32ToHCn2Twz&export=download
- 预训练模型权重:链接:https://pan.zju.edu.cn/share/5fee634c7e5a5ffcad9eddd153,
服务器上通过
wget https://osspandownload.zju.edu.cn/download/2f0c510611bf40d4b7ad77ba90a1b171/dee1bd9a175d4594ec0946557485f31b3df091bcfe970f1d0d681b45e3ce5db7/pretrained.tar.gz
下载到项目的saved目录下,然后解压文件tar zxvf pretrained.tar.gz
- 下游任务数据集:
GitHub代理:https://ghproxy.com/ ,如果clone项目时间过久可以使用该代理。使用方法git clone https://ghproxy.com/XXX