How to change huggingface transformers default cache directory
-
- 前言
- 关于windows上如何修改huggingface transformers默认缓存文件夹
前言
最近在学习用TensorFlow框架做NLP任务,注意到huggingface中的transforms库非常强大,于是开始学习用它来做相应的任务。刚开始用这个库没多久,感觉确实操作起来既简单又强大,于是打算深入学习。
- 学习过程中发现,运行程序过程中,下载的模型和数据集是默认放在C盘的用户目录下的,为了减轻C盘负担,于是想更改其默认目录,从官网了解到有两种实现方式,一种是临时指定cache_dir,另一种是直接设置环境变量,以下对二者进行说明。
关于windows上如何修改huggingface transformers默认缓存文件夹
- 官方对缓存地址的说明:
第一种方式:设置环境变量:
在windows上,为了以后使用方便,我采取了第一种设置缓存地址的方法,也就是设置TRANSFORMERS_CACHE环境变量,我将其设置在了用户环境变量里面:
接下来关键的一步:
在用户环境变量Path或者系统环境变零PATH中添加:
%TRANSFORMERS_CACHE%
第二种方式:在调用from_pretrained函数时使用cache_dir入参,指定缓存文件夹名
如指定缓存位置为当前目录:
AutoModel.from_pretrained('bert-base-chinese', cache_dir='./')
以上