完整报错OSError: [WinError 1455] 页面文件太小,无法完成操作。 Error loading "C:\ProgramData\Anaconda3\lib\site-packages\torch\lib\shm.dll" or one of its dependencies.
场景:运行reid-strong-baseline模型
原因:模型太大,而系统分配的分页内存太小,无法训练
环境:windows10,cuda版本:11.1,pytorch版本:1.11.0+cu113
(1)查询自己的cuda版本:
nvidia-smi
(2)查询自己的pytorch版本
import torch
print(torch.__version__)
解决:电脑右键属性->高级系统设置->高级->设置->高级->程序->更改->取消“自动管理。。。”前的勾->自定义大小(定义初始大小和最大值)(此处根据实际可用空间进行设置,尽可能大)->点击“设置”->确定->重启
如果重启之后再次运行还是报错,可能原因:(1)自定义的大小还是太小了(比如我开始设置的是10G,还是报错,后续修改为100G(100000M)才成功运行)(2)batch_size太大了,可以适当调小(如将64减小为16)
#----------------------------根据评论补充“修改”的解释----------------------------------------------------------------
(根据可用空间尽可能自定义选定的系统盘的分页大小即可,输入数字(如这里的100000)后),点击“设置”,所设置的盘会变成下面这样:
然后重启电脑,重新运行程序。