在运行程序的时候,我发现程序一直处在S的(sleep)状态下面,一直卡在硬盘读写,导致模型加载不成功。

一般来说大模型都是10GB以上的,但是我发现服务器上面的机械硬盘只有 700KB/s的加载速度,这十分慢。。。

我怀疑这是使用服务器的用户太多了,导致硬盘读写被满了。

参考这篇文章来检测服务器的硬盘瓶颈:

  • https://blog.csdn.net/weixin_45921929/article/details/131341351

先安装一个包,安装hdparm:

 sudo apt-get install hdparm

列出系统的所有磁盘,可以使用下面的任意一个命令

sudo fdisk -l
# 或者
df -h


这一次,我们主要测试 sdb1 和 sdc 两个硬盘的速度,首先看 sdb1 的读写速度。

sudo hdparm -tT /dev/sdc

在这里插入图片描述

  • hdparm 测试中,7112 MB/s 的缓存读取速度表示从内存(RAM)直接读取数据的理论极限速度(依赖内存性能),而236 MB/s 的缓冲磁盘读取速度反映物理磁盘(如硬盘或SSD)的实际连续读取性能,两者差异源于内存(电子传输)和磁盘(物理/接口限制)的本质区别。若你的磁盘是机械硬盘(HDD),236 MB/s 属于优秀表现;若是SATA SSD则略低于常见500 MB/s水平,需检查接口或磁盘状态。

  • 目前看起来sdb1还是十分正常的

  • 但是sdc九十分不正常了,从disk读取的速度竟然只有400KB/s,这怪不得我模型加载了一年。

听维修说,硬盘低级格式化一下再看看,可能是有坏道了。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐