硬盘吧 关注:263,548贴子:1,612,758
  • 4回复贴,共1

问一下HDD的URE

只看楼主收藏回复

HDD做raid5/6时一个老生常谈就是URE(Nonrecoverable Read Error)导致重建失败,那么这个URE rate如何定义的呢?有没有哪家有具体说明过概率/测试方法?


IP属地:福建1楼2022-01-27 22:22回复
    比如HC320的sheet表述是Error Rate (non-recoverable bits read) 1 in 10^15,是出错概率平均每10^15bit出1bit错误的意思吧,Nonrecoverable意味着硬件纠错(如果有的话)/重新读取不能解决问题?
    URE的来源是写入时就写错还是保存在磁盘上时磁性变化了?只是读出错误的话应该重新读取就能解决吧?如果是磁盘上bit的磁性变化的话是不是和时间相关呢?


    IP属地:福建2楼2022-01-27 22:23
    回复
      我也很好奇URE的原理。
      如果是写入时发生错误感觉才可以计算概率,如果是中间变动那么概率应该和时间是有关系的!如果是读取时发生错误,那么直接重读不就好了,URE就根本不算事了。
      个人觉得应该是写入时发生错误,用RAIDZ经常scrub应该可以有效避免数据损坏。


      IP属地:江苏3楼2022-05-17 21:14
      回复
        话说如果是写入时发生错误的话,ure针对的就是scrub间隔里写入的数据量,或许可以解释自己测试重建raid5时的高成功率——对于可能不到100GB的月均写入来说,遇上出错的概率已经是1%以下了
        然后对于业务活跃的服务器,哪怕scrub周期短至1-2周,写入量也可能很大(比如10MBps积累一周就是6TB),自然容易遇到错误


        IP属地:福建4楼2022-06-05 07:33
        回复
          磁盘写入文件,有ECC纠错机制,而且如果写入时错误WIINDOWS也会提示。
          URE错误是不可修复的读取错误,而不管什么时候什么原因吧。磁性翻转是原因之一,也有出现坏道等等原因。即便正确读取了文件,可能是磁盘上文件本身是正确的,也可能是读取错误但经过ECC纠错得到的。


          IP属地:四川5楼2023-08-01 13:02
          回复