ceph deep scrub error mismatch 错误 解决

由于ceph集群大量快照的存在,导致集群在做deep-scrub的时候,会出现延迟高的情况。直接删除大量snapshot,会导致进去性能下降,所以临时临时删除了底层的数据,但问题还在,后来手动做deep-scrub的发现报错:
[ERR] 3.0s0 scrub stat mismatch, got 2005/2009 objects, 0/0 clones, 2005/2009 dirty, 0/0 omap, 0/0 hit_set_archive, 0/0 whiteouts, 3981889330/3988381157 bytes." in cluster log
大概是数据不匹配

解决方法:

  1. 获取所有error状态的pg

  2. ceph pg repair 所有pg