ZFS 풀에서 계속 에러가 뜹니다
현재 제 서버는 Proxmox로 전환한 뒤부터 쭉 ZFS 시스템으로 스토리지를 구상해왔습니다.
ZFS로 전환한 뒤로부터 대시보드에 풀 상태가 뜨니 간간히 상태를 확인하는데요. 간혹 풀 상태가 'Error'로 표시될때가 있습니다.
그럴때마다 확인해보면 디스크 4개에 동일하게 체크섬 오류가 동일한 숫자로 올라가 있고 "Permanent errors have been detected in the following files" 에러가 표시됩니다.
(아래 로그는 scrub 진행 후 확인한거라 체크섬 오류가 표시되있진 않습니다)
root@bass9030nas:~# zpool status -v
pool: bass-zfs
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-8A
scan: scrub repaired 0B in 01:01:22 with 3 errors on Mon Apr 15 12:49:41 2024
config:
NAME STATE READ WRITE CKSUM
bass-zfs ONLINE 0 0 0
raidz1-0 ONLINE 0 0 0
wwn-0x50000396220815e4 ONLINE 0 0 0
wwn-0x5000c5005b978434 ONLINE 0 0 0
wwn-0x50004cf20711d2d9 ONLINE 0 0 0
wwn-0x50014ee0ae76d528 ONLINE 0 0 0
errors: Permanent errors have been detected in the following files:
<metadata>:<0x193>
일단 해당 현상이 보일때마다 zpool scrub 진행하고는 있는데 풀 상태 Error 표시될때마다 가슴이 출렁 가라앉는 기분입니다
또 scrub을 완전히 마쳐도 저 Permanent error는 지워지지 않아서 scrub를 실행하고 바로 취소하는 약간의 편법을 통해 Permanent error를 지우고 있습니다.
해당 현상이 단순 하드 노후화 문제(하드분들 평균 연세들이 10년 언저리입니다..ㅋㅋ) 때문에 생기는 걸까요? 혹은 다른 문제가 있는걸까요?
cmt alert