[해결] Proxmox 7.2 업그레이드 후 IO delay 가 심하게 발생합니다.
Proxmox가 한달에 한번 IO delay 가 심하게 발생합니다.
(Proxmox 전체)
vm은 헤놀1개만 돌리고 있는데 원인은 아닌듯합니다.(아래는 vm것)
이전 발생했을 때에는 저가형 sata SSD가 그럴수 있다고 해서 교체했고 검증된 m.2 SSD 와 HDD를 사용 했는데
같은 현상이 발생하네요.
재부팅하면 정상으로 돌아옵니다.
한달에 한번 재부팅, 까짓거 하면 되는데..... 보통 이런거 무시하다가 시스템 전체가 죽던데 ㅎㅎㅎㅎ
원인이 뭐가 있을까요?
의심가는 환경 설정 댓글로 알려주시면, 찾아서 글 달아 놓겠습니다.
글을 다시 수정합니다...
이제는 바로 IO delay가 발생하네요.....
혹 최근 Proxmox 7.2로 업그레이드 해서그런가도 의심이 가네요.
좀 지켜보고 칼을 들어야 할듯..ㅠ.ㅠ
해당시간대에 proxmox log를 보면어떻게나올까요??
proxmox 가 포럼쪽에서 질답을 많이해주는 편이라 https://forum.proxmox.com/ 쪽에 질문한번 남겨보심이 좋을듯합니다
지연이 기록된 시간의 로그를 확인해보니 아래의 사항이 계속 반복됩니다
May 14 11:45:19 lalawondan kernel: ata1.00: status: { DRDY }
May 14 11:45:19 lalawondan kernel: ata1: hard resetting link
May 14 11:45:19 lalawondan kernel: ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
May 14 11:45:19 lalawondan kernel: ata1.00: configured for UDMA/33
May 14 11:45:19 lalawondan kernel: ata1: EH complete
May 14 11:45:20 lalawondan kernel: ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x48c0000 action 0xe frozen
May 14 11:45:20 lalawondan kernel: ata1.00: irq_stat 0x04000040, connection status changed
May 14 11:45:20 lalawondan kernel: ata1: SError: { CommWake 10B8B LinkSeq DevExch }
May 14 11:45:20 lalawondan kernel: ata1.00: failed command: WRITE DMA
May 14 11:45:20 lalawondan kernel: ata1.00: cmd ca/00:08:e8:ed:fb/00:00:00:00:00/e0 tag 18 dma 4096 out
res 50/00:00:00:00:00/00:00:00:00:00/a0 Emask 0x10 (ATA bus error)
달소님 말씀대로 proxmox 포럼에 가보니 같은 상황이 있네요.
https://forum.proxmox.com/threads/again-proxmox-not-loading-webui-vms-dead.94284/
하드웨어 문제일거라고 나와서 확인해보니
proxmox 부팅으로 사용하는 m.2 sata에서 SMART 경고가 발생했습니다.
퇴출시키고 다른걸로 넣어야 겠네요.
달소님 감사합니다.
헉.. SMART 경고라니.. 천만다행이군요!!
도움이 되셨다니 다행입니다
상황이 생기신분에게는 위추드리지만, 좋은 예가 되는것 같습니다.
하드웨어 문제가 있으므로, 데이터를 써야 하는데 데이터를 쓰지 못하고 IO Delay 가 계속 발생이 되었던거네요.
하긴 IO Delay 라는건 , VM이 동시에 수십대나 돌아가서 한대의 하드에 저장을 자주 못해서나 생길 상황인데..
일반적인 상황에서 생기는건... 확실이 이상하긴 하네요..
IO Delay 가 자꾸 나오면 하드웨어를 의심해라 라는 좋은 예가 된 것 같습니다.
cmt alert