[해결] Proxmox 7.2 업그레이드 후 IO delay 가 심하게 발생합니다.

koreafood

Proxmox가 한달에 한번 IO delay 가 심하게 발생합니다.

 

(Proxmox 전체)

스크린샷 2022-05-14 오전 8.40.34.png.jpg

 

 

vm은 헤놀1개만 돌리고 있는데 원인은 아닌듯합니다.(아래는 vm것)

스크린샷 2022-05-14 오전 8.41.26.png.jpg

 

이전 발생했을 때에는 저가형 sata SSD가 그럴수 있다고 해서 교체했고  검증된  m.2 SSD 와 HDD를 사용 했는데

같은 현상이 발생하네요.

스크린샷 2022-05-14 오전 8.51.43.png.jpg

재부팅하면 정상으로 돌아옵니다.

 

스크린샷 2022-05-14 오전 8.53.35.png.jpg

 

한달에 한번 재부팅, 까짓거 하면 되는데..... 보통 이런거 무시하다가  시스템 전체가 죽던데 ㅎㅎㅎㅎ

원인이 뭐가 있을까요?

의심가는 환경 설정  댓글로 알려주시면, 찾아서  글 달아 놓겠습니다.

 

 

글을 다시 수정합니다... 

이제는 바로 IO delay가 발생하네요.....

혹 최근 Proxmox 7.2로 업그레이드 해서그런가도 의심이 가네요.

 

좀 지켜보고   칼을 들어야 할듯..ㅠ.ㅠ

 

스크린샷 2022-05-14 오전 11.39.03.png.jpg

 

적용중인 도장이 없습니다.

* 가입일 : 2022-01-02

최근댓글 모음

마지막 한줄로 pass 달소님 말씀대로 proxmox 포럼에 가보니 같은 상황이 있네요.   https://forum.proxmox.com/threads/again-proxmox-not-loading-webui-vms-dead.94284/ [SOLVED] - Again, Proxmox not loading WebUI, VMs dead Hi, I need help. This is the second time my Proxmox has died spontaneous for no apparent reason. Las... Proxmox Support Forum   하드웨어 문제일거라고 나와서 확인해보니 proxmox 부팅으로 사용하는 m.2 sata에서  SMART  경고가 발생했습니다.   퇴출시키고 다른걸로 넣어야 겠네요.   달소님 감사합니다.   지연이 기록된 시간의 로그를 확인해보니 아래의 사항이 계속 반복됩니다     May 14 11:45:19 lalawondan kernel: ata1.00: status: { DRDY } May 14 11:45:19 lalawondan kernel: ata1: hard resetting link May 14 11:45:19 lalawondan kernel: ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 310) May 14 11:45:19 lalawondan kernel: ata1.00: configured for UDMA/33 May 14 11:45:19 lalawondan kernel: ata1: EH complete May 14 11:45:20 lalawondan kernel: ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x48c0000 action 0xe frozen May 14 11:45:20 lalawondan kernel: ata1.00: irq_stat 0x04000040, connection status changed May 14 11:45:20 lalawondan kernel: ata1: SError: { CommWake 10B8B LinkSeq DevExch } May 14 11:45:20 lalawondan kernel: ata1.00: failed command: WRITE DMA May 14 11:45:20 lalawondan kernel: ata1.00: cmd ca/00:08:e8:ed:fb/00:00:00:00:00/e0 tag 18 dma 4096 out res 50/00:00:00:00:00/00:00:00:00:00/a0 Emask 0x10 (ATA bus error) 전체 재부팅으로 해결되었습니다. 이놈의 업그레이드 병 때문에....ㅎㅎ 7.1 에서 7.2로 업그레이드 후에 기존 헤놀 DSM7.1이 아래의 에러가 발생하네요. 
* 총 게시글 수 : 4
* 총 댓글 수 : 16
* 추천받은 게시글 개수 : 4
* 추천받은 댓글 개수 : 7
댓글
5
  • 달소
    2022.05.14

    해당시간대에 proxmox log를 보면어떻게나올까요??

    proxmox 가 포럼쪽에서 질답을 많이해주는 편이라 https://forum.proxmox.com/ 쪽에 질문한번 남겨보심이 좋을듯합니다

  • 달소
    koreafood
    작성자
    2022.05.14
    @달소 님에게 보내는 답글

    지연이 기록된 시간의 로그를 확인해보니 아래의 사항이 계속 반복됩니다

     

     

    May 14 11:45:19 lalawondan kernel: ata1.00: status: { DRDY }

    May 14 11:45:19 lalawondan kernel: ata1: hard resetting link

    May 14 11:45:19 lalawondan kernel: ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 310)

    May 14 11:45:19 lalawondan kernel: ata1.00: configured for UDMA/33

    May 14 11:45:19 lalawondan kernel: ata1: EH complete

    May 14 11:45:20 lalawondan kernel: ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x48c0000 action 0xe frozen

    May 14 11:45:20 lalawondan kernel: ata1.00: irq_stat 0x04000040, connection status changed

    May 14 11:45:20 lalawondan kernel: ata1: SError: { CommWake 10B8B LinkSeq DevExch }

    May 14 11:45:20 lalawondan kernel: ata1.00: failed command: WRITE DMA

    May 14 11:45:20 lalawondan kernel: ata1.00: cmd ca/00:08:e8:ed:fb/00:00:00:00:00/e0 tag 18 dma 4096 out

    res 50/00:00:00:00:00/00:00:00:00:00/a0 Emask 0x10 (ATA bus error)

  • koreafood
    작성자
    2022.05.14

    달소님 말씀대로 proxmox 포럼에 가보니 같은 상황이 있네요.

     

    https://forum.proxmox.com/threads/again-proxmox-not-loading-webui-vms-dead.94284/

    Hi, I need help. This is the second time my Proxmox has died spontaneous for no apparent reason. Las...

     

    하드웨어 문제일거라고 나와서 확인해보니

    proxmox 부팅으로 사용하는 m.2 sata에서  SMART  경고가 발생했습니다.

     

    퇴출시키고 다른걸로 넣어야 겠네요.

     

    달소님 감사합니다.

     

  • koreafood
    달소
    2022.05.14
    @koreafood 님에게 보내는 답글

    헉.. SMART 경고라니.. 천만다행이군요!!

    도움이 되셨다니 다행입니다

  • KelvinKang
    2022.05.19

    상황이 생기신분에게는 위추드리지만, 좋은 예가 되는것 같습니다.

     

    하드웨어 문제가 있으므로, 데이터를 써야 하는데 데이터를 쓰지 못하고 IO Delay 가 계속 발생이 되었던거네요.

    하긴 IO Delay 라는건 , VM이 동시에 수십대나 돌아가서 한대의 하드에 저장을 자주 못해서나 생길 상황인데..

    일반적인 상황에서 생기는건... 확실이 이상하긴 하네요..

     

    IO Delay 가 자꾸 나오면 하드웨어를 의심해라 라는 좋은 예가 된 것 같습니다.

댓글 쓰기
권한이 없습니다.