proxmox 트러블슈팅 질의드립니다
최근 proxmox 호스트가 알 수 없는 이유로 뻗는 증상이 발생하고 있습니다.
호스트에서 사용중인 디스플레이를 모니터에 연결해보아도 화면에 아무것도 나오지 않고 있습니다.
/var/log/syslog를 봐도 죽으면서 따로 남기는 메세지가 없는데 혹시 다른 로그메시지를 참고할만한 게 있을까요?
gvt-g쪽도 의심이 가서 우선 iommu 그룹 다 각개로 풀어주는 acs downstream해제 및 설치하였떤 intel-gpu-tools는 제거하였습니다
조치사항
1. grub의 acs downstream 제거
2. intel-gpu-tools 삭제(gvt-g 사용중)
3. grub에 video=efifb:off video=vesa:off vfio_iommu_type1.allow_unsafe_interrupts=1 kvm.ignore_msrs=1 추가(gvt-g 시 추가하라는 파라미터들)
4. memtest86 진행시 test8에서 8개의 error 발생 -> bios상 메모리 오버 3200으로 고정(DDR 3200 메모리임)
---------------------
우선 상기 진행 후 아직까지는 호스트 중지 없이 잘 살아있습니다. 램 혹은 내장gpu 문제일거 같은데요
찾아보니 10세대는 램 클럭이 2666MHz까지밖에 지원이 안된다고 되어있는데...삼성램 자체가 3200짜리라 2666으로 내려야 할지 아니면 순정램 클럭 그대로 써야할지 모르겠네요(proxmox dmidecode상 3200MT/s 로 조회됨)

달소 2023.01.25. 10:28
memtest에서 에러뜨는게 가장 걸리는데요..
dmesg 로그도 한번 확인해보시면 좋을것같습니다
dmesg 로그도 한번 확인해보시면 좋을것같습니다
달소
memtest는 서버 내리고 다시한번 해봐야할거같아요 dmesg는 별다른 로그가 없는것처럼 보입니다
2등
굿럭 2023.01.25. 11:28
메모리 테스트에서 계속 에러 발생하면 메모리 교체를 해야 할 것으로 보이는데요.. 일단 리부팅 후 메모리 테스트를 먼저 해보시는게 좋을듯 합니다.
굿럭
넵..test8에서 에러 8개가 발생했는데,,발생지점이 500mb, 8gb, 15gb, 23gb , 등등 각 메모리칩셋에서 2개씩 발생하는것처럼 보이더라고요
3등
굿럭 2023.01.27. 16:34
먼저 메모리 테스트 하면서 리부팅은 완료하셨을 걸로 예상되네요. 메모리 오버클럭으로 인한 메모리 에러면 일시적으로 발생했을 가능성이 제일 커 보이네요.
10세대에 CPU에서 2666까지만 지원하면 바이오스 설정 건들지 않을 경우(클럭값 AUTO) 그냥 2666으로 동작할 거 같은데... dmidecode는 벤더에서 입력해 둔 값을 그냥 출력하는 경우도 있어서...
10세대에 CPU에서 2666까지만 지원하면 바이오스 설정 건들지 않을 경우(클럭값 AUTO) 그냥 2666으로 동작할 거 같은데... dmidecode는 벤더에서 입력해 둔 값을 그냥 출력하는 경우도 있어서...
cmt alert