고온으로 인한 서버 비정상 정지시 message 로그 문의
안녕하세요
궁굼한게 있어서 게시글을 작성합니다.
IDC에 있는 서버가 냉각장치 이슈가 있어 고온으로 인해 다운되었다는 사실을 알게 되었습니다.
물론 이를 보고받은게 아니라 직접 이슈를 확인하는 과정에서 IDC쪽에 문의해 보고 알게 되었구요.
제가 로그를 보았을 땐, 물리적 의도적으로 종료한것으로 보입니다.
[linux centos /var/log/message 일부 ]
Nov 28 22:17:51 localhost systemd-logind: Power key pressed.
Nov 28 22:17:51 localhost systemd-logind: Powering Off...
Nov 28 22:17:51 localhost systemd-logind: System is powering down.
Nov 28 22:17:51 localhost systemd: Closed LVM2 poll daemon socket.
Nov 28 22:17:51 localhost systemd: Stopping Session 44335 of user root.
Nov 28 22:17:51 localhost systemd: Stopped Stop Read-Ahead Data Collection 10s After Completed Startup.
Nov 28 22:17:51 localhost systemd: Stopping LVM2 PV scan on device 8:4...
Nov 28 22:17:51 localhost systemd: Stopping Session c1100 of user ro......... (기타 nginx, jenkins 등 순차적 종료 로그 )
갑작스러운 서버 다운이 아니라, graceful shutdown으로 보이거든요.
센터쪽에선 고온으로 인해 종료될 경우 정상 로그가 찍힐 수 도 있다고 얘길 주시는데 갑작스런 다운에 이런 로그가 남는다는게 의아해서요.
고온이 되면 자동 종료되는지 물어봤을땐 그건 아니라고 답변받았습니다.
뭔가 스크립트가 걸려있다면 저럴 수 있겠다고 납득할텐데 그건 아닌것 같고...
서버 3개 중 DB서버와 Web배포용 서버만 저런식으로 종료되었습니다.
여기 전문가분들이 많다보니 경험이 있으실 것 같아 여쭤봅니다.
고온으로 인한 종료시 저런 로그가 발생할까요?
좋은답변을 받기위해서는 좋은 질문이 필요합니다.
유의할점⚠️
- 예의를 지켜주세요. 답변자는 답변을 할 의무는 없습니다.
- 질문에 대한 대부분의 답은 검색으로 찾아보실 수 있습니다.
- 답변자가 답변을 하면서 대개 많은 경우는 다시 질문을 하는 경우가 많이 있습니다.
- (질문의 대한 정보가 부족합니다. ~일 경우 결과물이 어떻게 됩니까? 등등)
질문방법🙏
자신의 상황을 최대한 자세히 설명해주세요.
상황이 정확하고 많을 수록 답변의 정확도가 올라갑니다.
ex) ex) 헤놀로지라면 메인보드 모델 칩셋정보, CPU, 사용한 DSM 버전, 모델, 부수적인 추가 컨트롤러 나 랜카드 등과 어떠한 로더의 이미지를 사용했는지.(arpl-i18n, mshell), 어떤 버전을 사용했는지, 문제가있다면 어떠한것인지 스크린샷을 동반하고 에러의 경우 에러로그를 출력해서 주시면 좋습니다.
*가능하면 최신버전 OS/SW를 이용해주세요
답변에대한 피드백을 주세요.
정보가 질문에 모두 담겨있지않다면 대부분의 답변이 다른정보를 요구합니다.
이러한 답변에 대해 명확한 피드백을 주시면 도움이 됩니다.
없습니다. 해당 세션은 외부에서 root로 로그인한건 아니고 내부 프로그램으로 인해 발생된거로 보여 관련은 없는 것 같네요.
바이오스에서 OS에 직접적으로 shutdown 명령을 내리진 못하기에 물리적 powerkey 이벤트를 발생합니다.
cmt alert