전자기기,PC,노트북,공유기등 하드웨어 정보 공유
  • 돌아가기
  • 아래로
  • 위로
  • 목록
  • 댓글
질문

proxmox vGPU 할당시 vm에서 인식 & nvidia-smi 사용불가 문제

kmw_ kmw_ 231

0

13

proxmox 8.1.10 / 팰릿 1660ti(6GB) 사용중이고 가이드는

이글에 있는 링크 들어가서 했습니다

 

proxmox 쉘 내에서는 vGPU라고 나오고 정상적으로 4GB가 할당된것 같은데 대상OS(우분투 서버/VM)에서 nvidia-smi를 치면 "NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running."가 나오고 실행이 안됩니다 (vGPU 없이 pci 자체를 패스스루 했을땐 시큐어부트 꺼줘야 인식됐었는데 이건 꺼져있어도 인식이 안됩니다)

 

lspci를 통해서 확인해보면 TU102GL(Quadro RTX 6000/8000)으로 나오는데 적용이 제대로 안된건가요? 

분명 중간에 빠트린것도 없는데 적용이 안되네요..

 

추가) vm 콘솔 들어가면 별도로 로그는 안뜨고 아래 사진처럼만 계속뜹니다

 

 - proxmox shell

image.png.jpg

 

 - nvidia-smi / lspci (vm)

image.png.jpg

 

 

 - vm

image.png.jpg

image.png.jpg


관련영상들 보면서 감 잡아보려 했는데 이해가 안가네요;;

일단 포기했습니다

 

 

신고공유스크랩
13

kmw_ kmw_
15Lv. 4649P
다음 레벨까지 471P

⭐ Main / NAS ::

  - Intel N100

  - DDR4 SO-DIMM 16GB

  - Samsung PM991 NVMe SSD (128GB, OS)

  - Micron MX500 SATA SSD (500GB, VM/LXC)

  - Seagate Ironwolf HDD (2TB, NAS)

  - USB3.0 Ethernet Adapter * 3

 

Sub ::

  - Intel Xeon E5-2650L V2

  - DDR3 ECC REG 48GB

  - KLEVV CRAS C710 NVMe SSD (256GB)

  - WD Green SATA SSD (240GB)

  - PALIT GTX 1660Ti 6GB

  - TP-LINK TX201 PCIe Ethernet Adapter

2등
아흑미쵸 2024.04.21. 12:40

제가 전에 가이드 올릴때 충분한 정보를 못 드리고 proxmox 에서 vGPU 확인만 하고 올려서 죄성합니다

 

테스트 장비

RH2288H V3 + P40 24g

image.png.jpg

 

proxmox 8.1.10 + ubuntu server 22.04 LTS 를 사용 했습니다 - ubuntu 23.10 에서는 오류가 생기네요

 

가이드에 나와 있는 절차

 

게스트 드라이버를 설치하려면 먼저 시스템을 업데이트하세요.

 

==> 추가 : sudo apt install build-essential

 

sudo apt update && sudo apt dist-upgrade

시스템 업데이트 후 Nvidia 드라이버 설치에 필요한 커널 헤더 설치를 진행하세요.

sudo apt install linux-headers-$(uname -r) 

다음으로, Proxmox 측 설치 프로세스의 2단계에서 복사한 라인을 사용하여 Nvidia 드라이버를 다운로드합니다.

 호스트 버전 16.1 용 게스트 드라이버를 사용하고 있습니다 . 여기 에서 올바른 버전을 다운로드하고 있는지 확인하세요. 
wget https://storage.googleapis.com/nvidia-drivers-us-public/GRID/vGPU16.1/NVIDIA-Linux-x86_64-535.104.05-grid.run

다운로드가 완료되면 파일을 실행 가능하게 만들고 다음 명령을 사용하여 설치하십시오.

chmod +x NVIDIA-Linux-x86_64-535.104.05-grid.run
sudo ./NVIDIA-Linux-x86_64-535.104.05-grid.run --dkms

 

==>추가 : 설치 도중 다음과 같이 옵션을 선택합니다.

    • 32비트 바이너리를 설치할지 묻는 메시지가 표시되면 예를 선택합니다.
    • x.org 파일을 수정할지 묻는 메시지가 표시되면 아니요를 선택합니다.

proxmox 

image.png.jpg

ubuntu - VM

image.png.jpg

 

profile image
kmw_ 글쓴이 2024.04.21. 13:20
아흑미쵸
최신버전 받아서 오류가 생긴걸수도 있겠네요, 집가서 다시한번 해봐야겠습니다
profile image
kmw_ 글쓴이 2024.04.21. 19:00
아흑미쵸

처음부터 설치해봤는데 원인 찾은듯합니다
아까 버전이 순간 헷갈려서 최신으로 깔았다고 착각하고 있었는데 22.04였고 1660ti를 패스스루한 상태로 드라이버를 깔아버리고 vgpu로 세팅한거라 드라이버쪽으로 문제가 있었나봅니다

22.04 + 클린설치 해주니깐 정상적으로 잡히네요, 답변 감사합니다 :)

 

- proxmox

image.png.jpg

 

- vm

image.png.jpg

 

profile image
kmw_ 글쓴이 2024.04.21. 22:09
아흑미쵸
성공까진 했는데 문제가 vm을 한개밖에 못키네요 ㅋㅋㅋ..
profile image
kmw_ 글쓴이 2024.04.22. 10:45
아흑미쵸

4+1로 해서 1gb는 여유로 남겨두려고 했는데 아래처럼 뜨고 1개이상은 안켜지더라고요

pci device '0000:03:00.0' has no available instances of 'nvidia-259'
TASK ERROR: could not create mediated device

 

다크모드인데 글 올리니 저렇게 색이 바뀌어버리네요;;

profile image
kmw_ 글쓴이 2024.04.22. 11:37
아흑미쵸

지금까지 찾아보니깐 라이센스 관련밖에 안보여서 그거때문에 안될거라 생각했는데 2+2로 하니깐 잘되네요;;

 

image.png.jpg

profile image
kmw_ 글쓴이 2024.04.21. 13:21
아흑미쵸

저 사이트가 띄어쓰기에 예민(?)한지 붙여쓰면 안뜨더라고요

1660치면 ti까지 된다고 나오긴합니다

IMG_1684.png.jpg

 

댓글 쓰기 권한이 없습니다. 로그인

취소 댓글 등록

cmt alert

신고

"님의 댓글"

이 댓글을 신고하시겠습니까?

댓글 삭제

"님의 댓글"

삭제하시겠습니까?


목록

공유

facebooktwitterpinterestbandkakao story