• 돌아가기
  • 아래로
  • 위로
  • 목록
  • 댓글
루머

GPU 대기 시간 비교 : AMD RDNA2가 NVIDIA Ampere를 능가합니다.

달소 달소 24

1

0

출처 : https://news.mydrivers.com/1/751/751950.htm

CPU缓存与内存延迟测试,相信大家都有所耳闻,但是GPU同样的测试却几乎没人做过。Chips And Cheese就做了一...

 

 

모두가 CPU 캐시 및 메모리 지연 테스트에 대해 들어 봤다고 생각하지만 GPU에 대해 동일한 테스트를 수행 한 사람은 거의 없습니다.

Chips And Cheese는 AMD와 NVIDIA GPU 아키텍처의 캐시 및 메모리 대기 시간을 비교하기 위해 특별한 테스트를 수행했습니다.

 

image.png.jpg

 

첫 번째는 AMD RDNA2와 NVIDIA Ampere의 두 가지 최신 아키텍처 간의 경쟁입니다. 대표자는 RX 6900 XT 및 RTX 3090입니다. 전자는 거의 모든 단계에서 승리합니다.

RNDA2 아키텍처는 혁신적으로 Infinity Cache 무제한 캐시를 추가했습니다 . 대역폭을 늘리는 동시에 지연도 현저합니다. 2 단계 캐시 적중률은 Ampere보다 훨씬 낮은 약 20ns의 지연 만 증가시킵니다.

더 놀라운 점은 RDNA2가 Ampere와 거의 동일한 메모리 대기 시간을 가지고 있다는 것입니다. 그러나 Ampere에는 2 단계의 캐시 만 있고 RDNA2에는 4 단계의 캐시가 있다는 것을 잊지 마십시오.

Ampere의 캐시 아키텍처는 더 전통적입니다. SM 어레이의 전용 L1 캐시에서 L2 캐시로의 지연은 100ns 이상 증가하고 RDNA2는 0 레벨 캐시에서 L2 캐시로 약 66ns 만 증가합니다. GA102 코어 영역이 너무 커서 지연이 직접적으로 증가하는 것 같습니다.

이는 AMD RDNA2 아키텍처가 저해상도에서 더 나은 성능과 에너지 효율성을 가지고 있음을 설명 할 수 있습니다. 두 번째 수준 캐시와 세 번째 수준 캐시는 대기 시간이 매우 짧고 더 작은 부하를 수행하는 데 더 적합하기 때문입니다. 반대로 Ampere는 4K 해상도와 같은 높은 부하에서 분명한 이점을 가지고 있습니다.

image.png.jpg

 

 

GPU 간의 비교에 대해 이야기 한 후 GPU와 CPU를 합치는 것은 어떻습니까? RX 6900 XT와 Intel의 4 세대 Core i7-4770을 예로 들어 보겠습니다.

CPU의 캐시는 당연히 한 단계가 아니므로 Y 축에 선형 데이터가 사용됩니다. 전체 프로세스가 RDNA2보다 훨씬 낮은 것을 알 수 있습니다. DDR3-1600 CL9 메모리를 사용하면 지연이 63ns에 불과하며 RX 6900 XT와 GDDR6의 조합은 226ns이고 레벨 캐시의 평균 지연은 각각 53.42ns와 123.2ns입니다.

 

image.png.jpg

 

Maxwell 아키텍처가 적용된 GTX 980 Ti, Pascal 아키텍처가 적용된 GTX 1080, Turing 아키텍처가 적용된 RTX 2060 Mobile을 포함한 이전 세대의 NVIDIA GPU를 살펴보십시오.

Maxwell과 Pascal은 실제로 유사하며, 전자는 전체적으로 약간 더 높으며 이는 더 큰 칩 영역과 더 낮은 코어 주파수 때문일 수 있습니다.

Turing은 이미 Ampere의 모습을하고 있습니다 .1 단계 캐시 대기 시간은 훨씬 낮고 2 단계 캐시는 거의 동일합니다. 이상한 것은 32MB 이후 비디오 메모리 대기 시간이 더 길다는 것입니다. 이유는 알려져 있지 않습니다.

 

image.png.jpg

 

AMD는 TeraScale 아키텍처의 HD 5850/6950, GCN 아키텍처의 HD 7970 및 RX 6900 XT를 조사한 결과, 감소가 점진적으로 진행되고 있으며 모든 수준의 캐시가 동시에 개선되고 있음이 분명합니다.

 

신고공유스크랩
0
1명이 추천

달소 달소
100Lv. 200358P
다음 레벨까지 3662P


메인서버 - Ryzen 5700G / Proxmox 7.2 / Ubuntu / Xpenology / 기타 VM 등등
보조서버 - Intel i9-9900ES(QQC0) / H370M / Proxmox 7.1 / 아직개발용서버로 사용중
백업스토리지서버 - DS920+ 
하드웨어,가상화 등등 여러 IT분야에 관심이 두루두루많습니다만 깊게알고있는건 없습니다 하하하

댓글 쓰기 권한이 없습니다. 로그인

취소 댓글 등록

신고

"님의 댓글"

이 댓글을 신고하시겠습니까?

댓글 삭제

"님의 댓글"

삭제하시겠습니까?


목록

공유

facebooktwitterpinterestbandkakao story
쓰기
태그 : NVIDIA