Nvidia Ampere製造工藝 | |
---|
歷史 |
---|
前代產品 | |
---|
後繼產品 | |
---|
安培微架構(Ampere)是NVIDIA於2020年5月發佈的一個GPU架構。用以取代圖靈微架構(Turing microarchitecture)。命名為「安培」以向法國物理學家安德烈-馬里·安培(André-Marie Ampère)致敬。Ampere架構擁有電晶體達540億,是三星8nm級晶片。[1]是世界上電晶體最多的晶片,直到後來被蘋果M1 Max擊敗[2]。
NVIDIA在 GTC 2022 上宣佈了安培微架構的繼任者霍普微架構(Hopper),並在 2021 年 GPU 技術大會上宣佈了 2024 年發佈的「Ampere Next Next」。
- NVIDIA A100 Tensor Core GPU基於NVIDIA Ampere架構,是針對 AI、數據分析和 HPC的GPU。[3]
- DGX A100系統整合8個NVIDIA A100 Tensor Core GPU、有着320GB內存,擁有NVIDIA Mellanox® HDR 200Gbps互連以及5Petaflops 的AI效能。[4]
- DGX SuperPOD是140台DGX A100系統運用MellanoxHDR 200Gbps InfiniBand互連技術組成的一個叢集,AI計算能力達到了700Petaflops。[5]
- NVIDIA EGX™ A100是NVIDIA於2020年5月發佈的基於Ampere架構的一款邊緣AI平台。[6]
- NVIDIA GeForce 30系列
- GeForce RTX 3050
- GeForce RTX 3060
- GeForce RTX 3060Ti
- GeForce RTX 3070
- GeForec RTX 3070Ti
- GeForce RTX 3080 10GB
- GeForce RTX 3080 12GB
- GeForce RTX 3080Ti
- GeForce RTX 3090
- GeForce RTX 3090Ti
核心組態[編輯]
核心代號
|
GPC
|
SM/GPC
|
每個SM含有的各類核心
|
製程
|
影像記憶體支援
|
晶片面積(mm2)
|
電晶體數(億個)
|
單精度浮點核心
|
雙精度浮點核心
|
32位元整數核心
|
張量運算核心
|
光線追蹤核心
|
紋理對映單元
|
GA100
|
8
|
16
|
64
|
32
|
64
|
4
|
-
|
4
|
台積電 7nm
|
HBM2
|
826
|
542
|
GA102
|
7
|
12
|
128
|
-
|
1
|
三星 8nm
|
GDDR6X
|
628
|
283
|
GA104
|
4
|
GDDR6
|
393
|
174
|
- 在作為計算卡專用的GA100核心中,和其前身一樣,每個SM中安排有32個雙精度浮點核心;在作為非計算卡使用的GA102等核心中,這些雙精度浮點核心被替換為兩倍數量的單精度浮點核心。由於單精度浮點核心事實上作為絕大多數遊戲的流處理器,因此單個SM表觀流處理器數量達到上一代的2倍,RTX 3070的流處理器數量達到近6千個,接近上代旗艦RTX 2080 Ti;但相應的,用單精度浮點核心模擬雙精度的效率並不高,因此遊戲顯示卡的雙精度浮點計算速度(主要作用於挖礦和深度學習等應用)相較上代並沒有明顯提升。
- 電晶體密度:GA100使用台積電7nm製程達到約6600萬/mm2,GA102、GA104使用三星8nm製程達到約4500萬/mm2,而上代的圖靈全系列均使用台積電12nm製程,僅達到約2500萬/mm2。
- A100顯示卡中每個SM私有的L1/共用內存容量達到了192KB,相比於前代V100顯示卡的128KB增加了1.5倍。
2020年7月,根據MLPerf基準測試結果,NVIDIA宣佈安培打破16項世界紀錄,包括加速器的八項基準測試和叢集DGX SuperPOD的八項。[7]
參考資料[編輯]
外部連結[編輯]