安培微架構

**Nvidia Ampere**
製造工藝	台積電 7 nm（專業）; 三星 8 nm（消費）;
歷史
前代產品	圖靈（消費）; 伏打（專業）;
後繼產品	愛達·勒芙蕾絲（英語：Ada Lovelace (microarchitecture)）（消費）; 霍普（英語：Hopper (microarchitecture)）（專業）;

安培微架構（Ampere）是NVIDIA於2020年5月發佈的一個GPU架構。用以取代圖靈微架構（Turing microarchitecture）。命名為「安培」以向法國物理學家安德烈-馬里·安培（André-Marie Ampère）致敬。Ampere架構擁有電晶體達540億，是三星8nm級晶片。^[1]是世界上電晶體最多的晶片，直到後來被蘋果M1 Max擊敗^[2]。

NVIDIA在 GTC 2022 上宣佈了安培微架構的繼任者霍普微架構（英語：Hopper (microarchitecture)霍普）(Hopper)，並在 2021 年 GPU 技術大會上宣佈了 2024 年發佈的「Ampere Next Next」。

硬件[編輯]

NVIDIA A100 Tensor Core GPU基於NVIDIA Ampere架構，是針對 AI、數據分析和 HPC的GPU。^[3]

DGX A100系統整合8個NVIDIA A100 Tensor Core GPU、有着320GB內存，擁有NVIDIA Mellanox® HDR 200Gbps互連以及5Petaflops 的AI效能。^[4]

DGX SuperPOD是140台DGX A100系統運用MellanoxHDR 200Gbps InfiniBand互連技術組成的一個叢集，AI計算能力達到了700Petaflops。^[5]

NVIDIA EGX™ A100是NVIDIA於2020年5月發佈的基於Ampere架構的一款邊緣AI平台。^[6]

NVIDIA GeForce 30系列
- GeForce RTX 3050
- GeForce RTX 3060
- GeForce RTX 3060Ti
- GeForce RTX 3070
- GeForec RTX 3070Ti
- GeForce RTX 3080 10GB
- GeForce RTX 3080 12GB
- GeForce RTX 3080Ti
- GeForce RTX 3090
- GeForce RTX 3090Ti

核心組態[編輯]


核心代號	GPC	SM/GPC	每個SM含有的各類核心						製程	影像記憶體支援	晶片面積（mm²）	電晶體數（億個）
核心代號	GPC	SM/GPC	單精度浮點核心	雙精度浮點核心	32位元整數核心	張量運算核心	光線追蹤核心	紋理對映單元	製程	影像記憶體支援	晶片面積（mm²）	電晶體數（億個）
GA100	8	16	64	32	64	4	-	4	台積電 7nm	HBM2	826	542
GA102	7	12	128	-			1		三星 8nm	GDDR6X	628	283
GA104	4	12	128	-			1		三星 8nm	GDDR6	393	174

在作為計算卡專用的GA100核心中，和其前身一樣，每個SM中安排有32個雙精度浮點核心；在作為非計算卡使用的GA102等核心中，這些雙精度浮點核心被替換為兩倍數量的單精度浮點核心。由於單精度浮點核心事實上作為絕大多數遊戲的流處理器，因此單個SM表觀流處理器數量達到上一代的2倍，RTX 3070的流處理器數量達到近6千個，接近上代旗艦RTX 2080 Ti；但相應的，用單精度浮點核心模擬雙精度的效率並不高，因此遊戲顯示卡的雙精度浮點計算速度（主要作用於挖礦和深度學習等應用）相較上代並沒有明顯提升。
電晶體密度：GA100使用台積電7nm製程達到約6600萬/mm²，GA102、GA104使用三星8nm製程達到約4500萬/mm²，而上代的圖靈全系列均使用台積電12nm製程，僅達到約2500萬/mm²。
A100顯示卡中每個SM私有的L1/共用內存容量達到了192KB，相比於前代V100顯示卡的128KB增加了1.5倍。

記錄[編輯]

2020年7月，根據MLPerf基準測試結果，NVIDIA宣佈安培打破16項世界紀錄，包括加速器的八項基準測試和叢集DGX SuperPOD的八項。^[7]

參考資料[編輯]

^ 英伟达发布全新数据中心GPU-新浪网. www.finance.sina.com.cn/. 2020-05-19 [2020-08-30]. （原始內容存檔於2022-05-09）（中文（中國大陸））.
^ 存档副本. [2021-10-20]. （原始內容存檔於2022-05-09）.
^ 百度智能云基于全新NVIDIA A100 Tensor Core GPU为客户提供更强AI算力-中国信息网. www.cscaa.org.cn/. 2020-05-15 [2020-08-30]. （原始內容存檔於2021-03-18）（中文（中國大陸））.
^ 性能提升20倍：英伟达GPU旗舰A100登场，全新7nm架构安培出炉 -新浪网. www.tech.sina.com.cn/. 2020-05-15 [2020-08-30]. （原始內容存檔於2020-05-21）（中文（中國大陸））.
^ NVIDIA DGX A100帮助对抗COVID-19-新浪网. www.finance.sina.com.cn/. 2020-05-14 [2020-08-30]. （原始內容存檔於2020-05-21）（中文（中國大陸））.
^ 英伟达正式发布7nm安培GPU：八代史上性能最大飞跃-新浪网. www.tech.sina.com.cn/. 2020-05-14 [2020-08-30]. （原始內容存檔於2020-05-21）（中文（中國大陸））.
^ NVIDIA安培打破16项世界纪录：一年半性能暴增4倍-新浪网. www.tech.sina.com.cn/. 2020-07-30 [2020-08-30]. （原始內容存檔於2020-08-01）（中文（中國大陸））.

外部連結[編輯]

NVIDIA A100 Tensor Core GPU Architecture whitepaper （頁面存檔備份，存於互聯網檔案館）
Nvidia Ampere Architecture （頁面存檔備份，存於互聯網檔案館）
Nvidia A100 Tensor Core GPU （頁面存檔備份，存於互聯網檔案館）
NVIDIA Ampere Architecture In-Depth （頁面存檔備份，存於互聯網檔案館）

[1] 英伟达发布全新数据中心GPU-新浪网. www.finance.sina.com.cn/. 2020-05-19 [2020-08-30]. （原始內容存檔於2022-05-09）（中文（中國大陸））.

[2] 存档副本. [2021-10-20]. （原始內容存檔於2022-05-09）.

[3] 百度智能云基于全新NVIDIA A100 Tensor Core GPU为客户提供更强AI算力-中国信息网. www.cscaa.org.cn/. 2020-05-15 [2020-08-30]. （原始內容存檔於2021-03-18）（中文（中國大陸））.

[4] 性能提升20倍：英伟达GPU旗舰A100登场，全新7nm架构安培出炉 -新浪网. www.tech.sina.com.cn/. 2020-05-15 [2020-08-30]. （原始內容存檔於2020-05-21）（中文（中國大陸））.

[5] NVIDIA DGX A100帮助对抗COVID-19-新浪网. www.finance.sina.com.cn/. 2020-05-14 [2020-08-30]. （原始內容存檔於2020-05-21）（中文（中國大陸））.

[6] 英伟达正式发布7nm安培GPU：八代史上性能最大飞跃-新浪网. www.tech.sina.com.cn/. 2020-05-14 [2020-08-30]. （原始內容存檔於2020-05-21）（中文（中國大陸））.

[7] NVIDIA安培打破16项世界纪录：一年半性能暴增4倍-新浪网. www.tech.sina.com.cn/. 2020-07-30 [2020-08-30]. （原始內容存檔於2020-08-01）（中文（中國大陸））.

[1]

[2]

[3]

[4]

[5]

[6]

[7]