久久国产av,国产激情欧美有码,亚洲国产综合精品2020,国产无套粉嫩白浆内精

amd新cpu被11代酷睿性能碾壓(AMD新系列的cpu為什么叫“推土機(jī)”?)

2023-03-06 12:59:02 數(shù)碼極客 7706次閱讀 投稿:夢(mèng)里人

本篇文章給大家談?wù)刟md新cpu,以及amd新cpu被11代酷睿性能碾壓對(duì)應(yīng)的知識(shí)點(diǎn),希望對(duì)各位有所幫助,不要忘了收藏本站喔。

2021年amd最新cpu

2021年amd最新cpu有3500x、3600、5600x、5800x、5900x、5950x。其中2021年amd性價(jià)比高的cpu有3600、5600X和5800X。

amdcpu最新是幾代

近年來(lái),在服務(wù)器和數(shù)據(jù)中心等企業(yè)級(jí)市場(chǎng),AMD憑借持續(xù)更新的“Zen”架構(gòu),其EPYC(霄龍)系列處理器的市場(chǎng)占有率上升勢(shì)頭非常迅猛。2022年11月,AMD推出全新第四代EPYC處理器。新處理器將單插槽處理器核心數(shù)量提升到最多96核,并且采用了最新的“Zen 4”架構(gòu),帶來(lái)大量全新特性。接下來(lái),本文就對(duì)第四代EPYC處理器進(jìn)行詳細(xì)解讀。

第四代EPYC處理器:EPYC 9004系列登場(chǎng)

在解析AMD第四代EPYC處理器的架構(gòu)之前,我們先來(lái)梳理一下它的型號(hào)定義,因?yàn)樵谶@方面它與上代產(chǎn)品存在顯著差異。

此前,AMD采用EPYC 7000系列作為原始命名。最后一位數(shù)代表不同代次,比如EPYC 7001、EPYC 7002和EPYC 7003就分別代表三代不同的產(chǎn)品,其中又包含大量細(xì)分型號(hào)。在第四代EPYC處理器上,AMD改用了EPYC 9004作為產(chǎn)品基礎(chǔ)代號(hào),這可能是考慮到本代產(chǎn)品具備極為顯著的性能提升。同時(shí),在大多數(shù)人的概念中,“9”相比“7”顯得定位更高、性能更強(qiáng)。第二位數(shù)字代表處理器核心數(shù)量,其基本對(duì)應(yīng)關(guān)系如下表:

?

第三位數(shù)字代表性能情況,數(shù)字越大則性能越強(qiáng),目前由2~7的不同數(shù)字組成。如果AMD愿意,未來(lái)還可能進(jìn)一步擴(kuò)展到9。最后一位數(shù)字則固定為“4”,代表第四代EPYC處理器。

?打開APP查看高清大圖

▲AMD詳細(xì)解讀了EPYC 9004產(chǎn)品命名情況

?打開APP查看高清大圖

▲AMD將EPYC 9004產(chǎn)品分為了三類:追求核心密度的產(chǎn)品、追求平衡和優(yōu)化的性能的產(chǎn)品以及追求核心性能的產(chǎn)品。

AMD本次發(fā)布了18款EPYC 9004系列處理器,分為3個(gè)大類,分別是追求核心密度的產(chǎn)品、追求平衡和優(yōu)化的性能的產(chǎn)品以及追求核心性能的產(chǎn)品,具體規(guī)格見下表。

?打開APP查看高清大圖

?打開APP查看高清大圖

▲EPYC 9004、EPYC 7003、英特爾第12代酷睿、銳龍7000以及英特爾第11代酷睿處理器(從左到右)的外觀對(duì)比,可以看到EPYC 9004大了不少。

計(jì)算和擴(kuò)展的領(lǐng)先地位:EPYC 9004技術(shù)架構(gòu)一覽

毫不夸張地說(shuō),EPYC 9004是目前市面上最先進(jìn)的企業(yè)級(jí)產(chǎn)品之一。它在CPU架構(gòu)、Chiplet應(yīng)用以及互聯(lián)方式上,幾乎都是當(dāng)前技術(shù)條件下所能達(dá)到的極致。這一次,AMD在超大規(guī)模的企業(yè)級(jí)產(chǎn)品研發(fā)上進(jìn)入了一個(gè)新的層次,短時(shí)間內(nèi),能超越它的只有AMD自己的下一代產(chǎn)品。

設(shè)計(jì)目標(biāo):擁有擴(kuò)展和計(jì)算性能的優(yōu)勢(shì)地位

?

▲AMD EPYC 9004的設(shè)計(jì)理念

按照慣例,我們先來(lái)看看EPYC 9004的設(shè)計(jì)理念和實(shí)現(xiàn)情況。AMD EPYC 9004的設(shè)計(jì)理念就是繼續(xù)保持計(jì)算性能和擴(kuò)展能力的優(yōu)勢(shì)地位。AMD分四個(gè)方面進(jìn)行了闡述:首先是擁有最先進(jìn)的單核心性能和單插槽性能,這依靠最新的Zen 4架構(gòu)和5nm工藝實(shí)現(xiàn);其次是配備超大的內(nèi)存帶寬和容量,這依靠12通道的DDR5內(nèi)存來(lái)實(shí)現(xiàn);第三是采用全新的下一代IO接口,這包括最大160通道的PCIe 5.0控制器以及可以利用CXL協(xié)議擴(kuò)展的內(nèi)存尋址功能等;第四則是加密計(jì)算方面的新進(jìn)展,主要通過(guò)CXL以及2倍的SEV-SNP功能來(lái)實(shí)現(xiàn)。

?

▲EPYC 9004和上代產(chǎn)品的性能比較情況

根據(jù)AMD官方數(shù)據(jù)顯示,和EPYC 7003系列的頂級(jí)型號(hào)EPYC 7763相比,EPYC 9004系列中的頂級(jí)型號(hào)EPYC 9654能夠在云端、HPC和企業(yè)級(jí)性能方面分別領(lǐng)先107%、123%以及94%。AMD宣稱第四代EPYC處理器是全世界最好的數(shù)據(jù)中心處理器,擁有最快的數(shù)據(jù)中心性能、領(lǐng)先的能源效率、優(yōu)秀的TCO表現(xiàn)、安全的加密計(jì)算能力以及豐富的生態(tài)系統(tǒng)。

?

▲AMD EPYC 9004的宏觀布局

為了達(dá)到這些設(shè)計(jì)要求,EPYC 9004在結(jié)構(gòu)上依舊采用了Chiplet設(shè)計(jì),布局在中間的是全新設(shè)計(jì)的IO芯片,周圍的CCD單元數(shù)量增加到12個(gè)。每個(gè)CCD中依舊包含了8個(gè)CPU核心和相應(yīng)的緩存,以及32MB L3緩存。EPYC 9004核心數(shù)量大增的原因是CCD數(shù)量從上代產(chǎn)品的最多8個(gè)增加到了最多12個(gè),這使得它最多能提供96核心192線程。

Zen 4架構(gòu):IPC提升14%

AMD在企業(yè)級(jí)產(chǎn)品和消費(fèi)級(jí)產(chǎn)品上采用了同樣的核心微架構(gòu):EPYC 9004和桌面銳龍7000系列都是最新的Zen 4架構(gòu)。有關(guān)Zen 4架構(gòu),本刊在之前銳龍7000首發(fā)文章中曾有過(guò)介紹,本文再簡(jiǎn)單回顧一下。

?

▲Zen 4微架構(gòu)及改進(jìn)一覽

AMD Zen 4架構(gòu)是基于Zen 3架構(gòu)改進(jìn)而來(lái),在架構(gòu)設(shè)計(jì)上,AMD希望實(shí)現(xiàn)更高的性能、更低的延遲和更好的能效比。其中性能的提升來(lái)自頻率和IPC的提升;更低的延遲主要是提升了緩存的性能并且降低了整個(gè)架構(gòu)的平均延遲;能效比方面則通過(guò)新設(shè)計(jì)、新工藝以及將移動(dòng)端的一些技術(shù)移植在桌面端,降低了整個(gè)CPU的動(dòng)態(tài)功耗。

?

▲Zen 4架構(gòu)相比Zen 3架構(gòu)的重要提升

具體來(lái)看,Zen 4架構(gòu)在分支預(yù)測(cè)、Op緩存、指令排序相關(guān)窗口、整數(shù)或浮點(diǎn)寄存器、每核心更深的緩沖區(qū)、后端讀取和加載等方面進(jìn)行了優(yōu)化。特別的變化是另外加入對(duì)AVX-512指令集的支持,以及重新調(diào)整的每核心1MB、8-way L2緩存。

前端方面,分支預(yù)測(cè)部分有大幅加強(qiáng)。AMD使用了一個(gè)更強(qiáng)有力的分支預(yù)測(cè)單元,每周期可以執(zhí)行2次分支預(yù)測(cè)。此外,L1分支目標(biāo)緩沖區(qū)的容量提升了50%,達(dá)到1.5K條目,L2分支目標(biāo)緩沖區(qū)則達(dá)到7K。Zen 4還擁有更大的Op緩存、更大的指令回寫隊(duì)列,它們?cè)诤艽蟪潭壬咸嵘颂幚砥鞯那岸?#24615;能。

執(zhí)行單元部分,Zen 4沒有提升執(zhí)行單元的數(shù)量,而是持續(xù)增大重排緩沖區(qū)。它增加了浮點(diǎn)/整數(shù)寄存器的體積,整數(shù)從192增加至224,浮點(diǎn)從160增加至192,核心緩沖區(qū)達(dá)到320條目。執(zhí)行單元方面依舊是每周期10個(gè)INT和6個(gè)FP。

后端的讀取和加載部分,Zen 4擁有更大的讀取排序單元,更少的緩存端口沖突以及增大50%的L2 DTLB。另外依舊擁有每周期3個(gè)內(nèi)存操作,最多每周期3個(gè)讀取和2個(gè)寫入。

緩存方面,最明顯的改變是每個(gè)核心的L2緩存翻倍到1MB,這樣可以降低CPU核心的未命中率并提升命中率,同時(shí)也降低了從L3和內(nèi)存讀取數(shù)據(jù)的幾率。但是由于L2緩存增大,延遲也相應(yīng)提升,L2和L3的延遲分別增加到最多14個(gè)周期和最多50個(gè)周期。

?

▲AMD在Zen 4上設(shè)計(jì)了全新的AVX-512引擎,和英特爾的路線有巨大差異。

在指令集方面,Zen 4實(shí)現(xiàn)了對(duì)AVX-512指令集的支持。Zen 4采用了2個(gè)AVX 256來(lái)合并執(zhí)行1個(gè)AVX-512,而英特爾采用了獨(dú)立的AVX512 SIMD核心。AMD的設(shè)計(jì)可以節(jié)省晶體管資源,并且不需要降低頻率來(lái)運(yùn)行AVX-512。但是當(dāng)同時(shí)執(zhí)行AVX2和AVX-512的時(shí)候,則必須完成一個(gè)后再執(zhí)行另一個(gè)。AVX-512比之前Zen架構(gòu)多核心執(zhí)行FP32的工作效能提升了30%。此外,Zen 4也實(shí)現(xiàn)了對(duì)BF16數(shù)據(jù)格式的支持,這是AI計(jì)算中新興的一種重要數(shù)據(jù)格式。

?

▲在啟用AVX-512后,相關(guān)性能得到了巨大提升。

根據(jù)AMD官方數(shù)據(jù)顯示,在支持AVX-512后,使用2路EPYC 9654(192核心)對(duì)比2路EPYC 7763(128核心),在NLP、圖像識(shí)別以及物體檢測(cè)的吞吐量測(cè)試中,前者的領(lǐng)先幅度分別達(dá)到4.2倍、3倍和3.5倍。

AMD還給出了Zen 4相比Zen 3的性能改進(jìn)情況??偟膩?lái)看,Zen 4有大約14%的IPC提升。其中貢獻(xiàn)最大的是前端的改進(jìn),其次是存儲(chǔ)和加載部分,再次是分支預(yù)測(cè)部分,執(zhí)行部分和L2部分的改進(jìn)帶來(lái)的性能增幅則相對(duì)較小。在發(fā)布銳龍7000系列的時(shí)候,AMD給出的IPC提升數(shù)據(jù)是13%,所以這里提到的14%應(yīng)該是根據(jù)服務(wù)器所面向的不同負(fù)載重新測(cè)試而來(lái)。

?

▲AMD Zen 4架構(gòu)在服務(wù)器端取得了14%的IPC提升

最后再來(lái)看看安全方面的內(nèi)容。Zen 4架構(gòu)目前支持安全加密的虛擬化,包括SEV-ES、SEV-SNP,內(nèi)存加密支持AES-256-XTS,支持最多1006個(gè)加密的客戶機(jī)以及多主機(jī)秘鑰SMKE。此外,它還支持虛擬化X2APIC、免SMT攻擊和額外的SPEC_CTL功能等。

12通道DDR5內(nèi)存

每核心帶寬至少比上代產(chǎn)品提升50%

所有EPYC 9004系列處理器都支持12通道DDR5內(nèi)存,相比上代支持的8通道DDR4內(nèi)存有巨大進(jìn)步。從內(nèi)存帶寬來(lái)看,DDR5的使用在很大程度上緩解了超多核心處理器內(nèi)存帶寬不足的情況。

?

▲AMD在EPYC 9004上全面啟用DDR5內(nèi)存

舉例來(lái)說(shuō),上代EPYC 7763擁有64個(gè)核心128線程,支持8通道DDR4內(nèi)存,內(nèi)存總帶寬為204.8GB/s,平均每核心3.2GB/s。新一代的EPYC 9654擁有96核心192線程,支持12通道DDR5內(nèi)存,內(nèi)存總帶寬為460.8GB/s,平均每核心4.8GB/s。EPYC 9654在處理器核心數(shù)量更多的情況下,每核心內(nèi)存帶寬提升了50%。如果是48核心或者32核心產(chǎn)品,每核心內(nèi)存帶寬的提升會(huì)更大,這為內(nèi)存帶寬敏感型應(yīng)用帶來(lái)了極為不錯(cuò)的性能提升空間。

?

▲EPYC 9004的內(nèi)存架構(gòu)和特性一覽

從AMD官方給出的實(shí)際測(cè)試數(shù)據(jù)來(lái)看,EPYC 7003系列的實(shí)際內(nèi)存帶寬大約為154GB/s,EPYC 9004則高達(dá)356GB/s,是前代產(chǎn)品的大約2.3倍。延遲方面,由于EPYC 9004支持的DDR5內(nèi)存容量更大、通道數(shù)量更多,因此延遲有所上升。EPYC 9004的SoC延遲大約在73ns左右,設(shè)備延遲大約是45ns左右,因此總延遲在118ns左右,而EPYC 7003的對(duì)應(yīng)數(shù)據(jù)分別是70ns、35ns和105ns。從整體上來(lái)看,EPYC 9004的延遲略高,但是考慮到它擁有更大的帶寬,這一點(diǎn)是完全可以接受的。

?

▲EPYC 9004的內(nèi)存性能情況

在內(nèi)存容量方面,所有EPYC 9004系列處理器都支持高達(dá)6TB容量。不過(guò)目前AMD只給出了1DPC(DIMM Per Channel),也就是12個(gè)內(nèi)存通道、12條內(nèi)存插槽下的配置情況,內(nèi)存最高支持12通道的DDR5 4800。至于2DPC配置,AMD宣稱會(huì)在2023年第一季度再公布詳細(xì)信息。不過(guò)考慮到EPYC 9004不小的面積,12通道DDR5內(nèi)存插槽所占的體積以及接近400W的CPU供電所需要的PCB面積,未來(lái)出現(xiàn)24通道、48插槽的2DPC主板的可能性較低,并且6TB內(nèi)存對(duì)大多數(shù)應(yīng)用場(chǎng)景來(lái)說(shuō)已經(jīng)足夠了。

?

▲EPYC 9004設(shè)計(jì)有內(nèi)存分區(qū)管理

最后再來(lái)看看內(nèi)存分區(qū)。由于EPYC 9004系列處理器的規(guī)模很大,因此AMD也提供了NUMA域的管理和設(shè)置,使得用戶可以在某些情況下對(duì)內(nèi)存和核心進(jìn)行調(diào)配。它包括了NPS1、NPS2和NPS4三種分區(qū)方式:NPS1就是整個(gè)處理器;NPS2是將處理器分為2個(gè)部分,每個(gè)部分有6個(gè)內(nèi)存通道和6個(gè)GMI3接口;NPS4則是將處理器分為4個(gè)部分。

IO芯片和總線連接系統(tǒng):采用最新的GMI3連接

AMD在EPYC 9004上繼續(xù)采用大獲成功的Chiplet方案。整個(gè)處理器除了CCD之外,還有一個(gè)IO芯片。EPYC 9004的CCD由臺(tái)積電5nm工藝制造,這也是首個(gè)使用5nm工藝的企業(yè)級(jí)CPU產(chǎn)品。IO芯片也采用了臺(tái)積電6nm工藝制造。

?

▲EPYC 9004架構(gòu)簡(jiǎn)圖和特性一覽

因?yàn)镋PYC系列一直采用Chiplet方案,因此在CCD和IO芯片之間需要通信協(xié)議予以連接。上一代EPYC處理器采用的是GMI2總線,其IO芯片內(nèi)部有8個(gè)GMI2總線端口,因此總共能支持8個(gè)CCD單元連接,每個(gè)CCD擁有2個(gè)GMI總線接口,可以根據(jù)需要進(jìn)行配置。

?

▲EPYC 9004的Chiplet連接圖一覽

EPYC 9004升級(jí)為GMI3總線。其中Zen 4架構(gòu)的8個(gè)CCD和12個(gè)CCD采用的是每個(gè)CCD與1個(gè)GMI3總線互聯(lián),4個(gè)CCD架構(gòu)中每個(gè)CCD通過(guò)2個(gè)GMI3總線進(jìn)行互聯(lián),從而實(shí)現(xiàn)

AMD新系列的cpu為什么叫“推土機(jī)”?

該系列的CPU的架構(gòu)是推土機(jī),所以基于這個(gè)架構(gòu)的處理器都叫推土機(jī)。

推土機(jī)是美國(guó)AMD公司徹底重新設(shè)計(jì)的CPU架構(gòu);

在2011年10月正式推出,面向高端發(fā)燒級(jí)用戶;

擁有DDR3-1866MHz原生內(nèi)存支持、XOP指令集、模塊化設(shè)計(jì)等多項(xiàng)新特性,全面取代羿龍II系列處理器;

推土機(jī)屬于AMD Family 15h。這是K8架構(gòu)之后開始使用的新型序列。

聲明:各百科所有作品(圖文、音視頻)均由用戶自行上傳分享,僅供網(wǎng)友學(xué)習(xí)交流。若您的權(quán)利被侵害,請(qǐng)聯(lián)系: [email protected]