老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

首頁(yè)>焦點(diǎn) > 正文

每日頭條!從A76到A78——在變化中學(xué)習(xí)ARM微架構(gòu)

2023-05-26 16:15:40    出處:面包芯語(yǔ)

一、引言

伴隨智能手機(jī)的高速發(fā)展,移動(dòng)處理器架構(gòu)設(shè)計(jì)廠商ARM公司幾乎每年都更新CPU的核心架構(gòu)。從2018至2020年,ARM公司基于ARMv8架構(gòu)推出了三代Cortex-A76、Cortex-A77、Cortex-A78經(jīng)典CPU核心架構(gòu)。基于這幾代CPU架構(gòu),芯片設(shè)計(jì)廠商也設(shè)計(jì)了多款性能優(yōu)秀的處理器產(chǎn)品。本文從A76微架構(gòu)開(kāi)始學(xué)習(xí),通過(guò)對(duì)比每一代的變化,讓讀者了解處理器微架構(gòu)關(guān)鍵知識(shí)。下表給出了一些基于這三代ARM處理器架構(gòu)的典型處理器產(chǎn)品。


(資料圖)

二、從A76開(kāi)始了解ARM微架構(gòu)

從ARM的A76開(kāi)始,網(wǎng)絡(luò)上可以查詢到較多資料,例如我們可以從wikichip網(wǎng)站(en.wikichip.org)獲取到A76的完整微架構(gòu)框圖。

1. DSU(DynamIQ Shared Unit)

從A75開(kāi)始,ARM提出了一個(gè)新的多核心管理系統(tǒng)單元,叫做DSU。通過(guò)DSU模塊,CPU設(shè)計(jì)者可以隨意擺放不同架構(gòu)的核心并共享L3緩存,減少不同架構(gòu)核心直接傳遞數(shù)據(jù)損耗。在DSU架構(gòu)之前,每個(gè)Cluster需要擺放同架構(gòu)CPU,如將4個(gè)A73處理器放在一個(gè)Cluster中,將4個(gè)A53放在另外一個(gè)Cluster中,這兩個(gè)Cluster的數(shù)據(jù)相互訪問(wèn)會(huì)有一定的連接損耗。

利用DSU模塊,開(kāi)發(fā)者可以隨意設(shè)計(jì)CPU的組合,例如圖中1大+7小,2大+6小,4大+4小,1大+2小,1大+3小,1大+4小等等組合。

2.性能功耗優(yōu)化

架構(gòu)和工藝具有一定的關(guān)聯(lián)性,如A76架構(gòu)設(shè)計(jì)可采用7nm工藝,根據(jù)ARM數(shù)據(jù),基于7nm的A76比基于10nm工藝的A75,性能可提升40%,或同性能下能耗降低50%。可見(jiàn)A76相比上一代的A75的提升較大,后面我們會(huì)詳細(xì)了解架構(gòu)上差異點(diǎn)。

3. 三級(jí)緩存設(shè)計(jì)

A76采用三級(jí)緩存機(jī)制,其中:

L1是核心獨(dú)有緩存,具有獨(dú)立的64KB指令Cache(ICache)和64KB數(shù)據(jù)Cache(DCache);

L2是核心獨(dú)有緩存,可以配置成256KB或者512KB(加錢);

L3是核間共享緩存,在DSU內(nèi)部,可以配置成2MB或者4MB。

多級(jí)流水線系統(tǒng)中,在執(zhí)行分支判斷指令時(shí),系統(tǒng)如果不知道下面走哪一條分支,需要等到分支執(zhí)行出結(jié)果才可以再獲取正確的指令。為了提升流水線性能,現(xiàn)代處理器中提供了一個(gè)分支預(yù)測(cè)單元(BPU),用來(lái)預(yù)測(cè)常用路徑,并提前進(jìn)行指令預(yù)取,確保流水線被填充完整。

A76的BPU和指令Fetch單元獨(dú)立,BPU可以同時(shí)和Fetch單元工作,提前推測(cè)并獲取分支后指令,降低分支預(yù)測(cè)的延遲。

5. 前端設(shè)計(jì)(Front-end)

指令預(yù)取后進(jìn)入一個(gè)解碼隊(duì)列,A76提供了4路decoder,相比A75增加了一路decoder單元,這是性能提升的一個(gè)要素。

6. ROB模塊設(shè)計(jì)

經(jīng)過(guò)譯碼的指令叫做MOP(Macro-Operation),MOP不是實(shí)際執(zhí)行的指令,最終送到執(zhí)行單元的指令叫做uOP(Micro-Operation)。MOP比uOP稍微復(fù)雜一些,可能是多條uOP的組合指令,通過(guò)后端單元的拆解,可以把MOP分解成處理器可以執(zhí)行的最基礎(chǔ)指令uOP,uOP的指令數(shù)量約比MOP多20%。

ROB(ReOrder-Buffer)模塊提供了128個(gè)entry,用來(lái)將指令進(jìn)行重新排序,盡可能填充流水線,這里可以看到A76設(shè)計(jì)的輸入是4路MOP,輸出是8路uOP。

7. 執(zhí)行單元 (Execution Engine)

Dispatch單元將uOP指令發(fā)射到執(zhí)行單元(Issue),執(zhí)行單元提供了120個(gè)entry,分成三類:整型、浮點(diǎn)和讀寫,整型部分包括了1個(gè)分支單元,2個(gè)基礎(chǔ)ALU單元,1個(gè)復(fù)合ALU單元;浮點(diǎn)部分提供了2個(gè)128bit的高級(jí)SIMD指令單元;讀寫部分則提供了2個(gè)AGU(Adress Generation Unit)地址單元。

8. LSU(Load Store Unit)設(shè)計(jì)

LSU模塊和執(zhí)行單元的2個(gè)AGU相連接,同時(shí)連接64KB的L1數(shù)據(jù)緩存(DCache),并提供2個(gè)16B/cycle的load端口和1個(gè)32B/cycle的store端口。

9. 小結(jié)

至此,我們從取指、譯碼、指令分派、指令發(fā)射、指令執(zhí)行到數(shù)據(jù)讀寫,簡(jiǎn)略了解了A76處理器的微架構(gòu),下一節(jié)我們通過(guò)對(duì)比A77和A76架構(gòu)的差異,進(jìn)一步了解ARM微架構(gòu)設(shè)計(jì)的步伐。

三、A77微架構(gòu)和A76對(duì)比

A77微架構(gòu)圖,大家且看且珍惜,因?yàn)樽訟77之后的產(chǎn)品在網(wǎng)絡(luò)上很難找到完整的微架構(gòu)圖了。

1. 性能提升

2. L0緩存(MOP Cache)

A77新引入了MOP Cache模塊,這個(gè)模塊并不是ARM的創(chuàng)新設(shè)計(jì),在PC處理器上已經(jīng)有了,例如Intel在早期的酷睿Sandy Bridge處理器中就加入了uOP Cache模塊。

此外AMD的Zen架構(gòu)也有MOP緩存模塊。

MOP Cache主要用做L0級(jí)別緩存,存儲(chǔ)譯碼過(guò)的MOP指令。MOP Cache的好處是如果在里面找到需要的指令,前面的電路模塊都可以暫時(shí)由MOP Cache來(lái)替代,可以節(jié)省功耗提升性能。ARM數(shù)據(jù)顯示這個(gè)MOP Cache的命中率有85%,可見(jiàn)是A77的一個(gè)非常大的改進(jìn)。

繼續(xù)看下MOP Cache的尺寸,ARM給的尺寸數(shù)據(jù)是1.5K而不是1.5KB,單位不是Byte而是條,考慮到ARM常規(guī)decoded出的機(jī)器碼是32位寬(Aarch64也是32位寬,當(dāng)然也有個(gè)別64位寬指令),推測(cè)這個(gè)L0 Cache的大小應(yīng)該是6KB左右(和Intel的sandy bridge時(shí)一樣)。

移動(dòng)處理器領(lǐng)域引入L0,ARM并不是首家,早在高通的Snapdragon S4時(shí)代就在Krait核心中引入了L0 cache。根據(jù)數(shù)據(jù)顯示1.5K的Cache就可以達(dá)到80-85%的命中率,再增加Cache,提升命中率的邊際效應(yīng)會(huì)越來(lái)越明顯。

3. 前端設(shè)計(jì)(Front-End)

A77相對(duì)于A76的另一個(gè)重要變化是產(chǎn)生MOP指令的能力從原來(lái)的每周期4個(gè)提升到最多6個(gè),但是decode的能力還是保持4個(gè)沒(méi)有變化。可以對(duì)比下整體上fetch和decode的基本架構(gòu)和A76沒(méi)有太大變化,MOP提升的主要原因是新加入的MOP Cache提供的。如果MOP Cache命中,可以繞過(guò)decode模塊最多一次取6條MOP指令,如果不命中回到decode模塊還是一次4條,L0 Cache和Decode進(jìn)行了很好的補(bǔ)充,讓一周期可以提供更多的MOP指令。

4. ROB模塊設(shè)計(jì)

A77相對(duì)A76在執(zhí)行單元上提升了重排序緩沖的大小(ReOrder-Buffer),還記得A76是128-entry,A77提升了25%到160-entry。

另外可以看到輸入是6條MOP,輸出提升到了10條uOP,對(duì)比A76則是8條。據(jù)說(shuō)其他廠商基于ARM定制內(nèi)核時(shí)會(huì)修改這個(gè)部分,隨著ARM內(nèi)核逐步吸收這些優(yōu)秀的設(shè)計(jì),定制ARM內(nèi)核的空間和收益會(huì)越來(lái)越小 。

5. 執(zhí)行單元

A77相比A76在執(zhí)行單元也有比較大的改變:新增加了一路分支單元,將分支預(yù)測(cè)的帶寬提升了一倍;新增了第四個(gè)基礎(chǔ)整型ALU單元,這個(gè)單元可以用一個(gè)周期執(zhí)行簡(jiǎn)單的算術(shù)運(yùn)算或二個(gè)周期執(zhí)行更復(fù)雜運(yùn)算。A77一共4個(gè)整型ALU,其中3個(gè)是基礎(chǔ)整型ALU單元,還有一個(gè)是復(fù)雜整型ALU單元,可以執(zhí)行更復(fù)雜的計(jì)算(例如MAC乘加,DIV除法),A76也有這個(gè)復(fù)雜ALU單元。在整型執(zhí)行單元上,A77相對(duì)A76提升是比較大的,從4個(gè)提升到6個(gè),有50%的提升。

此外,還A76的每個(gè)執(zhí)行單元都有獨(dú)立的發(fā)射列隊(duì),A77則進(jìn)行了一定程度的優(yōu)化,將發(fā)射列隊(duì)(issue queue)統(tǒng)一成三個(gè),整型、浮點(diǎn)和讀寫發(fā)射列隊(duì),由于A77的執(zhí)行單元多,將發(fā)射列隊(duì)統(tǒng)一進(jìn)行管理和分配,可以進(jìn)一步提升執(zhí)行效率。

6. LSU設(shè)計(jì)

A77在Load\Store單元上有兩個(gè)獨(dú)立的地址生成單元AGU,這和A76是一樣的。不同的地方是A77額外增加了兩路Store端口,等于將Store的帶寬增加了一倍。同時(shí)這四路LSU單元也共享一個(gè)發(fā)射隊(duì)列,ARM宣稱這樣可以提升25%的內(nèi)存并發(fā)讀寫性能。

再來(lái)看一下LSU單元,更寬的執(zhí)行單元需要有更寬的LSU支持,A77增大了LSU的load和store buffer,同時(shí)可以支持85級(jí)深度load 操作和90級(jí)深度store操作,總共支持同時(shí)175個(gè)內(nèi)存操作,稍高于指令操作的寬度160,相比A76的LSU深度140,提升了25%。

7. 小結(jié)

最后整理了一個(gè)更詳細(xì)的表格來(lái)對(duì)比A77和A76,A77是ARMv8系列中非常成功的一代,基于A77,產(chǎn)生了如麒麟9000、驍龍865這樣經(jīng)典的產(chǎn)品。

四、A78微架構(gòu)和A77對(duì)比

1. 性能功耗優(yōu)化

2020年,ARM更新了代號(hào)Hercules的A78新架構(gòu),也是ARMv8體系中最后一代中核架構(gòu)。ARM宣傳這一代是“持續(xù)的性能功耗領(lǐng)先”,圖中看到性能提升了20%,工藝從7nm提升到5nm,注意性能提升包含了頻率的15%提升,架構(gòu)的性能提升ARM估計(jì)在7%左右。得益于工藝進(jìn)化到5nm,同樣性能,功耗可以比A77降低50%(2.1GHz相當(dāng)于A77的2.3GHz)。從第二張圖可以看出,A78這一代的主要設(shè)計(jì)目標(biāo)是小幅度提升性能,提升能效并減少芯片面積。

2. A78微架構(gòu)的一些特點(diǎn)

1、L1緩存:ARM提供了32KB緩存的選擇,讓一些注重成本和芯片面積的廠商可以選擇更低的數(shù)據(jù)和指令緩存,默認(rèn)是64KB。

2、分支預(yù)測(cè):分支預(yù)測(cè)的帶寬相對(duì)A77提升了1倍。

3、執(zhí)行單元:增加了一個(gè)MUL單元,允許一個(gè)周期進(jìn)行2個(gè)整型的乘法運(yùn)算(A77是一周期1個(gè))。增加了一個(gè)用于Store的AGU單元,Store的能力從16B/cycle提升到32B/cycle。

A78是ARMv8架構(gòu)最后一代產(chǎn)品,主要是對(duì)前面幾代微架構(gòu)的優(yōu)化,可謂ARMv8架構(gòu)的守門員了。

五、總結(jié)

A78是ARMv8架構(gòu)的最后一代產(chǎn)品,智能手機(jī)依然在高速發(fā)展并快速更新產(chǎn)品,ARM處理器的架構(gòu)也在持續(xù)迭代和更新。2020年,ARM公司提出了對(duì)廠商定制高性能核心的計(jì)劃,并推出了面積更大性能更強(qiáng)的Cortex-X系列核心。2021年,ARM公司推出了全新的ARMv9架構(gòu),目前已經(jīng)有A710、A715等產(chǎn)品接替A78的路線。限于篇幅限制,后續(xù)我會(huì)和大家一起繼續(xù)學(xué)習(xí)X系列和ARMv9架構(gòu)的相關(guān)內(nèi)容。

摘要

1、DSU介紹 https://www.androidauthority.com/arm-dynamiq-need-to-know-770349/

2、A76 wikichip https://en.wikichip.org/wiki/arm_holdings/microarchitectures/cortex-a76

3、A77 wikichip https://en.wikichip.org/wiki/arm_holdings/microarchitectures/cortex-a77

4、A77介紹 https://www.anandtech.com/show/14384/arm-announces-cortexa77-cpu-ip

5、Intel"s Sandy Bridge Architecture Exposed https://www.anandtech.com/show/3922/intels-sandy-bridge-architecture-exposed/2

6、AMD Zen Microarchitecture https://www.anandtech.com/show/10578/amd-zen-microarchitecture-dual-schedulers-micro-op-cache-memory-hierarchy-revealed

7、A78介紹 https://www.anandtech.com/show/15813/arm-cortex-a78-cortex-x1-cpu-ip-diverging

8、A78 wikichip https://en.wikichip.org/wiki/arm_holdings/microarchitectures/cortex-a78

9、A78介紹 https://fuse.wikichip.org/news/3536/arm-unveils-the-cortex-a78-when-less-is-more/

10、ARMv9介紹 https://www.anandtech.com/show/16584/arm-announces-armv9-architecture

關(guān)鍵詞:

相關(guān)內(nèi)容

消費(fèi)
產(chǎn)業(yè)
直擊商品交易痛點(diǎn),中京商品交易市場(chǎng)助力行業(yè)客戶交易無(wú)憂 在當(dāng)前經(jīng)濟(jì)形勢(shì)下,大宗商品交易成為投資者和企業(yè)家們的重要選擇之一。但是,由于大宗
【羽翼豐滿,夢(mèng)想綻放】熱烈慶祝艾珀耐爾天津波音工業(yè)天窗項(xiàng)目順利竣工 捷報(bào):近日,艾珀耐爾科技位于天津?yàn)I海高新區(qū)的波音天窗施工項(xiàng)目圓滿竣工!!這是一次
喬雅登【V-smile】攜深圳陽(yáng)光共探口周能量美學(xué)新思路 5月20日,艾爾建美學(xué)聯(lián)合深圳陽(yáng)光醫(yī)療美容醫(yī)院共同舉辦了喬雅登V-Smile[靈動(dòng)V笑]口周
更適合“中國(guó)寶寶”體質(zhì)的代步小車,全新一代瑞虎3x“真香”! 對(duì)于現(xiàn)代消費(fèi)者來(lái)說(shuō),汽車已經(jīng)是再普遍不過(guò)的存在。畢業(yè)、上班、買車,已經(jīng)成為大部分
基金
老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

      91麻豆精品国产91久久久使用方法 | 国产成a人无v码亚洲福利| 国产视频一区在线观看| 亚洲一区二区三区激情| 日韩免费看网站| 亚洲综合一区二区精品导航| 国产精品影音先锋| 亚洲视频资源在线| 日韩一区二区三区视频| 怡红院av一区二区三区| 国产成人精品aa毛片| 亚洲女与黑人做爰| 欧美成人综合网站| 亚洲mv在线观看| 91久色porny| 欧美做爰猛烈大尺度电影无法无天| 国产日韩欧美精品一区| 另类调教123区 | 洋洋av久久久久久久一区| 国产精品亚洲人在线观看| 亚洲欧美日韩一区二区三区在线观看| 91精品国产综合久久精品图片 | 国产色一区二区| 精品视频在线看| 亚洲毛片av在线| 不卡av在线免费观看| 午夜精品久久久| 国产精品三级视频| 国产suv一区二区三区88区| 一区二区三区毛片| 国产网站一区二区| 国产剧情在线观看一区二区| 亚洲美腿欧美偷拍| 久久久久青草大香线综合精品| 毛片基地黄久久久久久天堂| 中文字幕在线观看不卡视频| 日韩精品一区二区三区四区视频| 丝袜诱惑制服诱惑色一区在线观看| 国产免费成人在线视频| 欧美一区二区视频在线观看| 日韩激情av在线| 国产精品福利一区| 精品对白一区国产伦| 日本欧美在线看| 亚洲欧美偷拍三级| 国产欧美日韩另类一区| 国产91在线看| 欧美在线观看一区| 亚洲国产精品久久艾草纯爱| 国产精品午夜在线| 欧美精品一区二区三区久久久| 精品无人码麻豆乱码1区2区| 亚洲国产一区二区三区青草影视| 国产精品久久久久一区| 波多野洁衣一区| 欧美人伦禁忌dvd放荡欲情| 视频一区二区中文字幕| 亚洲日韩欧美一区二区在线| 国产亚洲欧美色| 国产91丝袜在线观看| 欧美性色aⅴ视频一区日韩精品| 亚洲图片有声小说| 亚洲视频一区在线观看| 国产精品三级在线观看| 91免费在线视频观看| 日韩欧美亚洲国产另类| 国产一区二区三区在线观看免费| 一本一本久久a久久精品综合麻豆| 亚洲精品国产品国语在线app| 久久精品无码一区二区三区| 久久综合九色综合97婷婷女人| 国产a久久麻豆| 欧美精选一区二区| 精品影视av免费| 日本精品一区二区三区四区的功能| 亚洲国产综合91精品麻豆| 亚洲桃色在线一区| 亚洲丝袜自拍清纯另类| 欧美国产精品专区| 中文一区在线播放 | 欧美国产精品劲爆| 91蝌蚪porny| 久久久久成人黄色影片| 99久久精品国产麻豆演员表| 欧美成人精品二区三区99精品| 国产**成人网毛片九色| 欧美一级午夜免费电影| 国产99久久久国产精品免费看| 欧美精品一卡两卡| 国产精品1024| 欧美一级欧美三级在线观看| 丁香五精品蜜臀久久久久99网站 | 久久人人97超碰com| 国产亚洲成年网址在线观看| 91色视频在线| 国产欧美中文在线| 国产丝袜在线精品| 国产精品久久久久9999吃药| 国产精品萝li| 亚洲欧美区自拍先锋| 亚洲免费视频中文字幕| 一区二区欧美视频| 亚洲无线码一区二区三区| 视频一区视频二区中文| 在线亚洲一区二区| 黄网站免费久久| 91精品啪在线观看国产60岁| 粉嫩av一区二区三区| 久久伊人蜜桃av一区二区| 久久五月婷婷丁香社区| 国产精品久久一级| 亚洲美女区一区| 午夜日韩在线观看| 欧美亚洲综合久久| 国产成人综合亚洲91猫咪| 日韩精品一区二区三区视频| 91免费国产在线| 国产精品不卡一区二区三区| ...av二区三区久久精品| 亚洲国产精品麻豆| 欧美亚洲日本国产| 丁香婷婷深情五月亚洲| 久久久一区二区三区| 欧美高清在线视频| 亚洲国产成人精品视频| 欧美午夜免费电影| 不卡视频一二三| 国产精品久久777777| 夜色激情一区二区| 激情文学综合插| wwwwww.欧美系列| 国产精品久久久久桃色tv| 亚洲二区在线视频| 欧美日韩国产精品成人| 99国产精品99久久久久久| 国产精品国产a| 亚洲成人午夜影院| 国产成人av自拍| 欧美激情在线一区二区| 亚洲精品久久7777| 久久99蜜桃精品| 久久只精品国产| 亚洲精品国产一区二区三区四区在线| 奇米色一区二区| 精品国产1区2区3区| 亚洲三级免费电影| 精品一区二区三区在线视频| 久久人人超碰精品| 亚洲精品综合在线| 国内精品自线一区二区三区视频| 欧美精品一区二区三区视频| 亚洲男帅同性gay1069| 激情图片小说一区| 亚洲国产高清在线| 色综合久久综合中文综合网| 成人性生交大片免费| 亚洲视频在线观看一区| 欧美主播一区二区三区| 久久色成人在线| 偷拍一区二区三区| 精品久久久久久亚洲综合网| 亚洲欧美日韩精品久久久久| 黑人巨大精品欧美一区| 国产免费成人在线视频| 午夜a成v人精品| 91免费观看在线| 午夜精品久久久久久久久久久| 日韩一区二区三区精品视频| 综合亚洲深深色噜噜狠狠网站| 国产在线乱码一区二区三区| 国产精品国产自产拍高清av王其| 一本色道久久综合亚洲91| 91免费观看国产| 日本午夜精品视频在线观看| 国产亚洲污的网站| 91福利视频在线| 欧美激情综合网| 极品瑜伽女神91| 亚洲欧洲制服丝袜| 欧美一区二区不卡视频| 亚洲女人****多毛耸耸8| 风间由美一区二区三区在线观看| 一区二区三区不卡在线观看| 日韩三级高清在线| 亚洲国产精品久久久久婷婷884 | 亚洲伦理在线精品| 国产精品欧美一区二区三区| 蜜臀久久99精品久久久久宅男| 亚洲国产精品高清| 欧美麻豆精品久久久久久| 亚洲欧美综合色| 丁香网亚洲国际| 视频一区二区中文字幕| 国产日韩精品视频一区| 欧美性大战xxxxx久久久| 国产精品日韩精品欧美在线| 国产传媒一区在线| 亚洲第一成人在线| 中文字幕欧美国产| 51午夜精品国产|