投影時代首頁 > 高清播放機 >> 技術(shù)介紹 > 正文

搜索新聞

藍(lán)天使

品牌專區(qū)：公司介紹 | 聯(lián)系方式 | 資訊

藍(lán)天使官方網(wǎng)站

藍(lán)天使Q9 ARM11處理器架構(gòu)解析

來源：投影時代　更新日期：2010-03-18 作者：pjtime資訊組

CES消費電子展專題報道年度評選盛典獲獎揭曉

　　ARM11系列微處理器是ARM公司近年推出的新一代RISC處理器，它是ARM新指令架構(gòu)——ARMv6的第一代設(shè)計實現(xiàn)。該系列主要有ARM1136J，ARM1156T2和ARM1176JZ三個內(nèi)核型號，分別針對不同應(yīng)用領(lǐng)域。

　　實現(xiàn)新一代微處理器的第一步就是訂立一個新的結(jié)構(gòu)體系。這里所說的結(jié)構(gòu)體系只是對處理器行為進(jìn)行描述，并不包括具體地指定處理器是如何被建造的。結(jié)構(gòu)體系的定義提供了處理器和外界（操作系統(tǒng)，應(yīng)用程序和調(diào)試支持）的接口，從細(xì)節(jié)上說，處理器結(jié)構(gòu)體系定義了指令集、編程模式和最近的存儲器之間的接口。最新的ARM處理器架構(gòu)—ARMv6，發(fā)布于2001年10月，它建立于過去十年ARM許多成功的結(jié)構(gòu)體系基礎(chǔ)上。同處理器的授權(quán)相似，ARM也向客戶授權(quán)它的結(jié)構(gòu)體系。比如，Intel的XScale就是基于ARMv5TE的處理器。

　　ARMv6架構(gòu)是根據(jù)下一代的消費類電子、無線設(shè)備、網(wǎng)絡(luò)應(yīng)用和汽車電子產(chǎn)品等需求而制定的。ARM11的媒體處理能力和低功耗特點，特別適用于無線和消費類電子產(chǎn)品；其高數(shù)據(jù)吞吐量和高性能的結(jié)合非常適合網(wǎng)絡(luò)處理應(yīng)用；另外，也在實時性能和浮點處理等方面ARM11可以滿足汽車電子應(yīng)用的需求。可以預(yù)言，基于AMRv6體系結(jié)構(gòu)的ARM11系列處理器將在上述領(lǐng)域發(fā)揮巨大的作用。

　　對于各種無線移動應(yīng)用，毫無節(jié)制的提供高性能處理器是無用的。同成本控制類似，功耗的控制也是一個重要因素。ARM11系列處理器展示了在性能上的巨大提升，首先推出350M~500MHz時鐘頻率的內(nèi)核，在未來將上升到1GHz時鐘頻率ARM11處理器在提供高性能的同時，也允許在性能和功耗間做權(quán)衡以滿足某些特殊應(yīng)用。通過動態(tài)調(diào)整時鐘頻率和供應(yīng)電壓，開發(fā)者完全可以控制這兩者的平衡。在0.13um工藝，1.2v條件下，ARM11處理器的功耗可以低至0.4mW/MHz。ARM11處理器同時提供了可綜合版本和半定制硬核兩種實現(xiàn)。可綜合版本可以讓客戶根據(jù)自己的半導(dǎo)體工藝開發(fā)出各有特色的處理器內(nèi)核，并保持足夠靈活性。ARM實現(xiàn)的硬核則是為了滿足那些極高性能和速度要求的應(yīng)用，同時為客戶節(jié)省實現(xiàn)的成本和時間。為了讓客戶更方便地走完實現(xiàn)流程，ARM11處理器采用了易于綜合的流水線結(jié)構(gòu)，并和常用的綜合工具以及RAM compiler良好結(jié)合，確保了客戶可以成功并迅速的達(dá)到時序收斂。目前已有的ARM11處理器在不包含Cache的情況下面積小于2.7mm2，對于當(dāng)前復(fù)雜的SoC設(shè)計來說，如此小的die size對芯片成本的降低是極其重要的。ARM11處理器在很多方面為軟件開發(fā)者帶來便利。一方面，它包含了更多的多媒體處理指令來加速視頻和音頻處理；另一方面，它的新型存儲器系統(tǒng)進(jìn)一步提高了操作系統(tǒng)的性能；此外，還提供了新指令來加速實時性能和中斷的響應(yīng)。再次，目前有很多應(yīng)用要求多處理器的配置（多個ARM內(nèi)核，或ARM+DSP的組合），ARM11處理器從設(shè)計伊始就注重更容易地與其他處理器共享數(shù)據(jù)，以及從非ARM的處理器上移植軟件。此外，ARM還開發(fā)了基于ARM11系列的多處理器系統(tǒng)——MPCORE（由二個到四個ARM11內(nèi)核組成）。

　　ARM11處理器的超強性能是由一系列的架構(gòu)特點所決定的。

　　ARMv6—決定性能的基礎(chǔ)

　　ARMv6架構(gòu)決定了可以達(dá)到高性能處理器的基礎(chǔ)�？偟膩碚f，ARMv6架構(gòu)通過以下幾點來增強處理器的性能：

　　1.多媒體處理擴(kuò)展使MPEG4編碼/解碼加快一倍

　　音頻處理加快一倍

　　2.增強的Cache結(jié)構(gòu)

　　實地址Cache4

　　減少Cache的刷新和重載

　　減少上下文切換的開銷

　　3.增強的異常和中斷處理使實時任務(wù)的處理更加迅速

　　4.支持Unaligned和Mixed-endian數(shù)據(jù)訪問使數(shù)據(jù)共享、軟件移植更簡單，也有利于節(jié)省存儲器空間

　　對絕大多數(shù)應(yīng)用來說，ARMv6保持了100%的二進(jìn)制向下兼容，使用戶過去開發(fā)的程序可以進(jìn)一步繼承下去。ARMv6保持了所有過去架構(gòu)中的T（Thumb指令）和E（DSP指令）擴(kuò)展，使代碼壓縮和DSP處理特點得到延續(xù)；為了加速Java代碼執(zhí)行速度的ARM Jazalle技術(shù)也繼續(xù)在ARMv6架構(gòu)中發(fā)揮重要作用。

　　ARM11處理器是為了有效的提供高性能處理能力而設(shè)計的。在這里需要強調(diào)的是，ARM并不是不能設(shè)計出運行在更高頻率的處理器，而是，在處理器能提供超高性能的同時，還要保證功耗、面積的有效性。ARM11優(yōu)秀的流水線設(shè)計是這些功能的重要保證。

　　ARM11處理器的流水線和以前的ARM內(nèi)核不同，它由8級流水線組成，比以前的ARM內(nèi)核提高了至少40%的吞吐量。8級流水線可以使8條指令同時被執(zhí)行。

　　從通常的角度說，過長的流水線往往會削弱指令的執(zhí)行效率。一方面，如果隨后的指令需要用到前面指令的執(zhí)行結(jié)果作為輸入，它就需要等到前面指令執(zhí)行完。ARM11處理器通過forwarding來避免這種流水線中的數(shù)據(jù)沖突，它可以讓指令執(zhí)行的結(jié)果快速進(jìn)入到后面指令的流水線中。另一方面，如果指令執(zhí)行的正常順序被打斷（如出現(xiàn)跳轉(zhuǎn)指令），普通流水線處理器往往要付出更大的代價，ARM11通過實現(xiàn)跳轉(zhuǎn)預(yù)測技術(shù)來保持最佳的流水線效率。這些特殊技術(shù)的使用，使ARM11處理器優(yōu)化到更高的流水線吞吐量的同時，還能保持和5級流水線（如ARM9處理器中的流水結(jié)構(gòu)）一樣的有效性。
　　
　　跳轉(zhuǎn)指令通常都是條件執(zhí)行的。問題在于那些決定是否跳轉(zhuǎn)的條件要在跳轉(zhuǎn)指令被譯碼的后3~4個周期才能就緒。如果不做特殊處理，跳轉(zhuǎn)指令必須等待，這樣使指令執(zhí)行效率變得讓人難以忍受。跳轉(zhuǎn)預(yù)測就是用來幫助解決這種延遲的。ARM11處理器提供兩種技術(shù)來對跳轉(zhuǎn)作出預(yù)測—動態(tài)預(yù)測和靜態(tài)預(yù)測。

　　動態(tài)預(yù)測：在ARM11處理器中包含了64個4狀態(tài)跳轉(zhuǎn)地址緩存器（4-state branch target address cache）來保存最近發(fā)生的跳轉(zhuǎn)指令的結(jié)果。通過對這些歷史紀(jì)錄的查找，處理器可以預(yù)測出當(dāng)前的跳轉(zhuǎn)指令是否會被執(zhí)行。

　　靜態(tài)預(yù)測：當(dāng)在動態(tài)預(yù)測的緩存器中無法查到和當(dāng)前指令匹配的記錄，ARM11處理器就從跳轉(zhuǎn)的方式來判斷是否執(zhí)行。如果是向回跳轉(zhuǎn)，大多數(shù)情況是遇到一個循環(huán)，處理器會假設(shè)這條指令被執(zhí)行。如果是向前跳轉(zhuǎn)，處理器會假設(shè)這條指令不被執(zhí)行。

　　動態(tài)預(yù)測和靜態(tài)預(yù)測的組合使ARM11處理器能達(dá)到85%的預(yù)測正確性，對于每一個正確的預(yù)測，給指令執(zhí)行帶來的是減少5個時鐘周期的等待時間。
　　
　　在ARM11處理器中，指令和數(shù)據(jù)可以更長時間的被保存在Cache中。一方面是由于物理地址Cache的實現(xiàn)，使上下文切換避免了反復(fù)重載Cache，另一方面是由于ARM11的Cache還有很多其它新穎的技術(shù)特點。

　　如果數(shù)據(jù)的訪問引起了CacheMiss，Cache將到存儲器中讀取需要的數(shù)據(jù)。但是ARM11處理器的流水線并不會停止下來。只要后面的指令沒有用到Cache Miss將讀回來的數(shù)據(jù)，ARM11處理器就會繼續(xù)執(zhí)行下去。即使下一條指令還是存儲器訪問指令，只要數(shù)據(jù)存放在Cache中，ARM11也會允許這條指令被執(zhí)行。只有這條指令又引起一次CacheMiss，處理器才會停止下來。在大多數(shù)應(yīng)用中，經(jīng)過編譯器調(diào)配后，這種情況并不多見。
　　
　　盡管ARM11是單指令發(fā)射處理器，但是在流水線的后半部分允許了極大程度的并行性。一旦指令被解碼，將根據(jù)操作類型發(fā)射到不同的執(zhí)行單元中。ARM11的數(shù)據(jù)通路中包含多個處理單元，允許ALU操作、乘法操作和存儲器訪問操作同時進(jìn)行。

　　考慮到不同的指令需要不同的執(zhí)行時間，當(dāng)三類指令先后被發(fā)射到流水線中，它們就可以同時被執(zhí)行。而且ARM11處理器允許指令的亂續(xù)完成，如果在指令之間沒有數(shù)據(jù)的相關(guān)性，所有指令都可以不必等待前面的指令完成而結(jié)束自己的執(zhí)行。
　　
　　在絕大多數(shù)的應(yīng)用中，一個真正的64位處理器，在功耗面積的成本上還是不經(jīng)濟(jì)的。ARM11處理器展示了一種以32位處理器的成本，提供64位處理器性能的解決方案。ARM11處理中，內(nèi)核和Cache，及協(xié)處理器之間的數(shù)據(jù)通路是64位的。這使處理器可以每周期讀入兩條指令或存放兩個連續(xù)的數(shù)據(jù)，以大大提高數(shù)據(jù)訪問和處理的速度。經(jīng)過評測，這已經(jīng)和64位處理器的性能相差無幾。
　　
　　ARM11處理器將浮點運算當(dāng)成一個可供用戶選擇的設(shè)計。用戶可以在向ARM要求授權(quán)的時候選擇是否包括浮點處理器的內(nèi)核。在流水線上的重要區(qū)別不僅是為了達(dá)到更高的性能，還是從實現(xiàn)的角度來考慮的。所以，ARM11內(nèi)核在運行于極高頻率的同時，也能非常容易的被集成在SoC設(shè)計中。同時，ARM11處理器提供的向上兼容性，使OEM可以放心的選用任何基于ARM的產(chǎn)品。

　　ARM11處理器是ARMv6架構(gòu)的第一代實現(xiàn)，ARM的合作伙伴可以從不同的方面（功耗、性能或面積）優(yōu)化和實現(xiàn)差異化的ARM11內(nèi)核，也可以根據(jù)自己特定的工藝技術(shù)來開發(fā)不同的特性。這些ARM11處理器瞄準(zhǔn)的是下一代高端的移動無線，消費類電子，網(wǎng)絡(luò)和汽車電子應(yīng)用。而且ARM11內(nèi)核的很多特性使它還能充分適應(yīng)高端嵌入式實時應(yīng)用系統(tǒng)，如：未來的網(wǎng)絡(luò)和家庭娛樂產(chǎn)品。

　　此外，ARM11的成功還得益于ARM完整的開發(fā)環(huán)境和廣泛的IP解決方案，以及不斷擴(kuò)大的ARM開發(fā)者和合作伙伴聯(lián)盟。

　　ARM公司近日公布了四個新的ARM11系列微處理器內(nèi)核（ARM1156T2-S內(nèi)核、ARM1156T2F-S內(nèi)核ARM1176JZ-S內(nèi)核和ARM11JZF-S內(nèi)核），以及應(yīng)用于ARM1176JZ-S 和ARM11JZF-S內(nèi)核系列的PrimeXsys平臺、相關(guān)的CoreSight技術(shù)。

　　ARM1156T2-S和ARM1156T2F-S內(nèi)核都基于ARMv6指令集體系結(jié)構(gòu)，將是首批含有ARM Thumb-2內(nèi)核技術(shù)的產(chǎn)品，可令合作伙伴進(jìn)一步減少與存儲系統(tǒng)相關(guān)的生產(chǎn)成本。兩款新內(nèi)核主要用于多種深嵌入式存儲器、汽車網(wǎng)絡(luò)和成像應(yīng)用產(chǎn)品，提供了更高的CPU性能和吞吐量，并增加了許多特殊功能，可解決新一代裝置的設(shè)計難題。體系結(jié)構(gòu)中增添的功能包括：對于汽車安全系統(tǒng)類安全應(yīng)用產(chǎn)品的開發(fā)至關(guān)重要的存儲器容錯能力。ARM1156T2-S和ARM1156T2F-S內(nèi)核與新的AMBA 3.0 AXI總線標(biāo)準(zhǔn)一致，可滿足高性能系統(tǒng)的大量數(shù)據(jù)存取需求。Thumb-2內(nèi)核技術(shù)結(jié)合了16位、32位指令集體系結(jié)構(gòu)，提供更低的功耗、更高的性能、更短的編碼，該技術(shù)提供的軟件技術(shù)方案較現(xiàn)用的ARM技術(shù)方案減少使用26％的存儲空間、較現(xiàn)用的Thumb技術(shù)方案增速25％。

　　ARM1176JZ-S和ARM1176JZF-S內(nèi)核及PrimeXsys平臺是首批以ARM TrustZone技術(shù)實現(xiàn)手持裝置和消費電子裝置中公開操作系統(tǒng)的超強安全性的產(chǎn)品，同時也是首次對可節(jié)約高達(dá)75％處理器功耗的ARM智能能量管理（ARM Intelligent Energy Manager）進(jìn)行一體化支持。ARM1176JZ-S和ARM1176JZF-S內(nèi)核基于ARMv6指令集體系結(jié)構(gòu)，主要為服務(wù)供應(yīng)商和運營商所提供的新一代消費電子裝置的電子商務(wù)和安全的網(wǎng)絡(luò)下載提供支持。

　　CoreSight技術(shù)建于ARM Embedded Trace Macrocell （ETM）實時跟蹤模塊中，為完整的片上系統(tǒng)（SoC）設(shè)計提供最全面的調(diào)試、跟蹤技術(shù)方案，通過最小端口可獲得全面的系統(tǒng)可見度，并為開發(fā)者大大節(jié)約了產(chǎn)品上市時間。ARM CoreSight技術(shù)提供了最標(biāo)準(zhǔn)的調(diào)試和跟蹤性能，適用于各種內(nèi)核和復(fù)雜外設(shè)，可對核內(nèi)指令和數(shù)據(jù)進(jìn)行追蹤。該技術(shù)為半導(dǎo)體制造商和工具供應(yīng)商建立了可真正協(xié)同工作的系統(tǒng)調(diào)試標(biāo)準(zhǔn)，可滿足嵌入式開發(fā)者和半導(dǎo)體制造商的各種需求，如以最低的成本來提供全面的系統(tǒng)可見度，從而降低處理器成本。

　　ARM公司嵌入式內(nèi)核經(jīng)理Richard Phelan先生說："隨著競爭的日益激烈，系統(tǒng)開發(fā)者必須以低廉的費用實現(xiàn)嵌入式系統(tǒng)的高性能并延長電池的待機時間。ARM1156T2-S和ARM1156T2F-S內(nèi)核在0.13μ工藝下新的操作頻率高達(dá)550MHz，擁有高效的Thumb-2指令集和AMBA 3.0 AXI系統(tǒng)總線，ARM1156T2-S和ARM1156T2F-S內(nèi)核為合作伙伴們提供了所需的知識產(chǎn)權(quán)（IP），滿足各種新興的嵌入式控制應(yīng)用產(chǎn)品的高性能需求。"

　　ARM CPU產(chǎn)品經(jīng)理David Cormie先生評論說："為了進(jìn)一步提高新一代消費電子裝置和無線裝置的安全性，運營商、服務(wù)商和消費者的重要數(shù)據(jù)的保護(hù)、隱私保護(hù)需要一個可信賴的計算環(huán)境。ARM1176JZ-S和ARM1176JZF-S內(nèi)核及PrimeXsys平臺結(jié)合了ARM TrustZone技術(shù)，為計算裝置提供了理想的可信賴基礎(chǔ)。系統(tǒng)設(shè)計者首次在芯片核心部分運用TrustZone技術(shù)來解決安全性問題。用戶將擁有更多的下載選擇，運營商將增加營業(yè)額收入，他們都無需擔(dān)心網(wǎng)絡(luò)的安全問題。"

　　ARM1176JZ-S和ARM1176JZF-S內(nèi)核、PrimeXsys平臺提供了安全的低功耗設(shè)計，含有AMBA 3.0 AXI，可對頻率和電壓變化進(jìn)行控制；系統(tǒng)級TrustZone軟硬件參考設(shè)計。兩個新內(nèi)核中集成了ARM Jazelle技術(shù)，可加快嵌入式Java執(zhí)行。ARM1176JZF-S內(nèi)核包含一個浮點協(xié)處理器，極適合用于嵌入式3D圖像應(yīng)用產(chǎn)品。兩個新內(nèi)核的標(biāo)準(zhǔn)配置中都含有ARM-Synopsys RTL to GDSII參考技術(shù)方案，都是可綜合的，在0.13μ工藝中，最低頻率可達(dá)333-550MHz。PrimeXsys平臺包含ARM CoreSight?技術(shù)，提供了世界領(lǐng)先的調(diào)試和跟蹤技術(shù)方案。

　　ARM CoreSight技術(shù)可快速地對不同地軟件進(jìn)行調(diào)試，通過對多核和AMBA?總線的情況進(jìn)行同時跟蹤。此外，同時對多核進(jìn)行暫停和調(diào)試，CoreSight技術(shù)可對AMBA上的存儲器和外設(shè)進(jìn)行調(diào)試，無需暫停處理器工作，達(dá)到不易做到的實時開發(fā)。ARM CoreSight技術(shù)擁有更高的壓縮率，為半導(dǎo)體制造商們提供了對新的更高頻處理器進(jìn)行調(diào)試、跟蹤的技術(shù)方案。使用CoreSight技術(shù)，制造商們可通過減少調(diào)試所需的管腳、減少片上跟蹤緩存所需的芯片面積等手段來降低生產(chǎn)成本。

返回高清播放機頻道首頁