圖1:Xenergy能量估計(jì)軟件能夠?qū)\(yùn)行在Tensilica Xtensa可配置處理器或者鉆石標(biāo)準(zhǔn)處理器上的應(yīng)用程序進(jìn)行功耗評(píng)估。

工作原理

針對(duì)各種處理器配置情況以及不同的制造工藝,Tensilica生成的訪存(讀和寫)功耗統(tǒng)計(jì)模型和每條指令的功耗統(tǒng)計(jì)模型均經(jīng)過詳細(xì)的綜合、RTL代碼設(shè)計(jì)以及門級(jí)仿真。Xenergy工具使用這些模型,即使采用Tensilica指令擴(kuò)展(TIE)語言編寫的由設(shè)計(jì)人員定義的指令也不例外。

Xenergy工具使用訪存功耗統(tǒng)計(jì)模型和指令功耗統(tǒng)計(jì)模型,包括了用Tensilica指令擴(kuò)展語言編寫的由設(shè)計(jì)人員定義的擴(kuò)展指令。針對(duì)各種處理器配置情況以及不同的制造工藝,這些統(tǒng)計(jì)模型的開發(fā)包括了詳細(xì)的綜合、RTL代碼設(shè)計(jì)以及門級(jí)仿真。

Xenergy工具采用Tensilica的指令集仿真器ISS對(duì)應(yīng)用程序進(jìn)行仿真,仿真精度達(dá)到時(shí)鐘周期。仿真后可以給出每條指令執(zhí)行以及每次訪存的綜合統(tǒng)計(jì)信息。針對(duì)采用的處理器和存儲(chǔ)器,Xenergy工具可以估計(jì)出相應(yīng)的動(dòng)態(tài)功耗、漏電功耗和全部功耗。

存儲(chǔ)器和應(yīng)用程序代碼效應(yīng)

有些TIE指令可以改善應(yīng)用程序的性能,但極大地增加了訪存次數(shù),進(jìn)而增加了系統(tǒng)功耗。而且,對(duì)高速緩存的更新(容量和關(guān)聯(lián)度)有助于功耗優(yōu)化。Xenergy程序能夠幫助設(shè)計(jì)人員理解整個(gè)處理器的變化所造成的影響,這些變化是在處理器配置過程中隨著存儲(chǔ)器的不同所引起的。

類似地,Xenergy工具能夠幫助開發(fā)人員修改應(yīng)用程序代碼來減少處理器和存儲(chǔ)器的能量消耗。例如,在應(yīng)用程序中對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行重構(gòu)能夠降低訪存次數(shù)。通過使用Tensilica的標(biāo)準(zhǔn)軟件工具,開發(fā)人員可以發(fā)現(xiàn)應(yīng)用程序的改善情況。通過使用Xenergy工具,開發(fā)人員能夠發(fā)現(xiàn)通過修改程序代碼來降低系統(tǒng)功耗。

一個(gè)例子

我們采用EEMBC(嵌入式微處理器典型程序聯(lián)盟,參見網(wǎng)址www.eembc.org)中的RGB到Y(jié)UV顏色轉(zhuǎn)換典型程序來說明Xenergy工具是如果在實(shí)際應(yīng)用程序中使用的。

我們也可以采用Tensilica的XPRES(Xtensa處理器擴(kuò)展綜合)編譯器,該編譯器利用C或者C++編寫的應(yīng)用程序軟件作為輸入數(shù)據(jù),并產(chǎn)生用TIE語言表示的處理器擴(kuò)展。通過XPRES編譯器可以為Xtensa處理器產(chǎn)生三種擴(kuò)展指令集。

1. 要求XPRES編譯器產(chǎn)生TIE指令,完成指令操作融合,即將多個(gè)操作符融合成一個(gè)單一復(fù)雜操作。

2. 然后,我們可以要求XPRES也產(chǎn)生SIMD(單指令多數(shù)據(jù))功能部件(及相應(yīng)的指令),進(jìn)行向量操作,即對(duì)多個(gè)數(shù)據(jù)元素施加相同的操作符。

3. 最后,我們要求XPRES編譯器將Xtensa處理器擴(kuò)展成一個(gè)VLIW(超長(zhǎng)指令字)體系結(jié)構(gòu),并利用Tensilica的FLIX(定長(zhǎng)指令擴(kuò)展)技術(shù)。XPRES編譯器利用VLIW指令構(gòu)建多發(fā)射數(shù)據(jù)通路,VLIW指令可以包括多個(gè)操作。

對(duì)不同Xtensa處理器擴(kuò)展后的性能

             圖2:對(duì)不同Xtensa處理器擴(kuò)展后的性能、功耗和面積對(duì)應(yīng)關(guān)系。

三種Xtensa配置結(jié)果如圖2所示。周期數(shù)與性能是等價(jià)的,這由在指令集仿真器ISS上執(zhí)行的顏色轉(zhuǎn)換應(yīng)用程序來決定。門數(shù)可以由Tensilica的TIE編譯器來估計(jì)得到。所有其它數(shù)據(jù)均由Xenergy工具來生成。

圖2表示由XPRES編譯器生成的SIMD操作以及融合操作性能改善情況,大約是3.8倍,而門數(shù)為大約5倍。處理器和存儲(chǔ)器功耗與性能的對(duì)應(yīng)關(guān)系相當(dāng)好。另外還表示了當(dāng)XPRES編譯器生成VLIW(FLIX)體系結(jié)構(gòu)時(shí),性能的改善情況是大約20%。然而,門數(shù)為兩倍,且處理器功耗很差。

因此,由于SIMD操作引起的性能改善將使得功耗降低,且由于芯片面積(門數(shù))的增加使得系統(tǒng)功耗/能量增加。這是最好的優(yōu)化情況。

上述例子說明Xenergy評(píng)估工具是SoC設(shè)計(jì)人員在對(duì)性能、面積和功耗進(jìn)行折衷時(shí)不可或缺的軟件工具。

本文小結(jié)

Tensilica公司的Xenergy工具軟件為SoC設(shè)計(jì)人員提前對(duì)運(yùn)行在某些應(yīng)用程序時(shí)的處理器和存儲(chǔ)器子系統(tǒng)所消耗的總能量進(jìn)行評(píng)估。設(shè)計(jì)人員能夠馬上看到Xtensa配置和TIE指令代碼改變后的整個(gè)系統(tǒng)功耗情況。這對(duì)那些使用Xtensa處理器來代替RTL去設(shè)計(jì)SoC數(shù)據(jù)通路的設(shè)計(jì)人員尤為重要。通過使用定制TIE指令可以盡早評(píng)估系統(tǒng)的功耗情況,這有助于正確評(píng)估系統(tǒng)功耗、面積和性能。

分享到

多易

相關(guān)推薦