基于DSP算法的正向設計方法學概論論文
摘要:基于DSP算法的正向設計方法學為系統芯片設計師提供重要的學術素養。本文結合圖表概論正向設計方法學中的數學變換思想,一是DSP算法變換,二是相應的ULSI架構變換。研究結論是作為技術核心的DSP—ULSI最佳映射,貢獻首先來自DSP算法變換,其次來自ULSI架構變換,此間始終構造把握評價函數。
航天、醫療和安全業界的問題牽引,驅動數字信號處理(DSP)走過經典與現代,奔向智能計算與實時測控的融合,進而日益增強著DSP算法的時間和空間復雜性,迫使ULSI規模的ASIC架構優化,演進為由DSP算法驅動的正向設計方法學。
我們以DSP算法驅動ULSI—ASIC架構優化的正向設計環路為背景,以4種DSP算法變換和8種ULSI基本架構為路標,概論DSP算法優化和ULSI架構優化方法。
第一節正向設計優化介紹設計思想和典型概念,包括映射評價、DSP算法和ULSI架構。
第二節DSP算法變換介紹四種算法變換中的兩種,包括坐標旋轉和分布計算。
第三節介紹ULSI架構變換,總結出八種典型變換方法,重點介紹其中的管線和并行。
1正向設計優化
自頂向下的正向設計,在每個階段都要重視映射評價,設計的開始要繼承一些逆向設計思維。此間每一次向下映射的貢獻,首先來自DSP算法變換,其次來自ULSI架構變換。
正向設計的競爭力,首先來自10—20萬片以上的ULSI規模ASIC的牽引,其次來自數學技巧的合理應用,同時要重視EDA工具的熟練使用和升級培訓。
我們將DSP算法驅動ULSI—ASIC架構優化的正向設計環路概括成圖1。
1。1映射評價
運作ASIC正向設計流程,其間每一次向下的階段性設計環節,都可以概括入映射這個概念。映射的數學本質就是變換。
指導映射的評價函數的一般構造方法是:巧妙組合所映射的下一層中的關鍵技術指標,構造生成一個單調變化的新參數,此為評價函數。
重視以評價函數尋優的引導地位,我們用圖2來概括正向設計中的關鍵知識模塊。從圖2可以清楚地看出:問題建模的作用類似大腦;算法優化的作用優于架構優化的作用;設計工程師不但應該諳熟主流正向設計工具,更應該以評價函數為基礎(或者稱為有色眼鏡),從DSP算法切入,抓住算法A(Algorithm),直奔算法集成電路ASIC的ULSI架構優化主題。
1。2DSP算法
算法定義為將一組數據變換到另外一組數據的方法。DSP算法的基本內容是變換和濾波。其研究意義在于信息處理、識別和挖掘。
DSP典型算法:相關,卷積,濾波,運動估值(ME),離散余弦變換(DCT),矢量量化(VQ),動態規劃,抽取和插值,小波,等等。
DSP算法優點:區別于模擬信號處理ASP(例,譜分析精度:模擬法為10Hz;數字法為0。01Hz),魯棒性表現于溫漂和工藝,字長控制精度,本質無誤差(放大信號同時消噪);區別于其他通用計算,需要實時吞吐率(采樣率),且由數據驅動。
DSP算法運算:乘積,加法,延遲(寄存);竟綖榉e和運算:Yn=∑i=0maiXn—i。
DSP算法圖示:四種框圖包括,信號流圖SFG(可轉置,僅描述線性單速率DSP系統),數據流圖DFG(可變換,更接近實際架構,調度并發實現至并發硬件),依賴圖DG(展示并行和數據流,可變換,描述脈動陣列);框圖的圖示意義是,展示并行性和數據驅動,展示時間折中和空間折中,啟發探索架構選擇(通過算法變換)。
DSP算法實現:CPU(單,雙,多),DSP(基于一種RISC),ULSI—ASIC(由DSP算法變換映射ULSI架構變換和優化),FPGA(算法變換,可編程,中等顆粒),CPLD(可編程,大顆粒)。
DSP集成指標:空間和面積,吞吐率和鐘頻,功耗,量化噪聲和舍入噪聲。
DSP研究思路:DSP算法變換和優化,ULSI架構變換和優化,DSP算法變換與ULSI架構變換聯合優化;除特別指明應用于FPGA之外,其余均聚焦服務于ULSI—ASIC優化設計。
1。3ULSI架構
ULSI架構這一概念的提法,可以認為模仿了計算機組成架構的分析理念。
ULSI架構主要描述ASIC的內部電路模塊,是以怎樣關聯著的平面結構網絡擺在管芯之中的,其形狀類似于建筑物的平面圖紙。
我們較早熟悉的是圍繞單CPU(核)所構建的ASIC的內部平面網絡。
我們應該熟悉的是ASIC內部網絡必須是和諧的,包括數據流、控制流和關鍵存儲體的良性互動。
未來將面臨的是由二維架構升格為三維架構。
2DSP算法變換
各種DSP算法的本質是積和(SoP)公式變形,構造方法是系數縮放、變量擴增、變量平移、積和擴增、積和映射以及各種方法的組合等等。例如,自相關(麻省理工,1951年)基于變量平移和變量擴增。
林林點點的快速DSP算法,借助于公式和數學定理進行化簡和逼近,分解要點是基于子運算、重復性、規律性和并行性,熱衷于以和代積。例如,FFT算法(CooleyandTukey,1965年)巧妙利用了DFT變換中旋轉因子W的.周期性和對稱性。
揭示DSP算法錘煉設計和ULSI集成架構實現之間的關系,認真分析特定算法的內在特征(并行性、模塊性和信號流機制),構造評價函數,靈巧嘗試算法變換,尋優DSP算法使之并行化、模塊化和層次化,降低其時間和空間復雜度,從而提速降耗。此間的典型數學技巧已概括入表1。
2。1坐標旋轉
1956年至1971年,采用坐標旋轉的算法得到開發和統一。該算法的基礎是在直角坐標(1619年,笛卡爾)和極坐標(1691年,伯努利)中做坐標旋轉,根據被計算函數的特點選取兩種坐標系之一。來自坐標變換發明者本人的研究聲音是:在變換過的坐標系中,某些特殊函數的運算得以強力簡化。
坐標旋轉算法對應的架構,只需加法、移位和迭代等基本操作,無需乘除運算。DSP算法基于坐標旋轉易于組合出創新架構。
2。2分布計算
概念:分布計算(Croisier,1973年)是算法變換優化的經典范例,用于設計矢量乘法元架構。
方法:矢量經由二進制編碼,內積重新排序與混合,基于查找表(LUT)實現與乘數無關,結果使乘法運算“分布”成讀ROM且加權累加。
用途:卷積和DCT的實現。
如果說地位重要的DSP算法變換,其數學技巧具有發散的性質,那么,ULSI架構優化的變換技巧則有規律可循。
3ULSI架構優化
實際需求的DSP的吞吐率(采樣率)與計算能力及性能之間存在兩條鴻溝,基于架構(包括可重構)是重要解決方案。因此,DSP算法變形(逼近)優化在先,然后直接或組合映射ULSI架構。評價標準可參考ULSI架構全局模型的三要素:網絡幾何結構G,處理單元F,網絡定時T。
優秀的DSP算法適配到合理的ULSI架構,是創新過程,通用法則急需總結。應特別注意:DSP算法得以ULSI實現的有效性,決定于算法內部數據流的復雜性。
已知DSP算法,基于DSP積、和的元架構,設計ULSI系列高層次架構的方法,可概論為以下8種,其特點列于表2。
3。1管線(流水線)
意義:縮短關鍵路徑,提速降耗;管線即流水線。
本質:時間并行處理,方法是流水線鎖存器插入SFG的前饋割集。
缺點:①對非遞歸網絡,增加了鎖存器數目和系統時延;②流水的多時鐘風格因時鐘歪斜而異化。
改進:一是采用波流水線,減少流水級數,但不增加鎖存器數目;另一為異步流水,基于握手信號通信而無全局同步。
3。2并行
意義:縮短關鍵路徑,提速降耗。
本質:空間并行處理方法,復制原始串行硬件,構造并入并出系統。
特點:其一,并行與流水線互為對偶,二者都挖掘計算的并發性,一為并行,另一為交替(同步或異步);其二,并行和流水的降耗思路:降低電源電壓,以提高采樣速度換取功耗降低。
4結論討論
DSP算法起源于17世紀的有限差分、數值積分和數值差值等經典算法。
DSP算法一般是積和項的疊加繁衍。DSP算法是一種粘合劑,將“數字匯聚”粘合在一起。
從DSP算法映射到ULSI架構,是集成電路正向設計中極其重要的研究課題之一。
針對算法的計算核——積和項,分兵兩路展開研究:一是通過編程,使算法適應馮諾伊曼結構或哈佛結構的既有CPU或DSP(數字信號處理器);另一是改變未知ULSI架構來使之適合算法——面向算法的專用處理器陣列設計,而ULSI(或3D—SOC)的規則布線要求,需要算法結構化對稱化,以便分解為并行計算。
源于工程實踐的算法具有多樣性的特點,必須改造算法為:有規律、重復且并行,如此才能最高速硬件化實現該算法;對于復雜算法,只好運用組合的非常規架構來映射實現。其中,并行是藏在處理核內的加速器!
區別于通用處理器,當ASIC是可能達到算法性能指標的唯一選擇時,成本因素則降為第二位,必須面向算法研制專用處理器陣列。為降低專用ULSI的成本壁壘,專用處理器基于邏輯元件和寄存器的特定架構組合與連接,在犧牲一定可編程靈活性的代價下,特定內核的處理速度可大幅度提高(例如:提速1至2個數量級),避免了因靈活性而付出的硬件開銷;與軟件實現相比,專用硬件實現更小巧,更高速,更低耗。
當專用硬件的性能比現有處理器高10倍以上時,業界才愿意去設計ASIC;越來越復雜的ASIC設計完成后,也作為固定的硬件平臺使用(最好嵌入適量線控/程控功能),這已成為常用的系統正向設計方法。
基于EDA工具輔助進行最佳映射時的評價函數,其變量可是:芯片面積(單元總數和布線數量)、時間和單元利用率。映射尋優的過程,必定是帶著工藝接口思想的DSP—ULSI變換組合優化循環。
當我們完成由DSP驅動的ULSI架構正向設計旅程,驅動力的接力棒,尚需交還應用市場的問題牽引。
【基于DSP算法的正向設計方法學概論論文】相關文章:
5.法學概論論文