中文字幕乱码人妻一区二区三区,亚洲综合色婷婷六月丁香宅男大增,一二三四在线视频观看社区

正交頻分復用OFDM（Orthogonal Frequency Division Multiplex）是近幾年興起的一種在無線信道上實現(xiàn)高速數(shù)據(jù)傳輸?shù)男录夹g。它采用多載波調制技術，其最大的特點在傳輸速率高，對碼間干擾和信道通道性衰落具有很強的抵抗能力。在OFDM系統(tǒng)中，各子載波的調制解調采用一個實時的快速傅立葉變換（FFT）處理器實現(xiàn)，因此高速FFT處理器是OFDM系統(tǒng)實現(xiàn)中的一個重要因素。目前通用的FFT模塊可以達到的速度數(shù)量級為1024點16位字長定點、塊浮點、浮點運算在幾十到數(shù)百微秒量級，其中采用TI公司的DSP62XX定點系列達到66μs量級處理速度，新近的64XX在600MHz時鐘頻率下完成1024點定點FFT的時間僅需10μs。C6701浮點DSP在167MHz時鐘頻率下完成32位1024點浮點FFT的運算時間需120μs。而AD公司的ADSP-21160SHARC在100MHz下完成需要90μs。但是如果僅用于FFT處理而廢棄其他功能性價比就很低。采用Xilinx公司的FFT IP核處理，也可以達到160MHz的工作頻率，但由于其采用固核，外圍引腳較多不利于使用，且不利于針對特殊要求進行修改。

本文在分析了基4按時域分解的FFT算法特點的基礎上，提出了一種便于VLSI實現(xiàn)的FFT處理器結構。處理器運算單元的流水并行及操作數(shù)的并行讀寫保證了每個周期能夠完成一次蝶形運算。而文獻提出的地址映射算法不適用于本設計單蝶形運算結構；文獻中，尋址方案基于線形變換，但是需要復雜的位矩陣點積算法；文獻方案做了改進，但仍然較復雜。本文提出一種完全同址的數(shù)據(jù)全并行FFT處理器設計方法。此方案僅需要一個計數(shù)器，通過簡單的線形變換，即可實現(xiàn)對不同長度N=4 P的FFT處理。

設序列x(n)的長度為N=4 P，其中p為正整數(shù)，則x(n)的DFT為：

由上述運算步驟可推得基4按時間抽取在第s級的蝶形運算單元的方程為：

式（4）給出了DIT算法的蝶形運算公式，由此可以得出抽取數(shù)據(jù)的規(guī)律，同時地也得到了每個數(shù)據(jù)在每級蝶形運算中相應的旋轉因子的值，因此式（4）是VLSI實現(xiàn)基4FFT算法的基礎。

FFT運算中與旋轉因子相乘的運算是復數(shù)乘法�？梢钥闯�，若采用并行處理方式在一個時鐘周期內實現(xiàn)復乘，需4個實數(shù)乘法器和2個實數(shù)加法器。存在如下等式：

即可用3個實數(shù)乘法器和5個實數(shù)加法器實現(xiàn)復乘。在VLSI的實現(xiàn)中，陣列乘法器所占面積遠大于加法器，故通常用式（5）完成復乘。

2 FFT處理器的硬件實現(xiàn)

假定處理器需要做N點FFT變換，則基4按時域抽取FFT運算包括lg4N級運算，每一級包括N/4個基4蝶形運算單元。

FFT處理器設計中采用同址運算有利于系統(tǒng)存儲器的片內集成，從而提高FFT處理器訪問存儲器的速度。對于基4FFT處理器，一次蝶形運算需要讀取4個操作數(shù)。因此，如果充分利用硬件的并行特點，在一個周期內并行讀取4個操作數(shù)，計算速度將是順序處理器的4倍。

在設計中，使用i、j遞增計數(shù)器（I表示需要做的級數(shù)，j表示每一級運算所需的存儲器容量）。由數(shù)據(jù)地址產(chǎn)生單元生成數(shù)據(jù)存儲器地址B0、B1、B2、B3，由于旋轉因子地址產(chǎn)生單元生成旋轉因子存儲器地址C0、C1、C2。為了在一個時鐘周期內完成一個基4蝶形運算，采用了4個并行存儲器A、B、C、D存放FFT運算的操作數(shù)。系統(tǒng)結構框圖如圖1所示。

2．2 數(shù)據(jù)及旋轉因子地址生成

對于N=4 P，設待變化的原始數(shù)據(jù)是按順序輸入的，由式（4）可知完成的DFT變換結果是按兩位二進制倒序排列的，即若輸入序列的地址線每兩位為一組，其序號用兩位二進制表示為ap-1ap-2…a1a0，則輸出結果的排序為a0a1…ap-2ap-1。每級數(shù)據(jù)及旋轉因子抽取關系如表1所示。數(shù)據(jù)A0、A1、A2、A1經(jīng)過當前級的地址線交換器后得到一個蝶形運算所對應的4個數(shù)據(jù)的地址B0、B1、B2、B3。經(jīng)過蝶形運算后，數(shù)據(jù)重新寫回原地。一個基4蝶形運算需要3個旋轉因子W1、W2、W3。地址B1、B2、B3經(jīng)過旋轉因子交換器及判斷交換器（如表2所示）得到相應的旋轉因子地址C0、C1、C2。讀寫地址及旋轉因子地址的產(chǎn)生框圖如圖2所示。

表1 地址及旋轉因子交換器的連接關系

設N=2n，則數(shù)據(jù)地址產(chǎn)生單元的輸入數(shù)據(jù)Bk(k=0,1,2,3)可表示為：

得到存儲器地址mq及各存儲器數(shù)據(jù)地址rq對應關系為：

其中，mod表示取余運算，+表示多位異或支行上，[·]表示對其中的數(shù)據(jù)取最近的小于其的整數(shù)，gcd（·）表示其中兩個數(shù)的最大公約數(shù)。

筆者采用4對RAM（一個地址位對應一個復數(shù)，實部在前，虛部在后）來存儲蝶形運算中的操作數(shù)out(0)、out(1)、out(1)、out(3)。如圖3所示，數(shù)據(jù)地址為B0、B1、B2、B3。存儲器分類處理單元由m1m0構成，分別得到4個地址對應數(shù)據(jù)所在的存儲器號。地址交換器處理單元由rn-3rn-4…r1r0構成，分別得到4個地址對應數(shù)據(jù)所在存儲器中的地址信息。處理器在每個時鐘周期從相應的RAM中讀取數(shù)據(jù)out(0)、out(2)、out(3)送入基4蝶形運算單元，如圖4。運算結果in(0)、in(1)、in(2)、in(3)在下一個時鐘周期寫回原地址。

圖4

2．4 基4蝶形單元

蝶形單元是FFT設計的核心部分，根據(jù)式（4）、（5）可得基4蝶形單元的結構如圖4所示。它采用流水線結構，主要包括乘法器和加法器。蝶形運算單元可以在一個時鐘周期內完成一次蝶形。其中，4個操作數(shù)分別位于4個RAM中，3個旋轉因子分別位于3個ROM中。由于運算可以產(chǎn)生溢出，所以需進行量化。本設計在每一級蝶形運算后采用量化右移兩位處理。

針對本文提出的結構采用Xilinx公司的Virtex-II系列的xc2v250器件進行了1024點FFT處理器的VLSI結構驗證。由于此器件包含大量的18×18位硬件乘法器、片內可配置RAM塊以及觸發(fā)器資源，因而便于硬件設計驗證。輸入及輸出數(shù)據(jù)為18位，當系統(tǒng)的工作頻率為100MHz時，完成1024點復數(shù)FFT運算所需時間將近13μs。部分仿真波形如圖5所示。表3比較了幾種FFT處理器的性能指標。

圖5

比較表明，本文提出的基4并行存儲結構控制部件簡單，地址生成速度快，數(shù)據(jù)訪問并行處理解決了順序訪問的瓶頸問題。對于各種形如N=4p的FFT運算能夠達到極高的處理性能。

OFDM作為一種可以有效對抗信號波形間干擾的高速傳輸技術，引起了廣泛的關注。人們開始集中越來截多的精力開發(fā)OFDM技術在移動通信領域的應用，預計第三代以后的移動通信的主流技術將是OFDM技術。OFDM技術中各載波調制解調順的實現(xiàn)需要高速的FFT處理器。本文在分析了基4按域抽取FFT算法特點的基礎上，提出了一種高性能的FFT處理器實現(xiàn)結構。利用硬件并行無沖突的方法來訪問數(shù)據(jù)存儲器，與以往的設計相比大大提高了處理器的處理效率。同時系統(tǒng)結構規(guī)則，便于模塊化，易于版圖設計。經(jīng)由硬件驗證，系統(tǒng)性能完全可以滿足OFDM對高速數(shù)據(jù)流的處理需求。

表3 FFT處理器的性能指標

處理器	FFT點數(shù)	數(shù)據(jù)寬度/bit	時鐘頻率/MHz	處理器數(shù)	處理時間μs
Tiger SHARC	1024	32浮點，8/16/32定點	250	1	41
Spiffee	1024	20	173	1	30
M.Wosnitza,ETH	1024	32	66	1	80
Sicom,SNC960A	1024	16	65	1	20
Altera FFT IP	4096	16	94	1	262
本設計	1024	18	100	1	12.8
本設計	4096	18	100	1	61.4

VLSI的供應商：	深圳市偉科芯電子科技有限公司聯(lián)系人：詹小姐電話：0755-83797351	深圳市金科創(chuàng)世紀電子有限公司聯(lián)系人：林小姐電話：0755-82721172	深圳市創(chuàng)芯聯(lián)盈電子有限公司聯(lián)系人：joanna蔡小姐電話：15915459078	深圳市華美銳科技有限公司聯(lián)系人：林先生電話：0755-83035162
>>更多供應商

N=4p
數(shù)據(jù)地址交換器連接關系		旋轉因子地址交換器連接關系
Ai i=0,1,2,3	ap-1ap-2…a1a0	Bi i=1,2,3	bp-1bp-2…b1b0
第1級	a0ap-1ap-2…a2a1	第1級	bp-10…00
第2級	ap-1a0ap-2…a2a1	第2級	bp-2bp-10…00
…	…	…	…
第p-1級	ap-1ap-2…a0a1	第p-1級	b1b2…bp-2bp-10
第p級	ap-1ap-2…a1a0	第p級	b0b1…bp-2bp-1

最新免费av在线观看,亚洲综合一区成人在线,中文字幕精品无码一区二区三区,中文人妻av高清一区二区,中文字幕乱偷无码av先锋

VLSI

VLSI 的PDF資料