FFT至简设计法实现法_FFT算法_蝶形运算_fpga
0赞DIT-FFT至简设计实现法
1、DIT-FFT算法的基本原理
有限长序列的N点DFT定义为:,式中。
DFT在实际应用中很重要,但是如果直接按DFT变换进行计算,当序列长度N很大时,计算量会非常大,所需时间也很长,因此常用的是DFT的一种快速计算算法,简称FFT。
最常用的FFT算法是基于时间抽取的基2-FFT算法和基于频率抽取的基2-FFT算法,这种算法的特点在于FFT会把一次大的DFT分割成几个小的DFT,这样递归式地细分下去,例如有8个采样点的FFT,首先会把最外层的8点运算分成两个4点FFT的奇偶组合,第二层FFT又分成四个两点FFT的奇偶组合,并且由此计算出的频谱中很有趣的一点在于对于实数输出的数组,后面一半和前面一半正好对称相同,对于虚数输出的数组,后面一半是前面数组对称后乘上负1,因此,我们只需要算出FFT的一半即可求出全部。
本设计讨论的是基于至简设计法实现按时间抽选的基2-FFT算法(即DIF-FFT)实现过程,支持N由8到1024。
图 1按时间抽取的基2-FFT算法蝶形运算流图(N=8)
2、蝶形运算至简实现过程
2、1 模块划分
图 2蝶形运算模块框图
本模块包括三个RAM模块(RAM1,RAM2,RAM3)与一个DFT模块,各模块功能如下:
1) RAM1模块:在开始进行蝶形运算前,全部采样点(如图1所示的x(0)、x(4)、x(2)、x(6)、x(1)、x(5)、x(3)、x(7))已经按照倒位序二进制的地址依次存储在RAM1模块中,即地址0保存了采样点x(0),地址1保存了采样点x(4)。选用双端口RAM1可以同时对两点采样数据(如图1的x(0)、x(4))进行读、写操作。
2) RAM2模块:RAM2模块也是采用双端口输入输出,可同时对两点数据进行读、写操作。
3) DFT模块:DFT模块用于对RAM1、RAM2输出的两点采样数据(如图1的x(0)、x(4))进行蝶形运算,它将运算结果输出至RAM1、RAM2模块进行保存。
4) RAM3模块:RAM3模块是单输出模块,理论是应保存N(N为采样点个数)个运算参数,但由于每一次蝶形运算结果,)具有对称性,因此RAM3只需要保存N/2个即可。
2、1、1 奇数轮蝶形运算
图3 第奇数轮蝶形运算流图
如图3所示,RAM1首先根据计数器给出的两个点的地址(如地址0,地址1)进行数据读操作,然后将数据(如和)送进DFT模块进行运算,最后RAM2将DFT模块输出的数据(如,)按照原来的地址顺序进行写操作,直到RAM1全部读完N个数据,并且RAM2全部写完N个数据后,则第一轮蝶形运算计算完毕。
2、1、2 偶数轮蝶形运算
图4 第偶数轮蝶形运算流图
偶数轮运算跟奇数轮运算相似,唯一的不同就是:读取RAM由RAM1改为RAM2,写RAM由RAM2改为RAM1。
RAM1与RAM2按照这样的读写交替顺序,直至历遍完n轮蝶形运算(n为蝶形运算一共要计算的轮数)。
2、2 计数器架构设计
由于需要依次读取和写入RAM1和RAM2,并且还要经过N轮的运算,很明显需要运用到计数器。
计数器架构,关乎到整个设计的可靠性和至简性,因此是重中之中的设计。按照至简设计法的建议,需要用到N轮运算,这需要一个计数器但每轮的计数器如何设计呢?
由于这些计数器主要是用于产生读写地址的,所以我们需要仔细分析地址的规律。我们以8点的FFT为例进行分析。
观察上图,每一轮取址如表1所示:
蝶形运算第几轮 |
运算节点 |
第一次蝶形运算 |
第二次蝶形运算 |
第三次蝶形运算 |
第四次蝶形运算 |
1 |
的地址 |
0 |
2 |
4 |
6 |
的地址 |
1 |
3 |
5 |
7 |
|
2 |
0 |
1 |
4 |
5 |
|
地址 |
2 |
3 |
6 |
7 |
|
3 |
的地址 |
0 |
1 |
2 |
3 |
的地址 |
4 |
5 |
6 |
7 |
表1 N为8的蝶形运算每一轮取址
蝶形运算每一轮每一次的取地址满足什么关系呢,如何才能在FPGA设计中实现如表1的取地址运算,观察上表,我们可以发现如下规律:
第几级蝶形运算 |
的地址 |
|||
第一次 |
第二次 |
第三次 |
第四次 |
|
第一级 |
0=0+0* |
2=0+1* |
4=0+2* |
6=0+3* |
第二级 |
0=0+0* |
1=1+0* |
4=0+1* |
5=1+1* |
第三级 |
0=0+0* |
1=1+0* |
2=2+0* |
3=3+0* |
第几级蝶形运算 |
的地址 |
|||
第一次 |
第二次 |
第三次 |
第四次 |
|
第一级 |
1=+0+0* |
3=+0+1* |
5=+0+2* |
7=+0+3* |
第二级 |
2=+0+0* |
3=+1+0* |
6=+0+1* |
7=+1+1* |
第三级 |
4=+0+0* |
5=+1+0* |
6=+2+0* |
7=+3+0* |
表3的取址
根据表2、表3,可得到与与数组[a],[b],[c]有关的表达式
;
; (式1)
通过上面的观察,按照明德扬的计数器架构建议,可设计三个计数器cnt0,cnt1,cnt2分别表示数组[a],[b],[c],因此可将式1变为:
;
; (式2)
各个计数器每一轮的结束条件为:
(式3)
其中n为蝶形运算一共要计算的轮数,如采样点数N为8时,则一共要进行三轮运算。通过这三个简易的计数器设计,就能实现复杂的DIT-FFT蝶形运算取址操作。
终上所述,无论是模块划分、计数器设计、还是乒乓操作的读写处理,都始终基于“至简设计”的原则,用简易的代码结构就能实现复杂的DIT-FFT蝶形运算,代码设计风格极其简洁,详细可参考附录代码。
本案例是FFT的串行实现,但根据同样的思路和资源换速度的思想,可以很方便地实现多个并行或者全并行的设计。
3、至简设计代码实现(附录部分代码)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 |
parameter N = 512; parameter LOGN = 9; /**************************************** /计数器架构,下面三个计数器用于产生读地址 ****************************************/ always @(posedge clk or negedge rst_n)begin if(!rst_n)begin cnt0 <= 0; end else if(add_cnt0)begin if(end_cnt0) cnt0 <= 0; else cnt0 <= cnt0 + 1; end end assign add_cnt0 = flag; assign end_cnt0 = add_cnt0 && cnt0== (1< always @(posedge clk or negedge rst_n)begin if(!rst_n)begin cnt1 <= 0; end else if(add_cnt1)begin if(end_cnt1) cnt1 <= 0; else cnt1 <= cnt1 + 1; end end assign add_cnt1 = end_cnt0; assign end_cnt1 = add_cnt1 && cnt1==(N>>(cnt2+1))-1 ; always @(posedge clk or negedge rst_n)begin if(!rst_n)begin cnt2 <= 0; end else if(add_cnt2)begin if(end_cnt2) cnt2 <= 0; else cnt2 <= cnt2 + 1; end end assign add_cnt2 = end_cnt1; assign end_cnt2 = add_cnt2 && cnt2==LOGN-1 ; /**************************************** /计数器架构,下面三个计数器用于产生写地址 ****************************************/ always @(posedge clk or negedge rst_n)begin if(!rst_n)begin wr_cnt0 <= 0; end else if(add_wr_cnt0)begin if(end_wr_cnt0) wr_cnt0 <= 0; else wr_cnt0 <= wr_cnt0 + 1; end end assign add_wr_cnt0 = fft_dout_vld; assign end_wr_cnt0 = add_wr_cnt0 && wr_cnt0==(1< always @(posedge clk or negedge rst_n)begin if(!rst_n)begin wr_cnt1 <= 0; end else if(add_wr_cnt1)begin if(end_wr_cnt1) wr_cnt1 <= 0; else wr_cnt1 <= wr_cnt1 + 1; end end assign add_wr_cnt1 = end_wr_cnt0; assign end_wr_cnt1 = add_wr_cnt1 && wr_cnt1==(N>>(wr_cnt2+1))-1 ; always @(posedge clk or negedge rst_n)begin if(!rst_n)begin wr_cnt2 <= 0; end else if(add_wr_cnt2)begin if(end_wr_cnt2) wr_cnt2 <= 0; else wr_cnt2 <= wr_cnt2 + 1; end end assign add_wr_cnt2 = end_wr_cnt1; assign end_wr_cnt2 = add_wr_cnt2 && wr_cnt2==LOGN-1 ; /************************************************ RAM1地址0的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin addr_0 <= 0; end else if(wr_cnt2[0]==0) begin addr_0 <= cnt0 + cnt1*(1<<(cnt2+1)); end else begin addr_0 <= wr_cnt0 + wr_cnt1*(1<<(wr_cnt2+1)); end end /************************************************ RAM1写数据0的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin wdata_0 <= 0; end else begin wdata_0 <= fft_dout0; end end /************************************************ RAM1写请求0的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin wrreq_0 <= 0; end else if(wr_cnt2[0]==1) begin wrreq_0 <= fft_dout_vld; end else begin wrreq_0 <= 0; end end /************************************************ RAM1地址1的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin addr_1 <= 0; end else if(wr_cnt2[0]==0) begin addr_1 <= cnt0 + cnt1*(1<<(cnt2+1)) + (1< end else begin addr_1 <= wr_cnt0 + wr_cnt1*(1<<(wr_cnt2+1)) + (1< end end /************************************************ RAM1写数据1的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin wdata_1 <= 0; end else begin wdata_1 <= fft_dout1; end end /************************************************ RAM1写请求1的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin wrreq_1 <= 0; end else if(wr_cnt2[0]==1)begin wrreq_1 <= fft_dout_vld; end else begin wrreq_1 <= 0; end end /************************************************ RAM2地址0的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin addr_2 <= 0; end else if(wr_cnt2[0]==1) begin addr_2 <= cnt0 + cnt1*(1<<(cnt2+1)); end else begin addr_2 <= wr_cnt0 + wr_cnt1*(1<<(wr_cnt2+1)); end end /************************************************ RAM2写数据0的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin wdata_2 <= 0; end else begin wdata_2 <= fft_dout0; end end /************************************************ RAM2写请求0的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin wrreq_2 <= 0; end else if(wr_cnt2[0]==0) begin wrreq_2 <= fft_dout_vld; end else begin wrreq_2 <= 0; end end /************************************************ RAM2地址1的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin addr_3 <= 0; end else if(wr_cnt2[0]==1) begin addr_3 <= cnt0 + cnt1*(1<<(cnt2+1)) + (1< end else begin addr_3 <= wr_cnt0 + wr_cnt1*(1<<(wr_cnt2+1)) + (1< end end /************************************************ RAM2写数据1的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin wdata_3 <= 0; end else begin wdata_3 <= fft_dout1; end end /************************************************ RAM2写请求1的设计 ************************************************/ always @(posedge clk or negedge rst_n)begin if(rst_n==1'b0)begin wrreq_3 <= 0; end else if(wr_cnt2[0]==0)begin wrreq_3 <= fft_dout_vld; end else begin wrreq_3 <= 0; end end |