DingWave BBS
 找回暗码
 立刻注册

澳门太阳集团2005

只需一步,快速开端

扫一扫,会见微社区

3017.com
搜索
热搜: 活动 结交 discuz
检察: 203|复兴: 1
打印 上一主题 下一主题

一种FFT的CPU指令优化

[复制链接]
陈维超 登录太阳城集团

30

主题

70

帖子

545

积分

定为电子技术有限公司

Rank: 8Rank: 8

积分
545
跳转到指定楼层
楼主
3017.com 揭晓于 2018-12-12 17:01:29 | 只看该作者 回帖嘉奖 |倒序阅读 |浏览模式
FFT算法的根本单位是如许的蝶形算子:
两对复数Cs0、Cs1和Cd0、Cd1,需求的获得积和项和积差项:
S=Cs0×Cd0+Cs1+Cd1
D=Cs1+Cd1-Cs0×Cd0
关于定为产物系统而言,AD采回每路数据各16位(有标记short型,实践值范畴能够仅是-2048~2047)个I和Q,若将前者作为实部,后者作为虚部,则组成了覆信号时域样点C。
应用到上述蝶形算子,则能够得出S和D。
但是,在利用初级言语编程实现时,这个蝶形算子是需求消耗屡次内存存取、以及浮点的乘法和加减运算的。
这里给出一种操纵SSE指令及其xmm协处置寄存器,对这类蝶形算子的优化办法,以期:
1、仅在运算前读一次内存
2、仅在运算后写一次内存
3、乘法运算是4路并行的
4、颠末指令乱序后,80%以上指令也是并行的(实质上,每一个CPU核,都有多个并行流水处置通道,绝大多数品种的相邻两条无关指令(后一条源操作数不依赖前一条的运算成果)可并行地送入差别的并行流水处置通道。
本帖子中包罗更多资本

您需求 登录 才能够下载或检察,没有帐号?立刻注册

x

您需求登录后才能够回帖 登录 | 立刻注册 www.2007.com

本版积分划定规矩

菲律宾申搏sunbet官网

|Archiver|手机版|小黑屋|成都定为电子技术有限公司. ( )   

GMT+8, 2019-5-1 11:28 , Processed in 0.203125 second(s), 29 queries .

Powered by X3.2

© 2001-2013

菲律宾申搏sunbet官网 菲律宾申搏sunbet官网 返回列表