admin 发表于 2022-6-26 15:08:24

在工业领域,DSP将要被ARM淘汰了?ARM + DSP才是更优解?

随着ARM芯片技术的高速更新迭代,越来越多工业应用场景都使用ARM架构实现,ARM既可跑操作系统(Linux、FreeRTOS等)满足复杂应用需求,亦可跑裸机满足高实时等应用需求。由于ARM生态系统十分完善,因此在人机交互、网络通信、文件系统管理方面,有着得天独厚的优势。

业界部分开发者当中,曾经有着DSP(数字信号处理器)将要被ARM淘汰的流言。那么,DSP真的要被时代抛弃了吗?暂且让我们先来盘一盘DSP的特点与优势吧。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/9f2d68358d1c466baf7df677b398e1bf~tplv-tt-large.image?x-expires=1971588835&x-signature=EwjhpO4WaEzGaa%2BO0LL95pIK3EI%3D

图 1 C66x DSP结构框图
(1)DSP芯片一般采用的是哈佛结构(Havard Structure),可同时对数据和程序进行寻址,大大提高了数据处理能力,非常适合于实时信号处理。TI公司的DSP芯片结构是改进的哈佛结构,改进之处是在数据总线和程序总线之间进行局部的交叉连接,使得允许数据存放在程序存储器中,并被算术运算指令直接使用,增强了芯片的灵活性。
(2)DSP拥有专门的指令集,主要是专门针对数字信号处理的,如通讯和多媒体处理。
(3)DSP采用专用的硬件乘法器以及快速的指令周期,它可在一个指令周期中同时完成一次乘法和一次加法,这非常适合快速傅立叶变换的需求。目前TI公司的C6000系列的C66x DSP处理器工作主频可高达1.25GHz。
(4)浮点运算DSP比定点运算DSP的动态范围要大很多。定点DSP的字长每增加1bit,动态范围过大6dB,32bit浮点运动DSP的动态范围可做到1536dB,不仅大大扩大了动态范围,提高了运算精度,还大大节省了运算时间和存储空间,为复杂算法的实时处理提供了保证。目前TI公司的C6000系列的C66x DSP处理器的浮点可高达22.4GFLOPS。
可以看到,以上DSP优势是ARM所不擅长的。在面对一些需要高速复杂的运算场景,DSP仍然拥有不可替代作用,特别是精密数控系统、机器人控制系统、测试测量仪器、能源电力监测、电力电子技术、音视频处理等工业应用领域。

面对这些复杂的应用场景,既需要ARM的强大综合处理能力,又需要DSP的强大数字信号处理能力,因此ARM + DSP也成为了工业领域很多产品的经典架构。而不是部分开发者所认为的ARM即将淘汰DSP,其实DSP一般都已经和ARM架构融合到一个SoC处理器中,各自发挥各自的优势,此时的DSP也更类似ARM的一个协处理器。

TI从2000年开始一直不断推出ARM + DSP架构SoC处理器,从以往的DM6446、DM3730、OMAPL138,到最新的AM5728、AM5708,每一款处理器都在工业应用领域大放光彩,成为众多工业客户的首选处理器。

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/03c74e8aad534f1e88fb02e49717aa7f~tplv-tt-large.image?x-expires=1971588835&x-signature=FR5rNVNC5tSDHpN%2FgtGjlEOwSpo%3D

下面详细介绍下TI最新ARM + DSP处理器AM5708/AM5728,它们分别由ARM Cortex-A15 + 浮点DSP C66x构成。

芯片硬件资源对比
表 1
AM5728
AM5708
2x ARM Cortex-A15,主频1.5GHz
1x ARM Cortex-A15,主频1GHz
2x DSP C66x,主频750MHz,支持浮点运算
1x DSP C66x,主频750MHz,支持浮点运算
2x IPU(Image Processing Unit),每个IPU子系统含2个ARM Cortex-M4核心,共4个ARM Cortex-M4核心
2x IPU(Image Processing Unit),每个IPU子系统含2个ARM Cortex-M4核心,共4个ARM Cortex-M4核心
2x PRU-ICSS,每个PRU-ICSS子系统含2个PRU(Programmable Real-time Unit)核心,共4个PRU核心
2x PRU-ICSS,每个PRU-ICSS子系统含2个PRU(Programmable Real-time Unit)核心,共4个PRU核心,支持EtherCAT等协议
1x IVA-HD Video Codec,支持1路1080P60 H.264视频硬件编解码
1x IVA-HD Video Codec,支持1路1080P60 H.264视频硬件编解码
2x SGX544 3D GPU图形加速器
1x SGX544 3D GPU图形加速器
1x GC320 2D图形加速器
1x GC320 2D图形加速器
2.5MByte On-Chip Memory
512KByte On-Chip Shared Memory
3x VIP(Video Input Ports),支持8路1080P60视频输入
1x VIP(Video Input Ports),支持4路1080P60视频输入
不支持MIPI
1x MIPI CSI-2(Camera Serial Interface 2)
1x TV OUTPUT,支持HDMI/DPI 1080P60
1x TV OUTPUT,支持HDMI/DPI 1080P60
3x LCD OUTPUT
2x LCD OUTPUT
3x eHRPWM
3x eHRPWM
3x eCAP
3x eCAP
3x eQEP
3x eQEP
1x NMI
1x NMI
1x PCIe Gen2,支持一个双通道端口,或两个单通道端口,每通道最高通信速率5Gbps
1x PCIe Gen2,支持一个双通道端口,或两个单通道端口,每通道最高通信速率5Gbps
1x USB 2.0
1x USB 2.0
1x USB 3.0
1x USB 3.0
2x 10/100/1000M Ethernet
2x 10/100/1000M Ethernet
3x MMC/SD/SDIO
3x eMMC/SD/SDIO
10x UART
10x UART
1x JTAG
1x JTAG
2x Watchdog
2x Watchdog
1x SATA
不支持SATA
1x GPMC
1x GPMC,支持8个片选信号
5x I2C
5x I2C
2x DCAN
2x DCAN
8x McASP
8x McASP
1x QSPI
1x QSPI
4x SPI
4x SPI
核心板满负载功耗:10.1W
核心板满负载功耗:5.1W


创龙科技基于AM5708、AM5728设计的两款工业评估板TL570x-EVM、TL5728-EasyEVM,由核心板和评估底板组成。核心板经过专业的PCB Layout和高低温测试验证,稳定可靠,可满足运动控制、工业PC、机器视觉、智能电力、视频监测等工业应用环境。
* AM5708

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/c4d1f738dc24447cad2f7894345bea6b~tplv-tt-large.image?x-expires=1971588835&x-signature=5aMQYuZW4nAA04BhuzNaqnV8egw%3D

图3 SOM-TL570x核心板

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/f44d4ba9853a42bcb92c05d9912c4d03~tplv-tt-large.image?x-expires=1971588835&x-signature=Rf6AwCfeZN%2FgFIg%2F9bytXQuYCfc%3D

图4 TL570x-EVM开发板
* AM5728

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/a86d942db611480d8f02f3c3303941a6~tplv-tt-large.image?x-expires=1971588835&x-signature=mVXp8xvXOBRuHTbJir3SorZAI1k%3D

图5 SOM-TL5728核心板

https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/23adacb2f55a4a51b3cded10ecb6900e~tplv-tt-large.image?x-expires=1971588835&x-signature=2%2FQXvL1uR6K%2F%2FCjgqJx70e3%2BEEs%3D

图6 TL5728-EasyEVM开发板
页: [1]
查看完整版本: 在工业领域,DSP将要被ARM淘汰了?ARM + DSP才是更优解?