基于国产ARM与低成本FPGA高速通信的3种方案
2022-11-22
来源:创龙科技
前 言
近年来,随着中国新基建、中国制造2025的持续推进,单ARM处理器越来越难胜任工业现场的功能要求,特别是能源电力、工业控制、智慧医疗等行业通常需要ARM+FPGA架构的处理器平台来实现特定的功能,例如多路/高速AD采集、多路网口、多路串口、多路/高速并行DI/DO、高速数据并行处理等。
那ARM+FPGA架构有什么优势? ARM:接口资源丰富、功耗低,擅长多媒体显示、逻辑控制等。 FPGA:擅长多通道或高速AD采集、接口拓展、高速信号传输、高速数据并行处理等。 因此,ARM+FPGA架构能带来性能、成本、功耗等综合比较优势,ARM与FPGA既可各司其职,各自发挥原本架构的独特优势,亦可相互协作处理更复杂的问题。 对于成本不敏感且通信速率要求的较高分立式ARM+FPGA场合,一般使用PCIe通信接口。但对成本敏感的分立式ARM+FPGA场合,PCIe通信接口则令FPGA芯片成本高居不下。
对于能源电力、工业控制等众多工业领域,真正需要的是性能与成本均具有竞争力的方案,既要求能做到ARM与FPGA的高速通信,又要做到成本最优,并且最好能基于国产方案。
在这种需求背景下,创龙科技提供了基于国产ARM与低成本FPGA高速通信的3种方案。
* 硬件平台介绍(全志科技T3/A40i) 创龙科技TLT3-EVM/TLA40i-EVM是一款基于全志科技T3/A40i处理器设计的4核ARM Cortex-A7国产工业评估板,每核主频高达1.2GHz,由核心板和评估底板组成。T3与A40i两者pin to pin兼容。
评估板接口资源丰富,引出双路网口、双路CAN、双路USB、双路RS485等通信接口,板载Bluetooth、WIFI、4G(选配)模块,同时引出MIPI LCD、LVDS LCD、TFT LCD、HDMI OUT、CVBS OUT、CAMERA、LINE IN、H/P OUT等音视频多媒体接口,支持双屏异显、Mali400 MP2 GPU,1080P@45fps H.264视频硬件编码、1080P@60fps H.264视频硬件解码,并支持SATA大容量存储接口。 核心板采用100%国产元器件方案,并经过专业的PCB Layout和高低温测试验证,稳定可靠,可满足各种工业应用环境。评估底板大部分元器件均采用国产方案,方便用户快速进行产品方案评估与技术预研。
本文主要介绍T3/A40i与紫光同创PGL25G/Xilinx Spartan-6基于SPI、SDIO、CSI的3种高速通信方案,最高通信速率可达到55.1MB/s。
备注:目前,创龙科技已推出T3/A40i+PGL25G全国产一体化工业核心板方案,国产化率100%(连接器亦为国产),
图 3 T3/A40i+PGL25G全国产工业核心板 (国产化率100%)
1 spi_rw案例
1.1 案例说明
案例功能:主要演示T3/A40i(ARM Cortex-A7)与PGL25G/Spartan-6(FPGA)处理器之间的SPI通信。
ARM端实现SPI Master功能
a.打开SPI设备节点,如:/dev/spidev0.0。 b.使用ioctl配置SPI总线,如SPI总线极性和相位、通信速率、数据字长度等。 c.选择模式为单线模式或双线模式。当SPI总线为双线模式时,发送数据是单线模式,接收数据是双线模式。 d.发送数据至SPI总线,并从SPI总线读取数据。(备注:如单次传输数据大于64Byte,驱动程序将会自动启用DMA传输功能。) e.打印发送和接收速率。 f.校验读写数据,然后打印误码率。
FPGA端实现SPI Slave功能 a.FPGA将SPI Master发送的2KByte数据保存至BRAM。 b.SPI Master发起读数据时,FPGA从BRAM读取2KByte通过SPI总线传输给SPI Master。 c.当SPI总线为双线模式,接收数据支持双线模式,而发送数据不支持双线模式。
图 4 ARM端程序流程图
测试结果 (1)SPI单线模式 根据官方数据手册,SPI总线通信时钟频率理论值最大为100MHz。本次测试指定SPI总线通信时钟频率为最大值100MHz,则SPI单线模式理论速率为:(100000000/1024/1024/8)MB/s ≈ 11.92MB/s。实测SPI单线模式写速率为:10.924MB/s,SPI单线模式读速率为:10.924MB/s。 (2)SPI双线模式 根据官方数据手册,SPI总线通信时钟频率理论值最大为100MHz。本次测试指定SPI总线通信时钟频率为最大值100MHz,则SPI单线模式理论速率为:(100000000/1024/1024/8)MB/s ≈ 11.92MB/s;则SPI双线模式理论速率为:(100000000/1024/1024/4)MB/s ≈ 23.84MB/s。本次实测SPI单线模式写速率为11.631MB/s,SPI双线模式读速率为17.807MB/s。
2 rt_spi_rw案例 2.1 案例说明
案例功能:基于Linux-RT系统,演示T3/A40i(ARM Cortex-A7)与PGL25G/Spartan-6(FPGA)处理器之间的SPI通信(单线模式)。
ARM端实现SPI Master功能 a.打开SPI设备节点。如:/dev/spidev0.0。 b.使用ioctl配置SPI总线。如SPI总线极性和相位、通信速率、数据字长度等。 c.创建实时线程。 d.发送数据至SPI总线,以及从SPI总线读取数据。 e.打印发送、接收的速率和传输耗时。 f.校验读写数据,然后打印误码率。 FPGA端实现SPI Slave功能 a.FPGA将SPI Master发送的2KByte数据保存至BRAM。 b.SPI Master发起读数据时,FPGA从BRAM读取2KByte通过SPI总线传输给SPI Master。
图 5 ARM端程序流程图
测试结果
(1)非轮询方式 根据官方数据手册可知,SPI总线通信时钟频率理论值最大为100MHz。本次测试指定SPI总线通信时钟频率为最大值100MHz,则理论速率为:(100000000/1024/1024/8)MB/s ≈ 11.92MB/s。实测传输4Byte数据的最小耗时为49us,最大耗时为662us,平均耗时为227us;写速率为0.017MB/s,读速率为0.017MB/s。 (2)轮询方式 根据官方数据手册可知,SPI总线通信时钟频率理论值最大为100MHz。本次测试指定SPI总线通信时钟频率为最大值100MHz,则理论速率为:(100000000/1024/1024/8)MB/s ≈ 11.92MB/s。实测传输4Byte数据的最小耗时为14us,最大耗时为59us,平均耗时为14us;写速率为0.239MB/s,读速率为0.239MB/s。
3 sdio_test案例
3.1 案例说明
案例功能:演示T3/A40i(ARM Cortex-A7)与PGL25G/Spartan-6(FPGA)处理器之间的SDIO通信。
ARM端实现SDIO Master功能 a.打开SDIO设备节点,如:/dev/generic_sdio0。 b.发送数据至SDIO总线,以及从SDIO总线读取数据。 c.打印发送和接收速率。 d.校验读写数据,然后打印误码率。
FPGA端实现SDIO Slave功能 a.FPGA将SDIO Master发送的2KByte数据保存至BRAM。 b.SDIO Master发起读数据时,FPGA从BRAM读取2KByte通过SDIO总线传输给SDIO Master。
图 6 ARM端程序流程图
测试结果
本次测试指定SDIO总线通信时钟频率为25MHz(最高50MHz),则理论通信速率为:(25 x 4 / 8)MB/s = 12.5MB/s。实测写速率为5.113MB/s,读速率为5.440MB/s,误码率为0.0%。
4 csi_test案例
4.1 案例说明
案例功能:演示T3/A40i(ARM Cortex-A7)与PGL25G/Spartan-6(FPGA)处理器之间的CSI通信案例。
ARM端功能
a)基于Linux子系统V4L2。 b)通过CSI总线,采集指定帧数数据。 c)计算总耗时。 d)打印平均采集速率,并校验最后一帧图像的数据。 FPGA端功能 a)将测试数据(0x00 ~ 0xFF)写入FIFO。 b)从FIFO读出数据,按行与帧的方式、1024 x 512的分辨率,通过CSI总线发送至ARM端。 使用的CSI总线为CSI0,最高支持分辨率为1080P30,数据位宽为8bit。功能框图与程序流程图,如下图所示。
图 7 功能框图
图 8 ARM端程序流程图
测试结果
FPGA端将CSI_PCLK设置为65MHz,测试数据写入FIFO的时钟FIFO_WR_CLK设置为59MHz。由于FPGA端需将数据写入FIFO再从FIFO读出后发送,每一行与每一帧之间的间隔时间会受FIFO写入的速率影响,因此CSI通信的实际理论传输带宽应为:(59MHz x 8bit / 8)MB/s = 59MB/s。实测传输速率为55.1MB/s,误码率为0.0%。
更多信息可以来这里获取==>>电子技术应用-AET<<