【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践，并尽量实现皮肤病理图片的识别，第三阶段

*附件：VF-G60K225_引脚定义-20250117-V1.0.xlsx

接上回，这次说一说第三阶段的进展，一直在想如何将cnn融合进高云以后的视频案例里面，比如：下图
上面图中文件之间的关系应该是这样的：

一、完整的视频数据处理流程

根据这些文件名，我们可以清晰地勾勒出整个数据流的路径。这是一个典型的FPGA图像处理系统架构：

输入端 (Camera Input) -> ISP (图像信号处理) -> DDR3 缓存 (Frame Buffer) -> 显示输出 (Display Output)

下面是每个阶段涉及的模块和具体工作：

阶段一：摄像头数据接收与解码 (MIPI/LVDS Input)

物理层: 数据首先从摄像头传感器通过高速差分接口（如MIPI或LVDS）进入FPGA。
- src\MIPIRx1LaneFre.v: 这是一个MIPI D-PHY接收器，负责接收MIPI协议的物理层信号。
- src\lvds_seders\ddio_lvds.v: 这是一个LVDS接收器（Serializer/Deserializer），负责接收LVDS信号。
协议层: 接收到的串行数据需要被解码成并行的像素数据。
- src\MIPI\mipi_dsi_csi2_rx\mipi_dsi_csi2_rx.v: 核心的MIPI CSI-2协议解码模块，将MIPI数据包解析成像素行和帧。
- src\MIPI\mipi_byte_to_pixel_converter\mipi_byte_to_pixel_converter.v: 将解码后的字节流转换为像素格式。
- src\MIPI\mipi_rx_advance\mipi_rx_advance.v: 可能是一些高级的MIPI接收控制逻辑。
输出: 这个阶段的最终输出是原始的、未经处理的Bayer RAW格式的像素数据流。

阶段二：图像信号处理 (ISP - Image Signal Processing)

原始的Bayer数据是不能直接观看的，必须经过一系列复杂的ISP算法处理，才能变成我们肉眼看到的彩色图像。

Bayer到RGB转换 (Demosaicing):
- src\isp\bayer2rgb\Line_Shift_RAM_8Bit.v: 这是一个行缓存。Bayer转RGB算法（如插值）需要同时访问相邻几行的数据，这个RAM就是用来缓存前几行像素的。
- src\isp\bayer2rgb\VIP_RAW8_RGB888.v: 核心的Bayer转RGB模块，将单色的Bayer模式（R-G-G-B）转换为全彩色的RGB888格式。
色彩校正 (Color Correction):
- src\isp\bayer2rgb\VIP_Matrix_Generate_3X3_8Bit.v: 这是一个3x3矩阵乘法器。它用于进行色彩校正（CCM - Color Correction Matrix），修正因传感器和镜头导致的颜色偏差，使颜色看起来更自然。
图像几何变换:
- src\isp\FrameBoundCrop.v 和 src\isp\Sensor_Image_XYCrop.v: 这两个模块用于图像裁剪（Cropping），可以切掉图像边缘的无效区域，或者提取感兴趣的区域（ROI - Region of Interest）。
输出: 经过ISP流水线处理后，我们得到了可以直接显示的RGB格式的图像数据流。

阶段三：DDR3帧缓存 (Frame Buffering)

视频数据流的速度和显示刷新的速度往往不匹配，或者后续处理需要访问整帧图像，因此需要一个大容量的DDR3内存作为帧缓冲。

src\axi\axi4_ctrl.v: 核心的AXI控制器（我们在上一问中详细分析过）。它负责将ISP处理完的RGB图像数据流写入DDR3内存，并在需要时再从DDR3中读出。
src\DDR3\DDR3ControllerGWTopLite.v: DDR3内存控制器IP核。它将AXI总线协议转换为DDR3芯片能理解的底层读写命令。
src\DDR3\R0_FIFO_128... 和 src\DDR3\W0_FIFO_128...: 用于AXI控制器和DDR3控制器之间数据通路的异步FIFO，处理跨时钟域问题。
src/DDR3/DDR_Tick_Generator.v 和 src/DDR3/Reset.v: 为DDR3控制器提供时钟和复位信号。
工作流程: ISP输出的RGB数据流被axi4_ctrl.v写入DDR3中的某个帧缓冲区。当一帧写完后，可以通知显示控制器来读取。

阶段四：显示输出 (Display Output)

src\lcd_display\lcd_driver.v 和 src\lcd_display\lcd_para.v: LCD显示驱动模块，负责从DDR3中（通过axi4_ctrl.v）读取帧数据，并生成LCD屏幕所需要的特定时序信号（如HSYNC, VSYNC, DE）。
src\hdmi_ip\rgb2dvi.v, src\hdmi_ip\tmds_channel.v, src\hdmi_ip\tmds_enc_rtl.v: HDMI输出模块。如果目标是HDMI显示器，这些模块会将RGB数据编码成TMDS差分信号，通过HDMI接口发送出去。
PLL模块 (src\PLL...): 为系统中的不同部分（如DDR控制器、HDMI输出）提供所需的各种频率的时钟。
这就要求我对每个文件的逻辑都比较熟悉？看到这么多文件，我觉得要弄明白要花一点时间，同时还要将cnn拼接到合适的模块之间？我根据之前的思考，再借助一点大模型，我觉得这里的方案可以试一试：
在哪个阶段介入CNN能更好地实现图像处理？

这是一个非常关键的架构决策问题。根据处理任务的不同，CNN可以介入在不同的阶段，但有一个最佳的介入点**。**

方案A：在ISP之后，DDR3之前（最佳方案 ✅）

位置: 将CNN处理模块插入到 ISP流水线 和 axi4_ctrl.v的写通道 之间。
数据流:
ISP -> (清晰的RGB图像) -> CNN模块 -> (处理后的图像或特征) -> AXI控制器 -> DDR3
为什么这是最佳方案？
- 处理高质量图像: ISP已经完成了去噪、白平衡、色彩校正等基础工作，输出的RGB图像质量最高，最适合作为CNN的输入，能获得最高的识别/分析准确率。
- 流式处理（Streaming）: 这种“在线（On-the-fly）”的处理方式可以实现极低的延迟。ISP每输出一个像素或一个像素块，CNN模块就可以立即开始处理，无需等待整帧图像被写入DDR。这对于实时应用（如自动驾驶、工业检测）至关重要。
- 节省DDR带宽:
  - 如果CNN的任务是目标检测或分类**，它输出的只是少量元数据（如坐标、类别），我们只需要将这些元数据写入DDR，而无需存储整帧原始图像，极大地节省了DDR带宽和容量。**
  - 如果CNN的任务是图像增强或风格迁移**（Image-to-Image），它会输出一帧新的图像。将处理后的图像直接写入DDR，也只占用一次写带宽。**
- 易于实现ROI: ISP中的裁剪模块可以先提取出感兴趣区域（ROI），然后只将ROI部分送入CNN，减少了CNN的计算量。

方案B：在DDR3之后，显示之前

位置: CNN模块从DDR3中读取图像，处理后再写回DDR3，或者直接送给显示控制器。
数据流:
ISP -> AXI -> DDR3 -> AXI -> CNN模块 -> DDR3/Display
缺点:
- 高延迟: 必须等待至少一整帧图像被完全写入DDR后，CNN才能开始读取和处理。这引入了至少一帧的延迟。
- 带宽瓶颈: 这个方案至少需要一次DDR写（ISP写入）和一次DDR读（CNN读取），占用了双倍的DDR带宽。如果处理结果还要写回DDR，就需要三次DDR访问，带宽很容易成为瓶颈。
- 架构复杂: 需要更复杂的DMA控制器来调度CNN对DDR的访问。
  这里有2哥方案，不管哪一种，我都需要先弄明白这个模块之间的拼图，所以要看源码？另外要看数据怎么接入cnn的？
  所以下面就是最近的工作：
  *附件：VF-G60K225_引脚定义-20250117-V1.0.xlsx
  从这里面想了解一下不同模块的物理引脚分配情况
  还有这个文件，正在进行模块拼接，由于信号太多，并且还不是很熟悉，所以还有很多事情要做？
  *附件：02-2_SC2210_DDR3_LVDS_1024600.xlsx
  好吧，时间过的真快，我真想早点把这些弄明白

【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践，并尽量实现皮肤病理图片的识别，第三阶段

一、完整的视频数据处理流程

阶段一：摄像头数据接收与解码 (MIPI/LVDS Input)

阶段二：图像信号处理 (ISP - Image Signal Processing)

阶段三：DDR3帧缓存 (Frame Buffering)

阶段四：显示输出 (Display Output)

在哪个阶段介入CNN能更好地实现图像处理？

方案A：在ISP之后，DDR3之前（最佳方案 ✅）

方案B：在DDR3之后，显示之前

相关推荐

评论

热门标签更多

最新文章

浏览过的版块

【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践，并尽量实现皮肤病理图片的识别，第三阶段

一、 完整的视频数据处理流程

阶段一：摄像头数据接收与解码 (MIPI/LVDS Input)

阶段二：图像信号处理 (ISP - Image Signal Processing)

阶段三：DDR3帧缓存 (Frame Buffering)

阶段四：显示输出 (Display Output)

在哪个阶段介入CNN能更好地实现图像处理？

方案A：在ISP之后，DDR3之前（最佳方案 ✅）

方案B：在DDR3之后，显示之前

相关推荐

评论

热门标签 更多

最新文章

浏览过的版块

一、完整的视频数据处理流程

热门标签更多