跳转至

NIPC毕设

图像+YOLO

图像+YOLO¶

该项目的目的是从用户的电脑上读取一张图片，将其通过网络传输至 HiLinux，HiLinux 进一步将数据和指令传到 FPGA，FPGA 执行 YOLOv3 算法，将得到识别结果传回 HiLinux，再通过网络传回用户电脑，最终在用户电脑上呈现识别结果。

整体架构¶

HiLinux/FPGA 常驻程序¶

FPGA 随时处于就绪状态，能够随时执行 YOLOv3 算法
- 先使用 Vivado Program Device 烧录设备
- 再 reboot HiLinux
HiLinux 开启一个 HTTP server，监听 PC 传输图片数据
- 注：需要先加载 xdma 内核才能调用 xdma 的库——insmod xdma.ko

整体网络传输¶

PC 从文件系统中读取一张图片(JPEG/PNG)到内存，记录图片尺寸(HxW)
PC 将图片数据转为 608x608 RGB8 的像素数组
1. 将长的一边拉伸为608，另一边等比例缩放
2. 再将不足608的边左右/上下对称添加黑边
PC 使用 PNG格式无损压缩像素数组(608x608 RGB8)得到 PNG文件
PC 通过 HTTP(JSON) 传输 PNG文件的 base64编码
HiLinux 对 PNG文件的 base64编码解码得到像素数组
HiLinux 将像素数组通过 PCIE 传输到 FPGA 中
FPGA 执行 YOLOv3算法
HiLinux 通过 PCIE 取回 FPGA 算法执行结果
HiLinux 将执行结果通过 HTTP(JSON) 传回 PC
PC 将识别结果拉伸到原图片尺寸(HxW)
PC 在像素数组(HxW)上框出识别的物体，并将其呈现在屏幕
PC 将像素数组(HxW)生成 PNG文件保存到文件系统

结构体定义¶

PNG图片¶

使用 PNG 标准生成的图片，不使用 interlace。

像素数组¶

宽 608 高 608 的图片，共有 608x608 个像素，一维像素数组的长度为 608x608x3，依次按行扫描存储 R 分量、G 分量、B 分量矩阵。

注：Python - bytes C - char[]

识别结果¶

struct RecognitionResult {
    count: uint32 // 识别结果的数量
    items: [Item] // 识别出的物体的数组
}

struct Item {
    top_left_x: uint32
    top_left_y: uint32
    width: uint32
    height: uint32
    label: char[32]
}