Skip to content

Latest commit

 

History

History
230 lines (188 loc) · 14.3 KB

File metadata and controls

230 lines (188 loc) · 14.3 KB

目标检测-跟踪-分发-属性识别 Demo

English | 简体中文

目录

1. 简介

本例程用于说明如何使用sophon-stream快速构建包含了多算法和按类别发往不同分支的复杂应用。

本例程插件的连接方式如下图所示:

distributor.png

2. 特性

  • 检测模型使用yolov5;
  • 跟踪模型使用bytetrack;
  • 分类模型使用resnet18;
  • 支持BM1684X(x86 PCIe、SoC)和BM1684(x86 PCIe、SoC、arm PCIe)
  • 支持多路视频流
  • 支持多线程

3. 准备模型与数据

​在scripts目录下提供了相关模型和数据的下载脚本 download.sh

# 安装unzip,若已安装请跳过,非ubuntu系统视情况使用yum或其他方式安装
sudo apt install unzip
chmod -R +x scripts/
./scripts/download.sh

脚本执行完毕后,会在当前目录下生成data目录,其中包含modelsvideos两个子目录。

下载的模型包括:

./models
├── BM1684
│   ├── resnet50_fp32_1b.bmodel                     # 用于BM1684的RESNET50 FP32 Bmodel,batch_size=1,imagenet
│   ├── resnet50_fp32_4b.bmodel                     # 用于BM1684的RESNET50 FP32 Bmodel,batch_size=4,imagenet
│   ├── resnet50_int8_1b.bmodel                     # 用于BM1684的RESNET50 INT8 Bmodel,batch_size=1,imagenet
│   ├── resnet50_int8_4b.bmodel                     # 用于BM1684的RESNET50 INT8 Bmodel,batch_size=4,imagenet
│   ├── resnet_pedestrian_gender_fp32_1b.bmodel     # 用于BM1684的RESNET18 FP32 Bmodel,batch_size=1,行人性别分类
│   ├── resnet_pedestrian_gender_fp32_4b.bmodel     # 用于BM1684的RESNET18 FP32 Bmodel,batch_size=4,行人性别分类
│   ├── resnet_pedestrian_gender_int8_1b.bmodel     # 用于BM1684的RESNET18 INT8 Bmodel,batch_size=1,行人性别分类
│   ├── resnet_pedestrian_gender_int8_4b.bmodel     # 用于BM1684的RESNET18 INT8 Bmodel,batch_size=4,行人性别分类
│   ├── resnet_vehicle_color_fp32_1b.bmodel         # 用于BM1684的RESNET18 FP32 Bmodel,batch_size=1,车辆颜色分类
│   ├── resnet_vehicle_color_fp32_4b.bmodel         # 用于BM1684的RESNET18 FP32 Bmodel,batch_size=4,车辆颜色分类
│   ├── resnet_vehicle_color_int8_1b.bmodel         # 用于BM1684的RESNET18 INT8 Bmodel,batch_size=1,车辆颜色分类
│   ├── resnet_vehicle_color_int8_4b.bmodel         # 用于BM1684的RESNET18 INT8 Bmodel,batch_size=4,车辆颜色分类
│   ├── yolov5s_v6.1_3output_fp32_1b.bmodel         # 用于BM1684的YOLOV5 FP32 BModel,batch_size=1,后处理在CPU上进行
│   ├── yolov5s_v6.1_3output_int8_1b.bmodel         # 用于BM1684的YOLOV5 INT8 BModel,batch_size=1,后处理在CPU上进行
│   └── yolov5s_v6.1_3output_int8_4b.bmodel         # 用于BM1684的YOLOV5 INT8 BModel,batch_size=4,后处理在CPU上进行
├── BM1684X
│   ├── resnet50_fp16_1b.bmodel                     # 用于BM1684X的RESNET50 FP16 Bmodel,batch_size=1,imagenet
│   ├── resnet50_fp32_1b.bmodel                     # 用于BM1684X的RESNET50 FP32 Bmodel,batch_size=1,imagenet
│   ├── resnet50_fp32_4b.bmodel                     # 用于BM1684X的RESNET50 FP32 Bmodel,batch_size=4,imagenet
│   ├── resnet50_int8_1b.bmodel                     # 用于BM1684X的RESNET50 INT8 Bmodel,batch_size=1,imagenet
│   ├── resnet50_int8_4b.bmodel                     # 用于BM1684X的RESNET50 INT8 Bmodel,batch_size=4,imagenet
│   ├── resnet_pedestrian_gender_fp16_1b.bmodel     # 用于BM1684X的RESNET18 FP16 Bmodel,batch_size=1,行人性别分类
│   ├── resnet_pedestrian_gender_fp32_1b.bmodel     # 用于BM1684X的RESNET18 FP32 Bmodel,batch_size=1,行人性别分类
│   ├── resnet_pedestrian_gender_fp32_4b.bmodel     # 用于BM1684X的RESNET18 FP32 Bmodel,batch_size=4,行人性别分类
│   ├── resnet_pedestrian_gender_int8_1b.bmodel     # 用于BM1684X的RESNET18 INT8 Bmodel,batch_size=1,行人性别分类
│   ├── resnet_pedestrian_gender_int8_4b.bmodel     # 用于BM1684X的RESNET18 INT8 Bmodel,batch_size=4,行人性别分类
│   ├── resnet_vehicle_color_fp16_1b.bmodel         # 用于BM1684X的RESNET18 FP16 Bmodel,batch_size=1,车辆颜色分类
│   ├── resnet_vehicle_color_fp32_1b.bmodel         # 用于BM1684X的RESNET18 FP32 Bmodel,batch_size=1,车辆颜色分类
│   ├── resnet_vehicle_color_fp32_4b.bmodel         # 用于BM1684X的RESNET18 FP32 Bmodel,batch_size=4,车辆颜色分类
│   ├── resnet_vehicle_color_int8_1b.bmodel         # 用于BM1684X的RESNET18 INT8 Bmodel,batch_size=1,车辆颜色分类
│   ├── resnet_vehicle_color_int8_4b.bmodel         # 用于BM1684X的RESNET18 INT8 Bmodel,batch_size=4,车辆颜色分类
│   ├── yolov5s_v6.1_3output_fp16_1b.bmodel         # 用于BM1684X的YOLOV5 FP16 BModel,batch_size=1,后处理在CPU上进行
│   ├── yolov5s_v6.1_3output_fp32_1b.bmodel         # 用于BM1684X的YOLOV5 FP32 BModel,batch_size=1,后处理在CPU上进行
│   ├── yolov5s_v6.1_3output_int8_1b.bmodel         # 用于BM1684X的YOLOV5 INT8 BModel,batch_size=1,后处理在CPU上进行
│   └── yolov5s_v6.1_3output_int8_4b.bmodel         # 用于BM1684X的YOLOV5 INT8 BModel,batch_size=4,后处理在CPU上进行
└── BM1684X_tpukernel
    ├── yolov5s_tpukernel_fp16_1b.bmodel            # 用于BM1684X的YOLOV5 FP16 BModel,batch_size=1,后处理采用tpu_kernel
    ├── yolov5s_tpukernel_fp32_1b.bmodel            # 用于BM1684X的YOLOV5 FP32 BModel,batch_size=1,后处理采用tpu_kernel
    ├── yolov5s_tpukernel_int8_1b.bmodel            # 用于BM1684X的YOLOV5 INT8 BModel,batch_size=1,后处理采用tpu_kernel
    └── yolov5s_tpukernel_int8_4b.bmodel            # 用于BM1684X的YOLOV5 INT8 BModel,batch_size=4,后处理采用tpu_kernel

下载的数据包括:

./videos/                                           # 测试视频
├── carvana_video.mp4
├── mot17_01_frcnn.mp4
├── mot17_03_frcnn.mp4
├── mot17_06_frcnn.mp4
├── mot17_07_frcnn.mp4
├── mot17_08_frcnn.mp4
├── mot17_12_frcnn.mp4
├── mot17_14_frcnn.mp4
├── test_car_person_1080P.avi
└── traffic.mp4

4. 环境准备

如果您在x86/arm平台安装了PCIe加速卡(如SC系列加速卡),可以直接使用它作为开发环境和运行环境。您需要安装libsophon、sophon-opencv和sophon-ffmpeg,具体步骤可参考x86-pcie平台的开发和运行环境搭建arm-pcie平台的开发和运行环境搭建

4.2 SoC平台

如果您使用SoC平台(如SE、SM系列边缘设备),刷机后在/opt/sophon/下已经预装了相应的libsophon、sophon-opencv和sophon-ffmpeg运行库包,可直接使用它作为运行环境。通常还需要一台x86主机作为开发环境,用于交叉编译C++程序。

5. 程序编译

程序运行前需要编译可执行文件。

5.1 x86/arm PCIe平台

可以直接在PCIe平台上编译程序,具体请参考sophon-stream编译

5.2 SoC平台

通常在x86主机上交叉编译程序,您需要在x86主机上使用SOPHON SDK搭建交叉编译环境,将程序所依赖的头文件和库文件打包至sophon_sdk_soc目录中,具体请参考sophon-stream编译。本例程主要依赖libsophon、sophon-opencv和sophon-ffmpeg运行库包。

6. 程序运行

6.1 Json配置说明

配置文件位于 ./config目录,结构如下所示:

./config
├── bytetrack.json                                                    # bytetrack跟踪算法配置
├── converger.json                                                    # 汇聚element配置
├── decode.json                                                       # 解码配置
├── distributor_class.json                                            # 每帧按类别分发
├── distributor_frame_class.json                                      # 跳帧按类别分发
├── distributor_frame.json                                            # 跳帧分发full frame
├── distributor_time_class.json                                       # 间隔时间按类别分发(默认)
├── distributor_time.json                                             # 间隔时间分发full frame
├── engine.json                                                       # graph配置
├── engine_group.json                                                 # 简化的graph配置
├── resnet_car.json                                                   # resnet 车辆颜色分类
├── resnet_person.json                                                # resnet 行人性别分类
├── yolov5_bytetrack_distributor_resnet_converger_demo.json           # demo配置
├── yolov5_group.json                                                 # 简化的yolov5配置文件,将yolov5的前处理、推理、后处理合到一个配置文件中
├── yolov5_infer.json                                                 # yolov5 推理配置
├── yolov5_post.json                                                  # yolov5 后处理配置
└── yolov5_pre.json                                                   # yolov5 前处理配置

其中,yolov5_bytetrack_distributor_resnet_converger_demo.json是例程的整体配置文件,管理输入码流等信息。在一张图上可以支持多路数据的输入,channels参数配置输入的路数,channel中包含码流url等信息。

配置文件中不指定channel_id属性的情况,会在demo中对每一路数据的channel_id从0开始默认赋值。

{
  "channels": [
    {
      "channel_id": 0,
      "url": "../yolov5_bytetrack_distributor_resnet_converger/data/videos/traffic.mp4",
      "source_type": "VIDEO",
      "loop_num": 1,
      "fps": 25
    },
    {
      "channel_id": 1,
      "url": "../yolov5_bytetrack_distributor_resnet_converger/data/videos/traffic.mp4",
      "source_type": "VIDEO",
      "loop_num": 1,
      "fps": 25
    },
    {
      "channel_id": 2,
      "url": "../yolov5_bytetrack_distributor_resnet_converger/data/videos/traffic.mp4",
      "source_type": "VIDEO",
      "loop_num": 1,
      "fps": 25
    },
    {
      "channel_id": 3,
      "url": "../yolov5_bytetrack_distributor_resnet_converger/data/videos/traffic.mp4",
      "source_type": "VIDEO",
      "loop_num": 1,
      "fps": 25
    }
  ],
  "class_names": "../yolov5_bytetrack_distributor_resnet_converger/data/coco.names",
  "car_attributes": "../yolov5_bytetrack_distributor_resnet_converger/data/car.attributes",
  "person_attributes": "../yolov5_bytetrack_distributor_resnet_converger/data/person.attributes",
  "download_image": true,
  "draw_func_name": "draw_yolov5_bytetrack_distributor_resnet_converger_results",
  "engine_config_path": "../yolov5_bytetrack_distributor_resnet_converger/config/engine_group.json"
}

engine.json包含对graph的配置信息,这部分配置确定之后基本不会发生更改。

在该文件内,需要初始化每个element的信息和element之间的连接方式。element_id是唯一的,起到标识身份的作用。element_config指向该element的详细配置文件地址,port_id是该element的输入输出端口编号,多输入或多输出的情况下,输入/输出编号也不可以重复。is_src标志当前端口是否是整张图的输入端口,is_sink标识当前端口是否是整张图的输出端口。 connection是所有element之间的连接方式,通过element_id和port_id确定。

yolov5_group.json等配置文件是对具体某个element的配置细节,设置了模型参数、动态库路径、阈值等信息。该配置文件不需要指定id字段和device_id字段,例程会将engine.json中指定的element_iddevice_id传入。其中,thread_numberelement内部的工作线程数量,一个线程会对应一个数据队列,多路输入情况下,需要合理设置数据队列数目,来保证线程工作压力均匀且合理。

use_tpu_kerneltrue时,会使用tpu_kernel后处理。tpu_kernel后处理只支持BM1684X设备。

6.2 运行

对于PCIe平台,可以直接在PCIe平台上运行测试;对于SoC平台,需将交叉编译生成的动态链接库、可执行文件、所需的模型和测试数据拷贝到SoC平台中测试。

SoC平台上,动态库、可执行文件、配置文件、模型、视频数据的目录结构关系应与原始sophon-stream仓库中的关系保持一致。

测试的参数及运行方式是一致的,下面主要以PCIe模式进行介绍。

运行可执行文件

./main --demo_config_path=../yolov5_bytetrack_distributor_resnet_converger/config/yolov5_bytetrack_distributor_resnet_converger_demo.json

运行结果存放在./build/results目录下。本例程默认配置方式为每秒按类别发送到resnet分支,会在结果目录中每秒保存一帧绘制了目标box、track_id和具体属性的图像。

result

7. 性能测试

由于全流程依赖输入视频fps且画图速度慢,本例程暂不提供性能测试结果,如需各模型推理性能,请到对应模型例程查看。