0%

MDNet

2019年6月4日 下午11:35

我认为MDNet就是在R-CNN上进行更改的,核心有两个

  1. Motivation1是明确问题思路,Motivation2是简化问题
  2. 与R-CNN的区别:
    1. 由于是一个跟踪问题,他可以在线更新模型
    2. Motivation1明确了自己网络模型学习的对象某种追踪的共性

我认为的一个缺点:

  1. MDNet在训练的过程中(输入输出)没有使用视频的上下帧之间的关系,帧之间的关系是浪费了
    1. Box regression

Project Webpage:

Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

翻译:

小网络自训练跟踪算法MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking - 知乎

  1. Motivation
    1. 所有的跟踪目标,虽然类别各不相同,但其实他们应该都存在某种共性,这是需要网络去学的。
      1. 这个模型中所指的共性:::输入的condition是目标还是背景的在所有训练集数据中的共性::
    2. 在跟踪问题中,一个网络只需要分两类:目标和背景。而且目标一般都相对比较小,那么其实不需要这么大的网络,会增加计算负担
  2. 网络在线更新策略
  3. 目标跟踪
    1. 采样256个candidates
    2. 输出是一个二维的向量,分别表示输入的bounding box是目标和背景的概率
    3. 最后得到的candidate其实不是直接作为目标,还要做一部bounding box regression

Python版本:

GitHub - HyeonseobNam/py-MDNet: MDNet PyTorch implementation

  1. 使用cpu版本:
    1. Support CPU Mode · Issue #11 · HyeonseobNam/py-MDNet · GitHub
  2. MDNet视频目标跟踪源码运行笔记(Python 2.7版本)——Training and then testing模式 - 越野者的博客 - CSDN博客

MatLab版:

GitHub - HyeonseobNam/MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

运行参数:

1
2
3
python tracking_only/run_tracker.py -s dataset_rectify_lib_ball -d

python tracking_only/run_tracker.py -s DragonBaby -d