2019年6月4日 下午11:35
我认为MDNet就是在R-CNN上进行更改的,核心有两个
- Motivation1是明确问题思路,Motivation2是简化问题
- 与R-CNN的区别:
- 由于是一个跟踪问题,他可以在线更新模型
- Motivation1明确了自己网络模型学习的对象:某种追踪的共性
我认为的一个缺点:
- MDNet在训练的过程中(输入输出)没有使用视频的上下帧之间的关系,帧之间的关系是浪费了
- Box regression
Project Webpage:
Learning Multi-Domain Convolutional Neural Networks for Visual Tracking
翻译:
小网络自训练跟踪算法MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking - 知乎
- Motivation
- 所有的跟踪目标,虽然类别各不相同,但其实他们应该都存在某种共性,这是需要网络去学的。
- 这个模型中所指的共性:::输入的condition是目标还是背景的在所有训练集数据中的共性::
- 在跟踪问题中,一个网络只需要分两类:目标和背景。而且目标一般都相对比较小,那么其实不需要这么大的网络,会增加计算负担
- 所有的跟踪目标,虽然类别各不相同,但其实他们应该都存在某种共性,这是需要网络去学的。
- 网络在线更新策略
- 目标跟踪
- 采样256个candidates
- 输出是一个二维的向量,分别表示输入的bounding box是目标和背景的概率
- 最后得到的candidate其实不是直接作为目标,还要做一部bounding box regression
Python版本:
GitHub - HyeonseobNam/py-MDNet: MDNet PyTorch implementation
MatLab版:
GitHub - HyeonseobNam/MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking
运行参数:
1 | python tracking_only/run_tracker.py -s dataset_rectify_lib_ball -d |
![]()