
本文純為學術分享,內文圖片皆來自原始RMPE論文與另一篇STN的論文(封面圖片:Photo by Patricia Palma on Unsplash)
Fang, H. S., Xie, S., Tai, Y. W., & Lu, C. (2017). Rmpe: Regional multi-person pose estimation. In Proceedings of the IEEE international conference on computer vision (pp. 2334-2343). https://arxiv.org/abs/1612.00137
Jaderberg, M., Simonyan, K., & Zisserman, A. (2015). Spatial transformer networks. Advances in neural information processing systems, 28, 2017-2025. https://arxiv.org/abs/1506.02025
現在的pose estimation已經有很多模型或是技術可以實作,而在這之中,又不能不提到Alphapose。即便發表於久遠的2016年,Alphapose 完整的open source API和不錯的accuracy依舊是現在許多CV研究者的好幫手,而這樣好用的API,背後原理的全名其實是RMPE(Regional Multi-Person Pose Estimation),不過這個名字大家可能也加減看看就好,因為翻遍整篇論文,這個名詞幾乎指出現在introduction和conclusion的幾行而已 XD。總之,今天要來review的就是這篇RMPE: Regional Multi-Person Pose Estimation。