SMALL

CNN 논문 3

[논문 리뷰] X3D: Expanding Architectures for Efficient Video Recognition

paper : https://arxiv.org/pdf/2004.04730.pdf Abstract X3D는 tiny 2D 이미지 분류기를 여러가지 축에 따라 점진적으로 확장하는 것이다. multiple network axes, in space, time, width and depth 등 간단한 stepwise network expansion 방법이 적용되었다. 한번의 step에 single axis를 확장 X3D를 구체적인 target complexity로 확장하기 위해 점직적인 forward expansion을 하고 이어서 backward contraction을 수행한다. 가장 의미있는 발견은 high spatiotemporal resolution을 가진 네트워크가 폭과 매개변수 측에서 매우 가볍고, 잘..

CNN 논문 2022.01.05

[논문 리뷰] Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

paper : https://arxiv.org/pdf/1711.10305.pdf Abstract Convolutional Neural Networks(CNN)은 이미지 분류 문제에서 powerful한 모델로 여겨져왔다. 몇 연구에서 비디오 데이터에 3D convolution을 수행하는 것이 spatial(공간)과 temporal(시간) 정보를 저장하는 것에 의미있는 것임을 보였다. 그러나 3D CNN을 수행하는 것은 연산량이 매우 많고 메모리가 많이 필요하다. 그래서 생길 수 있는 의문점은 다음과 같다. “3D CNN을 수행할때 2D network의 정보를 재사용하면 되지 않을까?” 해당 논문에서는 3 x 3 x 3 convolution을 1 x 3 x 3 convolution filter와 3 x 1 ..

CNN 논문 2022.01.05

[논문 리뷰] Learning Spatiotemporal Features with 3D Convolutional Networks

Abstract 대용량 스케일의 비디오 데이터 셋에 대하여 3-dimensional convolutional networks(3D ConvsNets)을 사용한 spatiotemporal feature learning을 하는 간단하지만 효과적인 방법을 제안한다. 세가지 Findings 3D ConvNets은 2D ConvNets에 비해 시공간 학습에 더 적합하다. 3D ConvNets을 수행할때 3 x 3 x 3 convolution kernel이 모든 레이어에서 가장 좋은 performance를 보임 C3D(Convolutional 3D)는 간단한 linear classifier으로 네가지 벤치마크에서의 state-of-the-art를 능가한다. 그리고 다른 두가지 벤치마크에서 가장 좋은 성능과 견줄 수..

CNN 논문 2022.01.04
LIST