SMALL

3D CNN 2

[논문 리뷰] Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

paper : https://arxiv.org/pdf/1711.10305.pdf Abstract Convolutional Neural Networks(CNN)은 이미지 분류 문제에서 powerful한 모델로 여겨져왔다. 몇 연구에서 비디오 데이터에 3D convolution을 수행하는 것이 spatial(공간)과 temporal(시간) 정보를 저장하는 것에 의미있는 것임을 보였다. 그러나 3D CNN을 수행하는 것은 연산량이 매우 많고 메모리가 많이 필요하다. 그래서 생길 수 있는 의문점은 다음과 같다. “3D CNN을 수행할때 2D network의 정보를 재사용하면 되지 않을까?” 해당 논문에서는 3 x 3 x 3 convolution을 1 x 3 x 3 convolution filter와 3 x 1 ..

CNN 논문 2022.01.05

[논문 리뷰] Learning Spatiotemporal Features with 3D Convolutional Networks

Abstract 대용량 스케일의 비디오 데이터 셋에 대하여 3-dimensional convolutional networks(3D ConvsNets)을 사용한 spatiotemporal feature learning을 하는 간단하지만 효과적인 방법을 제안한다. 세가지 Findings 3D ConvNets은 2D ConvNets에 비해 시공간 학습에 더 적합하다. 3D ConvNets을 수행할때 3 x 3 x 3 convolution kernel이 모든 레이어에서 가장 좋은 performance를 보임 C3D(Convolutional 3D)는 간단한 linear classifier으로 네가지 벤치마크에서의 state-of-the-art를 능가한다. 그리고 다른 두가지 벤치마크에서 가장 좋은 성능과 견줄 수..

CNN 논문 2022.01.04
LIST