화이트 모드로 보시길 권장합니다

[A.아이 Project] 시리즈는 기존에 있는 지문등 신원 등록 서비스를
Face Identification으로 대체하고자 하는 서비스 구현
' A.아이 '란 무엇인가?

' A.아이 '란

 'A.아이'는 실종아동 예방 서비스로 실종아동의 신원파악을 돕기 위한 얼굴인식인공지능 서비스로 집에서 간편하게 아이의 얼굴을 등록시켜 실종발생 시 빠른 대처가 가능토록 한다.


 

What is Siamese neural network?

Abstract

 머신러닝 애플리케이션에 대한 좋은 특징을 학습하는 과정은 계산적으로 매우 많은 비용이 들며, 데이터가 적을 경우에는 어려움을 겪을 수 있다.

 

 이러한 문제의 예시로는 One-shot learning setting이 있는데, 이는 새로운 클래스마다 단 하나만의 예시를 가지고 정확한 예측을 해야 하는 상황을 말한다.

 

 ' Siamese neural networks for One-shot learning ' 논문에서는 고유한 구조를 사용하여 두 입력 간의 유사성을 자연스럽게 수치화하는 Siamese neural network 학습 방법을 찾는다. 신경망이 조정되면, 강력한 식별 기능을 활용하여 네트워크의 예측력을 새로운 데이터뿐만 아니라, 완전히 새로운 분포의 클래스로 일반화할 수 있다.

 

 Convolution 구조를 사용함으로써, One-shot 분류 작업에서 거의 최첨단 성능을 가진 다른 딥러닝 모델을 능가하는 강력한 결과를 얻을 수 있다.


 인간은 새로운 패턴을 습득하고 인식하는 뛰어난 능력을 보인다. 특히, 사람들이 자극을 받았을 때 새로운 개념을 빠르게 이해한 다음 미래의 지각에서 이러한 개념의 변형을 인식할 수 있다는 것을 관찰했다.

 

 머신러닝은 웹 검색, 스팸 탐지, 캡션 생성, 음성 및 이미지 인식과 같은 다양한 응용 프로그램에서 최고의 성능을 달성하는 데 성공적으로 사용되었다. 그러나, 이러한 알고리즘은 종종 지도 정보가 거의 없는 데이터에 대해 예측을 할 때, 문제가 발생한다. 데이터가 부족하거나 웹 검색과 같은 온라인 예측 설정으로 인해 비용이 많이 들거나 불가능할 수 있는 광범위한 재교육을 필요로 하지 않고 이러한 익숙하지 않은 범주로 일반화 하고자 한다.

 

 특히 흥미로운 작업은 테스트 인스턴스에 대한 예측을 하기 전에 가능한 각 클래스의 단일 예시만을 관찰할 수 있는 제한 하에 분류하는 것이다. 이를 One-shot learning이라 하며 이 작업에서 제시된 모델의 주요 초점이다. One-shot learning은 모델이 대상 클래스에 대한 정보도 볼 수 없는 Zero-shot learning과는 구별되어야 한다.

 

 One-shot learning은 대상 작업에 대해 매우 차별적인 속성을 가진 domain-specific features나 추론 절차를 개발함으로써 직접적으로 해결할 수 있다. 결과적으로, 이러한 방법을 포함한 시스템은 유사한 인스턴스에서 뛰어난 성능을 보이지만, 다은 유형의 문제에 적용할 수 있는 견고한 솔루션을 제공하지 못한다. 본 논문에서는 입력의 구조에 대해 가정을 제한하며, 모델이 몇 가지 예시 데이터에서 성공적으로 일반화 할 수 있게 하는 특징을 자동으로 획득하는 새로운 접근법을 제시한다.

Figure 2. 일반적인 전략. 1) 같은/다른 쌍의 컬렉션을 구별하는 모델을 훈련시킨다. 2) 검증을 위해 학습된 feature mapping에 기반하여 새로운 카테고리를 평가하는것으로 일반화 한다.

 deep learning 프레임워크를 바탕으로 구축하였는데, 이 프레임워크는 여러 계층의 비선형성을 사용하여 입력 공간에서의 변환에 대한 불변성을 포착한다. 이는 보통 많은 수의 매개변수를 가진 모델을 활용하고, 과적합을 방지하기 위해 대량의 데이터를 사용하는 방식으로 이루어진다. 이러한 특징들은 강력한 사전 가정을 불필요하게 하면서도 이를 학습할 수 있기 때문에 매우 강력하다. 그러나 학습 알고리즘 자체의 비용은 상당할 수 있다.


Approach

 일반적으로, Siamese neural network를 이용한 지도학습 기반의 metric 방식을 통해 이미지 표현을 학습하고, 재훈련 없이 그 신경망의 특징을 One-shot learning에 재사용한다.

 

논문의 실험에서는, 기본 접근법이 거의 모든 방식에 대해 복제 될 수 있지만, 문자 인식에 주의를 기울였다(Figure 2). 이 분야에서, 큰 Siamese Convolution neural networks을 사용하며, 이것은 새로운 분포에서 매우 적은 데이터만을 사용할 수 있어도 알려지지 않은 클래스 분포에 대한 예측을 위해 일반적인 유용한 이미지 특징을 학습할 수 있는 능력이 있다. Souce data에서 추출된 이미지 쌍에 대해 표준 최적화 기법을 사용하여 쉽게 훈련할 수 있다. 그리고, 딥러닝 기법을 활용하여 문자 인식 특화 지식에 의존하지 않는 경제적 접근 방식을 제공한다.

 

 One-shot 이미지 분류 모델의 개발을 위해, 먼저 이미지 인식을 위한 표준 검증 작업인 이미지 쌍의 class-identity를 구별 할 수 있는 신경망을 학습하는 것을 목표로 한다.

 

 검증을 잘 수행하는 네트워크가 One-shot classification으로 일반화 할 것이라는 가정한다. 검증 모델은 동일 클래스 혹은 다른 클래스에 속할 확률에 따라 입력쌍을 식별하는 방법을 학습한다. 그 다음 이 모델을 사용하여 테스트 이미지쌍에 대해 새로운 이미지, 즉 새로운 클래스당 정확히 하나를 평가하는 데 사용할 수 있다.

 

 검증 네트워크에 따라 가장 높은 점수를 받은 이미지쌍은 One-shot 작업에서 가장 높은 확률을 부여받는다. 검증 모델에 의해 학습된 특징이 한 세트의 알파벳에서 문자의 class를 파악하는데 충분하다면, 모델이 다양한 알파벳에 노출되어 다른 알파벳을 판단하는데 충분해야 한다. 


 


+ Recent posts