화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

서비스 기획

서비스 기획

서비스를 지속적으로 운영, 수익을 발생시키기 위한 것이다.

' 고객은 누구인가? ', ' 어떠한 과제를 해결하는가? ', ' 무엇을 사용해 해결하는가? '를 명확히 설정하는 것이다.

아이디어 실현 가능성, 수익을 예상하여 시장을 확보하는 것이 중요하다.

 

프런트 엔드( Front-End ) 개발 : UI, UX 등을 개발하는 것을 뜻한다.

UI( User Interface ) : 디자인, 사용자가 서비스를 마주하는 것이다.

UX( User Experience ) : 사용자 경험, 사용자가 서비스를 사용하며 느끼는 경험이다.

 

백엔드( Back-End ) 개발 : 서버쪽 개발을 뜻한다. 데이터 저장&관리, 프런트엔드 필요 기능을 구현한다.

 

서비스에서 사용되는 인공지능 결정

인공지능은 학습방법에 따라 용도, 성능이 결정된다.

서비스를 기획 후, 서비스에서 인공지능이 어떤 역할을 할지 파악, 역할에 따라 인공지능을 학습시켜야 한다.

( 인공지능의 종류와 관련된 글은 아래 글에서 확인할 수 있다. )

[AI Friends School] - [AI Friends School 4차시] 머신러닝(지도, 비지도, 강화)의 용어와 원리파악

 

[AI Friends School 4차시] 머신러닝(지도, 비지도, 강화)의 용어와 원리파악

화이트 모드로 보시길 권장합니다 [AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다. AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는

smcjungbumc.tistory.com

서비스의 목적, 데이터의 특성, 개발 기간, 학습 데이터 양 등을 고려해 학습 방법을 선택해야 한다.

개발 기간이 짧고, 데이터의 수가 적다면 머신러닝, 개발 기간이 길고, 데이터의 수가 많다면 딥러닝이 효율적이다.


 

개발 환경 종류

Pycharm

패키지 설치가 용이, 코드&함수 관리가 쉽다.

 

VSCode

Microsoft에서 제공하는 확장 프로그램을 쉽게 사용 가능하다.

다양한 코드 분석 창들이 있다.

 

Jupyter Notebook

사용자가 정한 단위를 기준으로 코드를 실행하여 결과를 확인할 수 있다.

 

Colab

개발 환경을 추가적으로 설정할 필요가 없다.

 

Anaconda

프로젝트별로 라이브러리를 나눠  버전을 관리할 수 있다.

 

Git

프로젝트, 코드의 버전관리가 가능하다.

branch를 통해 여러 사람과 협업이 가능하다.


 

학습 데이터

학습 데이터

인공지능을 학습시키는 데이터를 의미한다.

인공지능 모델을 개발할 때, 학습 데이터를 준비하는 과정이 많은 시간을 차지한다.

Kaggle, 공공데이터 포털, AI hub 등 학습 데이터를 제공하는 사이트에서 데이터터를 수집한다.

직접 데이터를 수집할 수도 있다.

데이터를 준비한 후, 각 데이터 항목에 맞지 않는 값, 빈 값의 유무, 항목별 데이터 수가 일정한지 검사해야 한다.

모델을 학습시킬 데이터셋이 준비되었다면 학습 데이터, 테스트 데이터로 나누어야 한다.

 

가공 :

수집된 데이터를 인공지능이 쉽게 이해, 학습할 수 있도록 하는 과정을 뜻한다.

Python의 Pandas, Numpy, Matplotlib 등의 라이브러리를 통해 데이터를 가공한다.

이미지 데이터의 경우 라벨링 툴을 이용해 데이터를 가공한다.


 

AI 학습

AI 프레임 워크

Tensorflow, Keras, Torch 등의 딥러닝 프레임 워크를 사용한다.

인공지능 개발의 경우 주로 Tensorflow, Torch를 사용한다.

개발 환경, 상황에 따라 프레임 워크를 선택해 학습을 해야 한다.

 

프레임워크 : 프레임워크의 룰을 의무적으로 따르며 개발

라이브러리 : 개발하며 선택에 따라 라이브러리를 사용

 

Torch : Numpy, Python과 코드가 비슷하며 디버깅(오류 수정)이 쉽다.

Tensorflow : 학습이 빠르고 인공지능의 학습 과정을 시각화하는 Tensorboard를 사용할 수 있다.

Keras : Tensorflow 내부에 속해있는 것으로, 모델&학습 데이터를 제공, 학습을 단순화하기에 사용이 쉽다.

 

AI 모델 평가

1. 모델은 전반적으로 얼마나 정확한가?

2. 모델은 여러 시나리오에서 예상대로 작동하는가?

3. 예외적인 상황을 전부 고려했는가?

위 기준에 따라 테스트 세트를 이용해 모델을 점검한다.

수치로 확인 가능한 부분은 여러 도구를 이용해 점검이 가능하다.

Tensorflow의 경우 학습 과정에서 loss, accuracy(정확도)를 확인 가능하며, Tensoboard를 통해 학습 과정을 모니터링할 수 있다.

도구를 통해 과소적합, 과대적합의 상황을 판별하고 이를 기반으로 다시 학습을 진행한다.


 

AI 배포

AI 배포

모델 학습이 완료되면 서비스 환경에 맞춰 코드를 적용하며, 환경은 하드웨어에 따라 달라지게 된다.

임베디드, 서버, 모바일, 데스크탑의 하드웨어가 있으며 하드웨어에 설치된 OS에 맞춰 코드, 모델을 적용해야 한다.

각각의 환경에 맞는 모델, 코드를 적용하여 시스템이 서로 상호 작용할 수 있도록 하는 것은 중요하다.

위 과정을 통해 서비스 점검이 끝나게 되면 모델, 서비스를 배포하게 된다.

지속적인 모니터링을 통해 모델의 동작에 문제가 없는지 확인해야 한다.

문제가 발생하게 될 경우 AI학습 단계로 돌아가 다시 학습을 진행해야 한다.

 

파인 튜닝( Fine-Tuning ) :

기존 모델을 활용해 수집한 데이터로 학습하는 것을 의미한다.

서비스를 운영하며 사용자들의 데이터를 수집해 더 나은 성능을 위해 모델을 재학습시키기도 한다.

모델의 성능이 나빠질 수도 있기에 학습시키기 전, 모델을 저장하는 롤백 과정을 진행하기도 한다.


 

MLOPs

MLOPs란?

데이터가 쌓이고, 지속적으로 변화하는 서비스 환경에 맞춰 개발하는 과정을 의미한다.

 


다음 차시에는 인공지능의 영상 처리 기법&전처리 방법에 대해 배운다.

 

화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

순차데이터

순차데이터( Squence data )

순서를 가진 데이터, 시간과 순서의 의미가 매우 중요한 데이터를 의미한다.

연결성, 흐름을 갖는 데이터이다.

순차데이터는 순서가 바뀌면 고유의 특성을 잃게 된다.

( ex. 언어, 주가 변동, 지진파, DNA 염기서열 등 )


 

순환 신경망

순환 신경망( RNN; Recurrent Neural Network )

재귀(순환하여 반복해 되돌아간다)한다는 의미를 가지고 있다.

은닉층 셀 출력이 은닉층 다음 셀의 입력으로 사용돼, 순환하는 의미를 갖는다.

은닉층 내부 셀의 가중치가 순환되는 것을 의미한다.

순차 데이터를 처리하는 모델로 시간의 개념이 가장 중요하다.

시간 개념 도입을 위해 현재 시점을 t (time)으로 나타낸다.

t-1에서 현재 시점 t로 향하고 있음

과거 정보를 현재 정보에 반영하기 위해 t-1셀이 출력한 은닉 상태 값인 t시점의 계산을 위한 입력으로 사용한다.  

 

셀( Cell ) :

노드의 결과를 출력층과 다음 연산으로 내보내는 노드 단위이다.

다음 정보를 위해 이전 값을 기억하려 하는 메모리 역할을 수행하기에 메모리셀 혹 RNN이라 표현한다.


 

RNN 기본 구조

RNN의 기본 구조, 입력값, 은닉층, 출력값

위 그림에서 입력값을 x, 은닉층을 h, 출력값을 y로 표현하며 RNN을 표현하기 위해 화살표로 사이클을 표현하기도 하며,

아래 그림과 같이 여러 시점으로 펼쳐 표현하기도 한다.

RNN의 셀에는 현재 정보 입력값(현재 시점의 시퀀스), 과거 정보인 이전 시점 셀에서 계산된 출력값, 총 2개가 입력된다.

현재 정보 입력값(현재 시점의 시퀀스), 과거 정보인 이전 시점 셀에서 계산된 출력값을 이용해 현재 시점의 셀 출력값이 나오며, 이는 다시 출력층, 다음 셀 입력값으로 사용된다.

 

RNN 구조 식 :

인공지능의 기본 식 H(x) = wx + b 수식에 순차데이터 처리를 위해 시간 정보를 반영한다.

 

는 현재 상태

는 직전 상태를 의미한다.

 

현재 상태의 출력을 계산하는 수식은 아래와 같다.

 

는 입력 Xt를 출력 h로 변환하기 위한 가중치이다.

RNN은 과거 정보를 반영하기 위해 재귀적으로 뉴런의 출력이 순환되기에 

에 이전 노드의 가중치가 한 번 더 반영되어야 한다. 

첫 번째 가중치 W_{hh}는 직전 셀의 출력을 다음 상태에 반영하기 위한 가중치이다.

두 번째 가중치 W_{xh}는 현재 입력 x_{t}를 출력 h_{t}로 변환하기 위한 가중치이다.

위 두 가중치의 값을 활성화 함수에 넣어 과거 정보를 현재 정보에 반영하게 된다. 식은 아래와 같다.


 

RNN의 종류

데이터의 길이에 무관하게, 입력과 출력을 받아들일 수 있기에 입력과 출력의 개수에 따라 모델의 종류가 나뉜다.

일 대 일( one-to-one ) 모델 :

하나의 이미지 입력에 대해 사진의 제목을 출력하는 이미지 캡셔닝이 있다.

사진의 제목은 단어들의 나열로 시퀀스(순차) 출력이라 한다.

 

일 대 다( one-to-many ) 모델 :

단어 시퀀스에 대해 하나의 출력을 하는 모델들이 있다.

입력 문서가 긍정적인지, 부정적인지를 판별하는 감정 분류가 이에 해당한다.

 

다 대 다( many-to-many ) 모델 :

입력된 문장에 대한 대답 문장을 출력하는 챗봇, 번역 문장을 출력하는 번역기 등이 속한다.


 

RNN의 한계

단점 :

RNN에서 순환이 반복될 경우 마지막 층에서는 첫 번째 층의 가충치가 희미하게 반영될 것이다.

RNN은 시퀀스 데이터의 과거 정보를 반영하고자 만들어졌는데, 길이가 길어질수록 맨 처음 정보를 반영하기 어렵다.

 

LSTM( Long-Short Term Memory ) :

단점을 해결하기 위해 세부적으로 메모리 간격을 조정하여 반영되는 과거 정보의 양을 조절하는 방법이다.

이 기술로 RNN의 한계를 극복할 수 있게 되었다.


 

CNN과 RNN 공통점, 차이점

 

공통점

딥러닝에 근본적으로 활용되는 구조이다.

둘 다 인공 신경망이다.

둘 다 입력된 데이터를 학습해서 출력을 예측하는 데 사용된다.

둘 다 딥러닝에 속한다.

 

차이점

CNN은 음성과 같이 복잡한 구조의 데이터를 학습시키기 전, 연산량을 효과적으로 하기 위한 방법이다.

RNN은 순차데이터의 과거 정보를 다음 정보에 반영하기 위한 순차 모델이다.


 

다음 차시에는 인공지능 개발 단계&환경에 대해 배운다.

 

화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

이미지 데이터

이미지 데이터

픽셀로 구성되어 행렬을 이룬다.

앞 차시에서 배운 회귀, 퍼셉트론, 인공신경망등은 ' 공간적 구조 '를 반영하지 못하기에 이미지 데이터를 학습시키기엔 어려움이 있다.

 

공간적 구조 :

이미지에서 사물과 그 배경을 구분짓는등 이미지 데이터에서 무언가를 인지한다는 특징을 의미한다.

이미지 데이터이의 픽셀마다 가지고 있는 정보들이 관계를 가지고 있는 것을 의미한다.

( ex. 고양이 사진에서 고양이인것, 아닌것을 구분짓는 경계선 혹 경계선을 기준으로 색상의 차이 등 )

공간적 구조를 통해 컴퓨터가 이미지속 물체의 특징을 효과적으로 학습, 인식할 수 있다.


 

합성곱

합성곱( Convolution )

공간적 특징을 효과적으로 반영하기 위한 기계 학습 방법론이다.

수학적 연산기법으로,  서로 곱한 후 합한다 '는 의미를 갖고 있다.

모든 정보가 반영되어 크기가 줄어든 형태로 결과가 나오기에 데이터를 압축하여 연산의 효율을 가져올 수 있다.

이미지 데이터의 특징을 압축하여 특징맵에 담아내는 효과가 있다.

 

합성곱 연산 방법 :

각 자리의 정보끼리 곱한 후, 모두 합하는 것이다.

(n*n)크기의 행렬, (m*m)크기의 행렬의 합성곱 연산 결과의 크기는 { (n-m+1)*(n-m+1) } 이다.

합성곱 연산 방법

ex. 3*3 이미지 데이터를 예시로한 계산 방법 설명

3*3 이미지 데이터

이와 같은 이미지 데이터에 합성곱 연산을 실시할 경우

2*0 + 4*1 + 3*0 + 1*2 + 5*1 + 7*2 + 3*(-1) + (-3)*(-1) + (-2)(-1) = 27

27이라는 값이 나온다.

 

ex. 5*5, 3*3 이미지 데이터를 예시로한 계산 방법 설명

( https://wikidocs.net/64066 이미지 자료를 사용하였습니다. )

5*5 이미지 데이터와 3*3 이미지 데이터에 합성곱 연산을 실시할 경우 3*3의 합성곱 연산 결과가 탄생한다.


 

필터

필터( Filter )

이미지 데이터에 합성곱 연산을 실시할 때 사용되는 것을 의미한다.

특정한 정보값이 있을 때 불필요한 정보는 차단, 필요한 정보는 통과시키는 것이다.

필터를 구성함에 따라 이미지의 노이즈 제거, 이미지 블러처리 등을 할 수 있다.

 

평균값 필터( Mean Filter )

필터 안에 들어오는 모든 픽셀들의 값을 더한 후 필터의 크기로 나눠 평균을 구한 뒤, 영상을 압축한다.

평균값 필터 안에 들어오는 모든 픽셀들은 같은 가중치로 평균을 구하여 합성곱을 실시한다.

 

단점 :

가까운 픽셀, 멀리있는 픽셀이 같은 가중치로 평균이 구해지게 된다.

대상 픽셀과는 멀리 있는 픽셀의 값도 영향을 받게 된다.

평균값 필터의 픽셀 가중치 그래프
평균값 필터 적용 이미지 ( https://cho001.tistory.com/150 이미지 자료 사용 )
평균값 필터 구조

가우시안 필터( Gaussian filter )

이미지를 흐리게 하여 경계선을 부드럽게 만든다.

필터의 구성이 연속 확률의 분포중 하나인 가우시안 분포로 이루어진 형태를 의미한다.

필터 정중앙에 놓인 픽셀에 높은 가중치를 주고 멀리갈수록 점점 낮은 가중치를 부여한다.

거리에 따라 픽셀에 주는 가중치 값은 정규분포 공식으로 계산하여 부여한다.

가우시안 필터 가중치 그래프는 정규분포 그래프와 비슷하다.

가우시안 필터의 픽셀 가중치 그래프
1차원일 때 가우시안 필터 가중치 계산 방법

2차원일 때 가우시안 필터에서 각 픽셀의 좌표에 대해 가중치를 계산 하는 방식은 다음과 같다.

σ(시그마)값은 임의로 정해주게 되며, 값을 정하지 않을 경우 필터의 크기가 들어가게 된다.

이후 필터에서 각 픽셀의 좌표값 (x,y)를 아래 2차원 가우시안 필터 공식에 적용하여 각 픽셀에 대한 가중치 값을 구한다.

2차원일 때 가우시안 필터 가중치 계산 방법

가중치를 계산한 뒤 필터 안 픽셀들의 색 정보에 가중치를 적용시킨 후 평균값을 구해 합성곱을 실시한다.

2차원 가우시안 필터 가중치 그래프


 

특징맵

특징맵( Feature Map )

합성곱을 거쳐 나온 결과를 의미한다. 

합성곱을 거쳐 나온 결과는 이미지의 특징을 간략, 효율적으로 나타내고 있기에 특징맵이라 한다.

여러개의 합성곱 연산을 연속으로 수행할 경우 압축하는 이미지의 특징이 더 많아지게 되며, 데이터의 크기가 줄어든다.

위와 같이 연산할 경우 이미지를 분류하는데 빠른 연산을 수행 가능하고, 이미지 데이터의 전체적 특징을 잘 반영할 수 있다.


 

CNN( Convolution Neural Network )

합성곱을 이용하여 이미지 데이터를 학습하는 인공신경망 구조를 의미한다.

이미지 자체를 그대로 받아 학습할 때보다 연산량의 효율을 갖고, 파악할 이미지 특징에 대해 압축해 받아들이는 개선된 방법이다.

 

Segmentation 작업 :

각 이미지를 이루는 각 픽셀이 어떤 클래스에 해당하는지 예측하는 작업을 수행하는 것이다.


 

다음 차시에는 RNN의 개념, 사례에 대해 배운다

 

화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

시각정보

사람이 세상을 보는 법

1. 빛이 물체에 반사되어 망막에 닿게 된다.

2. 이때 광수용체라는 세포가 빛을 전기신호로 바꾼다.

3. 전기신호는 시신경을 통해 뇌로 전달된다.

4. 뇌에서 전기신호를 이미지로 바꿔준다.

 

영상처리( Image Processing ) : 정보를 해석, 판단하는 것이다.

 

영상

대부분의 사람들이 ' 영상 '을 움직이는 사진, 즉 동영상을 생각한다.

영상은 한자어로 '비칠 영', '형태 자'의 조합으로, 사진(= 이미지)을 의미한다.

 

동영상

유튜브 등의 동적인 영상을 ' 동영상 '이라 한다.

동영상이란 여러 사진이 일정 시간 변화량(= △t; delta t)을 간격으로 나열되어 있는 것이다.

 

FPS( Frame Per Second ) :

1초에 발생하는 이미지의 개수를 의미한다.

△t의 크기에 따라 1초에 발생하는 이미지의 수도 달라진다.

△t가 클 경우 1초에 발생하는 이미지의 수  가 줄어들어 FPS가 낮을 것이다.

△t가 작을 경우 1초에 발생하는 이미지의 수가 증가하여 FPS가 높을 것이다.

△t가 0에 가까울수록 현실과 비슷한 동영상이 된다.

5 FPS 일 경우 1초에 5장의 이미지가 들었다는 뜻이며 △t = 1/5s = 0.2s 가 된다.

△t와 FPS의 관계

△t와 FPS는 반비례 관계로, △t가 높아지면 FPS는 낮아진다.

 

60 FPS와 120 FPS의 동영상을 비교할 경우 120FPS의 동영상이 부드럽게 보인다.

하지만 1초에 담긴 이미지의 수도 2배이기 때문에 컴퓨터가 처리해야 할 이미지의 수도 2배가 된다.


 

컴퓨터의 시각

컴퓨터가 세상을 보는 방법

컴퓨터는 카메라를 통해 이미지 데이터를 얻는다.

카메라가 이미지 데이터를 얻는 방법은 사람이 세상을 보는 방법과 흡사하다.

1. 카메라는 렌즈로 빛을 모아 카메라 내부, 이미지 센서로 빛을 전달한다.

2. 이미지 센서는 빛 에너지를 전기 신호로 전환, 메모리에 저장한다.

( 이미지 센서는 수백만 개의 작은 Photo Cell로 구성 )

( 각각의 포토 셀은 이미지의 각  픽셀에 대해 빛 에너지를 전기 신호로 처리한다. )

세상은 3차원이지만, 컴퓨터가 카메라를 통해 얻은 데이터는 2차원의 이미지 데이터이다.


 

이미지

디지털 이미지

디지털 이미지는 화소(= 픽셀; Pixel)로 이루어져 있다.

디지털 이미지를 확대할 경우 이미지를 구성하는 픽셀들이 보이는 픽셀화 현상이 일어난다.

픽셀의 수가 늘어날수록 이미지를 더욱 자세하게 표현할 수 있으며, 현실에 가깝다.

 

해상도( Resolution ) :

한 이미지를 표현하기 위해 필요한 픽셀들의 수를 뜻한다.  

Full HD 동영상의 경우 가로 1920px, 세로 1080px이다.

이때 해상도는 가로 x세로 = 2073600 px, 약 2백만 화소로, 2메가 픽셀이라 표현한다.

 

좌표계( Coordinate System ) : 

화면 좌측 상단을 기준으로 오른쪽으로 갈수록 x값이 증가하며, 아래로 갈수록 y값이 증가한다.

좌표계 시스템을 활용하여 좌표로 특정된 픽셀에 색상 정보를 보내 화면을 다양한 색상으로 구현할 수 있다.


 

색상

RGB( Red Green Blue )

삼원색인 빨강, 초록, 파랑을 조합하여 여러 색을 나타내는 방법이다.

Red, Green, Blue의 양을 각각 0~255까지의 값으로 표현한다.

빨강(= 255, 0, 0), 초록(= 0, 255, 0), 파랑(= 0, 0, 255)

색상을 표현할 때 R, G, B 3개의 정보값을 필요로 하는데, 영상처리에서 이를 3 채널이라 한다.

3채널 원리는 핸드폰, 모니터 등에서 사용된다.

디스플에이에 3채널 원리를 적용할 경우 각 채널을 겹쳐 표현할 수 없기 때문에 발광 다이오드를 통해 3 채널을 표현한다.

RGB

 

회색조( Gray Scale )

흑백을 나타낼 때 검은색과 흰색만을 이용해 나타내므로 흰색이 얼마나 존재하는가를 결정하는 방법이다.

RGB와는 다르게 하나의 채널만 있다. 흰색의 량에 따라 0~255 사이의 값만 필요하기 때문이다.

각 픽셀에 1 채널 회색조 값을 지정하여 이미지를 표현할 수 있다.

 

HSV( Hue Saturation Value )

Hue(= 색상), Saturation(= 채도), Value(= 명도)의 약자이며, 사람이 색상을 인식하는 방식으로 정의된 모델이다.

Hue(색상)을 지정하고, Saturation(채도)와 Value(명도)의 조합으로 색을 표현한다. 

특정 색을 정의 내릴 때 훨씬 직감적이고, 실제에 가깝다.

RGB를 사용할 때에는 R, G, B 세 가지 속성을 모두 참고해야 하지만, 

HSV의 경우 Hue만 알아도 색상을 찾을 수 있기에 쉽게 색을 분류할 수 있다. 때문에 컴퓨터 비전 분야에서 HSV 방법이 

흔하게 사용된다.


 

컴퓨터가 보는 이미지 데이터

컴퓨터는 이미지의 모든 픽셀을 좌표계를 통해 접근 하며, RGB, HSV, Gray Scale의 수치 값을 통해 이미지를 표현한다.

컴퓨터는 이미지 데이터를 숫자 데이터의 배열로 보며, 이미지 데이터에 수학적 기법을 통해 다양한 조작을 할 수 있다.

 

ex.

주변 픽셀들의 값이 급격하게 변하는 구간을 찾아 이미지 물체에서 형체, 테두리를 찾을 수 있다.

급격한 값들을 완화하여 블러링(Blurring)처리를 할 수도 있다


 

다음 차시에는 CNN에 대해 배운다

 

화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

인공 신경망

인공 신경망( Artifical Neural Network; ANN )

컴퓨터를 학습시키기 위해 뇌의 동작 원리에 기초하여 만들어진 구조이다.

인간의 뇌가 가지는 뉴련의 연결 구조를 컴퓨터로 구현한 네트워크 구조를 의미한다.


 

단층 퍼셉트론

퍼셉트론( Perceptron )

뇌 를 구성하는 기본 세포인 뉴런을 컴퓨터로 구현한 것이 퍼셉트론이다.

입력, 가중치, 전이함수, 활성화 함수로 구성되어 있다.

 

퍼셉트론의 구조와 뉴런의 구조 비교 :

입력 :

뉴런이 자극을 받아들이는 부분, 수상 돌기를 구현한 것이다.

외부에서 데이터를 받아들이는 역할을 한다.

컴퓨터에선 변수 x와 데이터의 개수를 뜻하는 n을 이용하여 x₁, x₂, x₃, x₄...Xn으로 표현한다.

뉴런의 구조; 수상 돌기

가중치 :

각 입력값들의 중요로를 반영하기 위한 수치이다.

가중치는 Weight; W로 표현한다.

퍼셉트론에서 가중치를 나타낼 경우, 각각의 입력값 x₁, x₂, x₃, x₄...Xn에 가중치를 곱하여(w₁*x₁, w₂* x₂, w₃*x₃...) 표현한다.

각 데이터의 중요도를 정확하게 설정하는 정도에 따라 모델의 예측 정확성이 바뀐다.

 

전이함수 :

입력 데이터에 각각의 가중치의 값을 곱한것을 합한 후, 다음 함수로 전달하는 역할을 수행한다.

 

활성화 함수 :

뉴런이 이전 뉴런의 값에게 받은 자극 값이 일정 용량을 넘게 될 경우 다음 뉴런으로 값을 전달한다.활성화 함수는 전이함수에게 받은 데이터의 크기가 일정량을 넘게 될 경우 그 값을 출력할 수 있게 한다.출력의 기준이 되는 값을 임계값 이라 한다.

( ex. 물을 예시로 들 때, 물이 일정 온도에 따라 상태가 바뀐다. 이때 상태가 변화되는 ' 온도 '가 임계값이다. )

 

단층 퍼셉트론의 경우  전이함수를 통해 받은 데이터가 임계값 0을 넘게 될 경우 1(True), 아닐 경우 0(False)로 표현한다.


 

다층 퍼셉트론

다층 퍼셉트론( Multi Layer Perceptron; MLP )의 탄생

현실의 문제는 전부 수학적 법칙을 따가는 것이 아니기에 퍼셉트론만으로 해결하기 어렵다.

특히, 두개의 명제중 하나만 참일 경우를 판단하는 베타적 논리합(Exclusive Or; XOR)의 경우일 때 문제가 자주 발생했다.

XOR과 같은 상황을 해결하기 위해 만들어 진 것이 다층 퍼셉트론( Multi Layer Perceptron; MLP )이다.

( XOR이 세상의 모든 상황에 맞지 않다는 지적을 받게 되며 인공지능의 1차 겨울을 맞게 되었다. )

( ' 인공지능의 겨울 '에 관한 내용은 아래 글에서 확인할 수 있다. )

[AI Friends School] - [AI Friends School 1차시] 인공지능의 탄생 & 개념

 

[AI Friends School 1차시] 인공지능의 탄생 & 개념

화이트 모드로 보시길 권장합니다 [AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다. AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는

smcjungbumc.tistory.com

 

다층 퍼셉트론( Multi Layer Perceptron; MLP )

하나의 문제에 사용되는 퍼셉트론의 개수를 늘려 사용하는 것을 의미한다.

단층 퍼셉트론이 여러개 모여 다층 퍼셉트론을 이룬다.

단층 퍼셉트론의 수가 3개 이상일 경우 심층 신경망, 인공 신경망이라 한다.

퍼셉트론의 수가 늘어남에 따라 같은 역할을 하는 층을 입력층, 은닉층, 출력층으로 구분할 수 있다

다층 퍼셉트론 구조


 

인공 신경망의 구조

입력층

입력을 받는 노드를 묶어 부른다.

 

은닉층 
입력층과 출력층 사이에 존재하는 모든 층(노드, 간선 등)을 묶어 부른다.

입력된 데이터는 입력층에서 수많은 가중치에 영향을 받아 그 값이 변화한다. 

은닉층 값의 합을 시그마(Σ)를 이용해 나타낸 값을 가중합이라 한다. 전이 함수에서 이를 수행한다.

( 가중합 수식 ex. w₁*x₁ +w₂* x₂ + w₃*x₃ + w₄*x₄ = Σwi*xi )

은닉층에서 계산된 값은 전이함수를 통해 출력층으로 이동된다.

 

출력층 

값을 출력하는 역할을 한다.

출력층 내에는 값의 출력 여부를 결정하는 활성화 함수가 있다. 이는 은닉층의 값을 사용자가 이해 가능토록 변환해 준다.

활성화 함수를 통해 데이터를 이해하기 쉽도록 처리하는 것이 필요하다.

( 활성화 함수에 대한 내용은 아래 글에서 확인 가능하다. )

[AI Friends School] - [AI Friends School 6차시] 인공지능 수학

 

[AI Friends School 6차시] 인공지능 수학

화이트 모드로 보시길 권장합니다 [AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다. AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는

smcjungbumc.tistory.com


 

인공 신경망의 학습

인공지능 모델의 학습 방법

인공 신경망의 결과 값은 가중치, 활성화 함수에 의해 변화 하기에, 가중치, 활성화 함수가 가장 중요한 요소이다.

 

학습 방법 :

가중치, 활성화 함수의 값을 랜덤으로 설정.

신경망을 계산, 인공 신경망의 출력값을 기준으로 답과 비교하여 가중치를 증가 혹은 감소시켜 적절한 출력값이 나오도록 만든다.

단층 신경망 혹은 단순한 신경망을 학습시키는 경우 가중치, 편향 값을 하나씩 변화시키며 학습을 진행해도 된다.

 

오차 역전파법( Back Propagtion ) :

여러개의 퍼셉트론으로 이루어진 심층 신경망의 가중치를 효율적으로 조정하는 방법이다.

출력값을 계산하는 과정인 순전파( Feedforward ) 연산 이후 출력값(예측값)과 정답값의 오차를 다시 반대 방향으로 보내며  많은 노드를 가진 심층 신경망도 최적의 가중치와 활성화 함수의 값을 학습할 수 있게 하는 방법이다.

( 오차 역전파법에 대한 내용은 추후 오차 역전파법의 대한 개별의 글에서 다루겠다. )

 

가중치(Weight; W)와 편향값(Bias; b)을 학습할 경우 cost값이 최소인 값을 찾는 경사하강법을 사용하여 값을 구할 수 있다.

( 경사 하강법에 관련된 내용은 아래 글에서 확인할 수 있다. )

[AI Friends School] - [AI Friends School 6차시] 인공지능 수학

 

[AI Friends School 6차시] 인공지능 수학

화이트 모드로 보시길 권장합니다 [AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다. AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는

smcjungbumc.tistory.com


 

다음 차시에는 이미지 데이터에 대해 배운다.

 

화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

일차함수와 머신러닝

일차함수

일차함수는 인공지능의 근본이라 할 수 있다.

일차 함수의 기본 수식은 ƒ(x)=ax+b형태이고, 인공지능에선 모델을 기본적으로 H(x) = wx + b 형태로 표현한다.

w(Weight)와 b(Bias)를 찾는 것이 머신러닝의 핵심이다.

 

H(x) = wx + b ( 인공지능 모델 기본 형태 ): 

인공지능 모델의 형태를 표현하는 가장 기본적인 수식이다.

H(x) = wx + b; x의 의미

H(x) = wx + b : 문제에 영향을 미치는 요인을 변수 x로 표현한다.

H(x) = wx + b; w의 의미

H(x) = w+ b: 각 요인들이 문제에 얼마나 영향을 미치는지를 판단하여 가중치를 부여한다.

인공지능 모델 기본 형태 수식

H(x) = wx + b; H; Hypothesis : 통계학에서 ' 가설 '을 의미하며 ' 가설 '이란 ' 검증되지 않은 무언가에 대한 설명 '이다.

H(x) = w+ b; W; Weight : 영향을 미치는 정도, 즉 ' 가중치 '를 의미한다.

H(x) = wx + b; B; Bias :

' 편향성, 성향 '을 의미하며, 하나의 뉴런으로 입력된 모든 값을 더한 후(가중합) 이 값에 더해주는 상수이다.

인공지능에서 Bias는 데이터가 편향된 정도를 나타내며, 최종적으로 출력되는 값을 조절하는 역할을 한다.

(ex.

' 게임을 좋아하는 성향의 친구 ', ' 게임을 싫어하는 성향의 친구 '가 게임을 할지 안 할지 정해야 할 때 시간, 파티, 게임 장르 등의 중요도(=가중치)가 같다고 가정. 

게임을 좋아하는 친구라면 게임을 할 것이고, 게임을 싫어하는 친구라면 게임을 안 할 것이다.

이와 같이 각 조건에 대한 값이 같더라도 성향에 따라 값의 결과가 달라지기 때문에, ' 성향; Bias '값을 추가하는 것이다. )

 

머신러닝 기본적인 학습 방법

어떠한 수학적 규칙이 있는 ' 문제 '를 예측할 때 수학이 어느 정도 학습된 사람의 경우 그 문제의 값을 계산해 낼 수 있다.

머신러닝 이전의 컴퓨터의 경우 예측식( H(x) = wx + b ) 외에는 어떠한 정보도 가지고 있지 않기에 w, b를 랜덤 하게 설정.

랜덤 하게 설정된 w, b를 통해 도출된 예측값( H(x) )이 사용자가 찾던 값이 아니라고 알려줘야 한다.

실제 정답값(y)과 도출된 예측값의 차이를 알려줘야 하는데, H(x) - y를 구하는 것을 cost, loss라고 한다.


 

Cost Function

Cost Function

cost의 값을 구하는 함수이다.

컴퓨터가 세운 가설 H(x) = wx + b에서 w와 b값의 변화에 따른 정답 y와의 차이인 cost를 계산하기 위해 사용되는 식이다.

컴퓨터가 예측한 값이 얼마나 틀렸는지 알려주기 위해선 정답값과 예측값의 차이가 중요하다.

MSE나 MAE의 식을 보면 차이를 그냥 더하는 것이 아닌 차이의 제곱값 혹은 절댓값을 더해서 구해준다.

위 그래프와 같이 정답값과 예측값을 만나는 점을 중심으로 한쪽은 음수, 한쪽은 양수가 나오게 되는데, 음수와 양수의

차이가 동일할 경우 두 차이값의 합이 0이 나오게 되며, 컴퓨터가 예측을 정확히 했다고 판단할 수 있기에 이를 방지하기 위해 차이값을 제곱값 혹은 절댓값으로 변경하여 양수화 한다.

( cost function의 cost 값을 구하는 방식인 MSE와 MAE와 관련된 내용은 아래 글에서 확인할 수 있다. )

[AI Friends School] - [AI Friends School 5차시] 인공지능의 성능 평가 및 개선 방법

 

[AI Friends School 5차시] 인공지능의 성능 평가 및 개선 방법

화이트 모드로 보시길 권장합니다 [AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다. AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는

smcjungbumc.tistory.com


Cost Function 계산 방법

cost Function을 그래프로 표현할 경우

Cost Function을 그래프로 표현하면 가로축 w(or bias), 세로축 cost값으로 이차함수 모양이다.

이차함수의 꼭짓점은 실제 값과 예측값의 차이가 최소인 지점이다.

cost가 최소인 값을 찾기 위해 꼭짓점을 찾는 것은 매우 중요하며, cost값이 최소인 w(or bias)값을 찾아야 한다.

이때 꼭짓점은 기울기가 0인 값이 최솟값이하는 사실을 이용해 문제를 해결할 수 있으며, 특정 지점의 기울기 값을 구하기 위해 미분이라는 개념이 사용된다.

위 그래프와 같이 컴퓨터가 cost가 최소인 지점을 알아서 변경해 가며 찾는 과정을 ' 컴퓨터가 학습한다 '라고 하며 

' 학습이 끝났다 '라는 말은 cost값에 도착했다는 것을 의미한다.


 

경사하강법

경사하강법( Gradient descent )

경사하강법이란 함수의 기울기를 구해, 기울기가 낮은 쪽으로 이동시키며 극값(최적 값)이 될 때까지 이를 반복하는 것이다

경사를 타고 내려가며 값을 찾는다는 의미로 ' 경사하강법 '이라 불린다.

( 경사하강법에 대한 더욱 자세한 내용은 추후 경사하강법의 대한 개별의 글에서 다루겠다. )

 

ex.

w = 100 인 지점을 찾는 과정이다.

컴퓨터가 처음 랜덤으로 설정한 w값이 70일 경우 cost가 크기 때문에 w를 증가시켜 오른쪽으로 이동시켜야 한다.

w=70일 때 기울기가 음수이므로 w를 증가시켜 오른쪽으로 이동시킨다.

컴퓨터가 랜덤으로 설정한 w값이 300일 경우 cost가 크기에 w를 감소시켜 왼쪽으로 이동시켜야 한다.

w=300일 때 기울기가 양수이므로 w를 감소시켜 왼쪽으로 이동시켜야 한다.

 

위와 같은 방법을 하며 사용자가 원하는 답인 기울기가 0인 지점을 찾아야 한다.


 

딥러닝

딥러닝 구성 방법

딥러닝은 일차함수를 이용하여 모델을 설정하는 것이 머신러닝과 동일하지만, 

일차함수를 여러 개로 쌓아 복잡한 과정을 학습한다.

인공 신경망에서 각각의 가충지를 갖는 여러 개의 자극(변수) 값을 합해 일정 임계치 이상이 되면 출력을 활성화, 아닐 경우 비활성화한다.

위와 같은 인공 신경망을 여러 개 연결하여 다층구조로 만들어 구현한 기술이 딥러닝이다.

딥러닝에서는 다층 구조의 입력이 여러 개 있기에 입력 신호 변수 x₁, x₂, x₃, x₄로 표현한다.

( 머신러닝, 딥러닝, 뉴런 등과 관련된 내용은 아래 글에서 확인할 수 있다. )

딥러닝과 머신러닝의 구성 방법

[AI Friends School] - [AI Friends School 3차시] 인공지능의 범주와 개념

 

[AI Friends School 3차시] 인공지능의 범주와 개념

화이트 모드로 보시길 권장합니다 [AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다. AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는

smcjungbumc.tistory.com


뉴런의 입력신호 판단

뉴런은 여러 뉴런에서 온 입력 신호의 합으로 판단을 한다.

하지만 이때 단순하게 x₁ + x₂ + x₃ + x₄로 표현하는 것이 아닌 각 신호가 가진 입력에 대한 중요도를 입력 신호에 반영하여 입력변수에 w(Weight)를 곱하는 형태로 표현한다.

각 입력변수에 w를 적용하여 합한 최종 예측값  w₁*x₁ +w₂* x₂ + w₃*x₃ + w₄*x₄+b(Bias)가 활성화 여부를 결정하는 임계치𝜽보다 크면 활성화, 작으면 비활성화한다. 

가중치를 반영한 변수의 합이 임계치 이상이 되면 다음 신호로 전달한다는 의미로 숫자 1을, 아닐 경우 0으로 표현한다. 최종 예측값에 대해 전파 여부를 결정하는 함수를 ' 활성화 함수 '라고 하며 함수 a로 표현할 수 있다.


활성화 함수의 종류

활성화 함수는 단순하게 한 가지 기준에 따라 0, 1로 이분화하는 것이 아니라 여러 형태의 함수가 존재한다.

대표적으로 '시그모이드(Sigmoid), 탄젠트(Tanh), 렐루(ReLU)' 함수가 있다.

 

시그모이드 함수( Sigmoid Function ) :

x의 값에 따라 0~1을 출력하는 S자형 함수이다.

Sigmoid 함수 그래프

 

탄젠트 함수( Hyperbolic Tangent function; Tanh) :

쌍곡선 함수중 하나로, Sigmoid 함수를 변형한 것이다.

x의 값에 따라 -1 ~ 1을 출력한다

Tanh 함수 그래프

 

렐수 함수( Rectified Linear Unit; ReLU ) :

가장 많이 사용되는 활성화 함수중 하나이다.

Sigmoid, Tanh 함수보다 학습이 빠르고, 연산 비용이 적으며, 구현이 매우 간단하다는 특징이 있다.

x의 값이 음수일 경우 0을, x의 값이 양수일 경우 그 값을 그대로 출력한다.

ReLU 함수 그래프


 

인공지능에 필요한 수학

선형대수학

수학적 대상에 대해 덧셈, 곱셈 등의 연산을 정의하고, 그 연산에 따라 나타나는 여러 성질과 수학적 구조를 연구하는 학문.

어떻게 조사 대상을 형식화하는지 연구하는 학문이다.

 

백터

인공지능의 경우 벡터를 확장시킨 행렬 개념, 벡터의 공간적 성질, 내적에 대한 내용을 다룬다.

보다 수학적으로 인공지능을 편리하게 표현하고, 응용하는데 도움을 준다.

 

미적분학

알고리즘을 이해, 훈련 과정을 최적화하는 방법을 배우는 학문이다.

일반 수학의 경우 함수를 정의역, 공역, 치역이라는 용어로 집합 사이의 대응, 관계 측면을 정의한다.

미적분에서는 함수의 극한, 미분을 배우며 변화의 측면에서 함수를 보게 된다. 

 

확률론

확률에 대해 연구하는 수학의 한 분야이다.

특정 사건이 발생할 확률이 x라 할 때  실제로 해당 사건이 발생할 기댓값을 찾는 문제를 연구하는 학문이다.

 

통계론

데이터의 특징들을 추출하여 많은 데이터의 중요한 속성만을 간추리는 추상화 및 요약에서 큰 역할을 한다.

인공지능에서 실제 데이터 작업과 함께 모델 설계에서 매우 중요한 역할을 하며, 모델이 얼마나 적절하게 만들어졌는지 

확인하는 것도 통계의 역할이다.

특정 모델을 설계하였을 때 이 모델이 현실 데이터와 얼마나 비슷하게 예측하는지  통계를 활용하여 추측, 판단한다.

과대적합을 방지하기 위해서도 활용된다. 

( 과대적합, 과소적합 등 인공지능 모델을 설계하며 발생하는 문제에 대한 내용은 아래 글에서 확인할 수 있다. )

[AI Friends School] - [AI Friends School 5차시] 인공지능의 성능 평가 및 개선 방법

 

[AI Friends School 5차시] 인공지능의 성능 평가 및 개선 방법

화이트 모드로 보시길 권장합니다 [AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다. AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는

smcjungbumc.tistory.com

 

그 외 수학 개념

인공지능 모델을 설계할 때에는 위에서 설명한 수학개념뿐만 아니라 더욱 다양한 수학 개념이 필요하다.

미분을 활용해 가장 빠른 해결책을 찾는 최적화 이론, 수많은 데이터를 간단하게 나타내는 모델링 방법의 회귀분석 등.

방금 말한 수학 개념은 위에서 설명한 수학 개념들을 기반으로 한다.


 

다음 차시에는 인공신경망의 구조&개념에 대해 배운다.

 

화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

모델이란?

모델

특정 유형의 규칙을 인식하게 훈련된 프로그램 파일이다.

모델이 학습되었다는 것은 컴퓨터 스스로 데이터 규칙을 찾는 기술을 갖고 있다는 뜻이다.

 

사용 이유 :

빠르게 데이터를 학습하여 높은 정확도로 예측, 판단이 가능하기 때문이다.

 

모델을 만들기 위한 준비물 :

학습시키고자 하는 데이터가 필요하다.

( ex. 사과 인식 모델 => 여러 사과 사진, 엑스레이 사진을 통해 질병 판단 모델 => 여러 환자들의 다양한 엑스레이 사진 )


데이터 세트와 테스트 세트

데이터 세트

모델을 학습시키기 위해 수집된 자료들을 뜻한다.

데이터 세트는 ' 트레이닝 세트(Training Set; 학습 데이터) ', ' 테스트 세트(Test Set; 점검 데이터) '로  나뉜다.

두 세트의 비율은 보통 8:2로 트레이닝 세트의 비율이 높다.

 

트레이닝 세트( Training Set ) :

모델을 학습시키는 데이터 세트이다.

 

테스트 세트( Test Set ) : 

학습시킨 모델을 점검해 보기 위한 데이터 세트이다.

 

데이터 세트를 나누는 이유 :

시험을 보기전 모의 고사를 통해 실력을 점검 하듯, 모아진 데이터가 학습이 잘 되었는지 확인하기 위해서이다.

모델이 트레이닝 세트를 이용해 학습하고, 모델이 새로운 데이터를 접해도 잘 예측하는지 테스트 세트를 이용해 점검한다. 


과대적합과 과소적합

과대적합과 과소적합

머신러닝을 할 때 모델의 성능을 낮추는 문제이다.

 

과대적합( Over Fitting )

모델이 훈련 세트에 과하게 적합한 상태가 되어 일반성이 떨어지는 현상이다.

트레이닝 세트에만 정확성을 보이고, 그 외 새로운 데이터에서는 낮은 정확도를 보이는 모델이다.

데이터 세트가 충분치 않을 경우 과대적합의 원인이 된다. 

 

교차검증( Cross Validation ) :

데이터 수가 적을 경우 과대적합을 해결하기 위한 방법이다.

데이터를 여러번 반복해서 나누어 모델의 학습을 검증하는 방법이다.

하나의 데이터를 트레이닝 세트와 테스트 세트로 나누었을 경우

 

하나의 데이터 세트를 트레이닝 세트와 테스트 세트로 여러 번 나누었을 경우
하나의 데이터 세트를 트레이닝 세트와 테스트 세트로 여러 번 나누었을 경우

하나의 데이터 세트를 트레이닝 세트와 테스트 세트로 여러번 나누었을 경우의 평균적인 성능을 계산해 볼 경우,

한번 나누어 학습하는 것에 비해 좀더 일반화( 새로운 데이터에 잘 대응 )된 성능을 얻을 수 있다.


과소적합( Under Fitting )

모델이 훈련 세트의 규칙을 제대로 찾지 못해 테스트 세트에 대한 정확도가 모두 낮은 경우이다.

모델의 복잡도가 낮을(복잡한 문제를 몇개의 특정 요소만을 가지고 해결하려는 것을 의미) 경우 나타난다. 

 

해결 방법 :

조금 더 복잡한 모델을 이용하여 적합한 규칙을 찾아낼 수 있는 모델을 만들어야 한다.


머신러닝

머신러닝은 지도학습, 비지도학습, 강화학습 3가지로 나뉜다.

지도학습에서 회귀분석의 경우 변수 관계를 파악하여 예측하고, 분류는 데이터가 어떤 종류에 속하는지 판단한다.

각각의 방법은 그 목적이 다르기에 각 모델을 평가하는 지표가 다를 수 밖에 없다.

머신 러닝의 뷴류
머신러닝 지도학습에서의 회귀분석
머신러닝 지도학습의 분류

 

회귀 모델

회귀 모델은 연속성 있는 데이터의 예측값을 얻는 것에 목표를 두고 있다.

예측값의 정확도는 회귀 모델에게 있어 중요한 성능 평가 지표가 된다

 

실제 값과 모델이 예측한 값의 차이를 오차, 손실이라 부른다.

오차가 0에 가까울 수록 정확한 예측을 한 것으로, 모델의 성능이 좋다고 말할 수 있다. 

 

손실함수( Loss Funtion ) :

회귀 모델의 오차를 계산하는 함수이다.

대표적으로 ' 평균절대오차(Mean Absolute Error; MAE) ', ' 평균제곱오차(Mean Square Error; MSE) '가 있다.


회귀 모델 평가

 

평균절대오차( Mean Absolute Error; MAE )

실제값과 예측값 차이의 절대값을 평균하는 방법이다. 

비교적 간단한 방법으로 많이 사용되며, 0에 가까울 수록 좋은 모델이다.

절대값 만을 적용하기에, 오차 정도를 가장 직관적으로 알 수 있는 지표이지만, 오차의 방향성을 알 수 없다는 단점이 있다.

평균절대오차 공식


평균제곱오차( Mean Square Error; MSE )

실제값과 예측값의 차이를 제곱하여 평균을 내는 방법이다.

제곱을 하는 이유는 음수를 없애기 위해서이다.

오차가 -5와 +5가 있을 경우 이의 합이 0이 되는 것을 방지하기 위해서 이다.

오차값들이 제곱되기에, 회귀값 또는 아웃라이어(outlier)들을 상대적으로 더 크게 확대시킨다는 특징이 있다.

값이 0에 가까울 수록 좋은 모델이다.

평균제곱오차 공식


분류 모델 평가

 

분류 모델의 성능을 평가하는 지표

분류 모델이 예측을 수행하며 긍정(Positive)했는지, 부정(Nagative)했는지, 사실(True)인지, 거짓(False)인지에 따라

네 개의 경우의 수로 구분하여 표로 나타낼 수 있는데, 이를 오차행렬(Confusion Matrix)이라 한다.

오차행렬은 모델이 예측을 수행한 분류 결과를 실제 값과 비교하여 정리해 주는 표이다.

가장 좋은 모델은 정확도, 정밀도를 모두 잡은 모델이다.

( 정확도와 정밀도 모두 높은 모델은 정확히 목표한 대로의 결과를 낼 수 있다. )

오차행렬


오차행렬

오차행렬( Confusion Matrix ) 표 분석 :

코로나를 예로 들 경우,

모델이 환자가 코로나 양성이라 예측하고, 실제로 환자가 코로나 양성일 경우 ' True Positive; TP '의 케이스가 된다.

True Postive의 케이스

모델이 환자가 코로나 음성이라 예측하고, 실제로 환자가 코로나 음성일 경우 ' True Negative; TN '의 케이스가 된다.

True Negative의 케이스

위에 두 경우 모두 모델이 분류를 잘 했기 때문에 앞에 True가 붙으며 모델이 분류를 잘 못했을 경우 앞에 False가 붙는다.

 

모델이 환자가 코로나 음성일 것이라 예측했지만, 실제로 양성일 경우 잘못된 예측으로 ' False Negative; FN '에 해당한다.

False Negative의 케이스

 

오차행렬( Confusion Matrix )의 효과 :

모델의 예측값과 실제값과의 관계를 표로 정리할 경우 정확도, 정밀도, 재현율이라는 수치를 통해 결과에 대한 추가적인

분석이 가능하며  이 수치들은 인공자능 성능 평가를 위한 지표로써 구체적인 의미를 갖는다.

정확도( Accuracy ) :

전체 데이터 중에서 모델이 정확하게 예측한 것의 비율을 의미한다.

 

정확도 공식

정확도를 분류 모델의 평가 지표로 사용할 때에는 주의할 점이 있다.


코로나 환자 데이터

코로나 환자 10명중 9명이 음성이고, 한명이 양성일 경우,

모델이 무조건 음성이라 예측하기만 해도 모델의 정확도는 90%가 된다.

이 수치로만 본다면 굉장히 정확한 예측을 하는 모델로 착각할 수 있다.

때문에 위와 같이 불균형한 데이터는 적합한 평가 지표가 될 수 없다.


정밀도( Precision ) :

모델이 Positive라고 예측한 것 중에서 정답의 비율, 즉 실제로도 Positive인 경우의 비율을 의미한다.

정밀도 공식


재현율( Recall ) :

통계학에서는 민감도(Sensitivity)라는 용도로도 사용된다.

실제로 True인 것중에서 모델이 True라고 예측한 것의 비율을 의미한다.

재현율 공식

 


 

다음 차시에는 인공지능을 설계하는데 필요한 수학 개념에 대해 배운다.

 

화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

머신러닝

머신러닝

입력받은 데이터를 분석하여 일정한 패턴 & 규칙을 찾아내어 의사결정 및 예측 등을 수행하는 것이다.

대량의 데이터에서 컴퓨터가 스스로 규칙을 찾아내도록 학습시키는 것이다.

 

알고리즘 :

훈련 데이터(Training Data)를 input,  학습한 지식을 바탕으로 output 출력한다.

 

종류 :

학습시킬 데이터에 정답(라벨) 포함되어 있을 경우 지도학습, 포함되어 있지 않을 경우 비지도학습이다.


 

지도학습, 비지도학습, 강화학습

지도학습( Supervised Learning )

정답이 포함된 데이터(Labeled Data)를 이용해 학습하고, 학습된 내용으로 유사한 다른 문제의 정답을 맞히는 방식이다.

반드시 정답이 포함된 데이터를 이용해 학습시켜 사람이 의도하는 정답을 출력하도록 하는 것이다

( ex. 학교에서 수업을 듣는 것 )

지도학습 예시 사진

 

분류( classification )  :

주어진 입력이 어떤 종류의 값인지 표시하는 것이다.

출력하는 정답 라벨 개수에 따라 2개일 땐 ' 이진 분류 ', 3개 이상일 땐 ' 다중 분류 '로 나뉜다.

( ex.

각 과일의 이름이 라벨링 된 데이터를 이용해 학습시키고, 과일 사진을 넣었을 때 그 사진이 어떠한 과일인지 판단하는 것 )

 

회귀 분석( Regression analysis ) :

둘 이상의 변수 관계를 나타내는 것이다.

두 변수 간의 수치적 상관관계를 선을 통해 찾는 것을 ' 회귀(Regression) '라 한다

( ex. 아래와 같이 나이대별 키의 성장 정도를 예측하는 것 )


비지도학습( Unsupervised Learning )

정답이 포함되어 있지 않은 데이터를 군집화 하여 새로운 데이터에 대한 결과를 예측하도록 공부시키는 방법이다.

사람의 개입 없이 컴퓨터가 스스로 데이터의 속성, 패턴 등을 학습하여 데이터를 군집화(Clustering)한다.

적절한 특징을 찾아 데이터에 라벨링 할 수 있기에 지도학습의 훈련 데이터 전처리 방법으로 사용되기도 한다.

( ex. 일상에서의 경험을 통해 얻는 지식 )

 

군집화( Clustering ) :

데이터들의 특성을 고려하여 비슷한 특성을 가진 데이터들의 집단인 군집을 정의하는 것이다.

( 특성은 색상, 크기 모양 등 다양한 것들이 판단하는 기준이 된다. )

 

유사도 함수( Similarity Metrics ) :

동일한 군집인지를 구분하기 위해 유사한 속성 값을 찾는 기준이다.

유사도 함수의 종류에 따라 군집화 되기에 모델 학습에 있어 매우 중요한 역할이다.


강화학습( Reinforcement Learning )

행동심리학에서 영향을 받았다.

학습의 시행착오를 통해 자신이 한 행동에 보상을 받으며 강화를 하는 학습 방법이다.

분류할 수 있는 데이터가 존재하지 않으며, 데이터가 있더라도 정답이 정해져 있지 않다.

 

강화학습 학습 방법 :

환경( Environment )이 주어진다.

환경 안에 정의된 사용자(Agent)가 현재 상태(State)를 인식하여 선택 가능한 행동(Action)중 보상(Reward)을 최대화하는 행동 혹은 행동 순서를 선택하도록 하는 방법이다.

행동으로 유발하는 실수&보상을 통해 시행착오를 겪으며 목표를 찾게 만드는 알고리즘이다.

풍부한 경험이 있어야 더 좋은 보상을 얻지만, 경험을 풍부하게 만들기 위해서는 새로운 시도를 하는 비용이 발생한다.

강화학습에서 이용과 탐험 사이의 균형을 맞추는 것이 중요하다.

 

이용( Exploitation )과 탐험( Exploration ):

이용(Exploitation)이란 경험한 것 중 당시에 최대의 보상을 얻을 수 있는 행동을 수행하는 것을 말한다.

경험을 다양하게 쌓기까지 시도하는 과정 탐험(Exploration)이라 한다.

 

ex. 구글 딥마인드의 벽돌깨기

벽돌깨기 게임 화면

점수를 올리는 것이 목표로 벽돌을 깨는 행동을 했을 대 주는 점수가 곧 보상(Reward)이다.

보상을 통해 강화학습 모델은 점수를 높이는 목표를 향해 계속해서 학습한다. 

시간이 지나게 되면 효과적으로 보상을 얻을 수 있는 행동(Action)을 학습하게 된다.

구글의 딥마인드 벽돌깨기는 사용자(Agent)에게 행동 목록만을 제공하여 높은 점수를 받는 방법을 학습할 수 있게 하는 

강화 학습의 대표적인 예시이다.

 

ex. 알파고

알파고 로고

알파고 학습에 강화학습이 사용되었다.

이세돌과 바둑 경합을 펼칠 때 이세돌이 실수를 하지 않아 알파고가 더 이상 강화가 안 되는 상태였다.

이세돌의 마지막 한 수가 알파고가 예상치 못한 경우의 수였기에 알파고는 자신의 실패에 대한 보상으로써 강화되었다.


 

다음 차시에는 인공지능의 성능 평가&개선 방법에 대해 배운다

 

화이트 모드로 보시길 권장합니다

 

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

알고리즘과 인공지능의 성질 차이

알고리즘 :

어떤 문제를 특정 지을 수 있고, 특정 행동을 하도록 규칙을 설정하는 문제 해결 가능하다,

사람이 직접 규칙성을 정해 프로그램을 만들고 알고리즘을 사용하는 것이다.

( ex. 신호등, 자동문 등 )

 

인공지능 :

특정할 수 없는 조건이 있는 상황에도 특정 행동을 할 수 있게 결정하도록 만들어진 규칙&지능을 인공지능 모델이라 한다.

( '지능'에 대한 단어의 뜻은 '[AI Friends School 1차시] 인공지능의 탄생 & 개념'에서 확인할 수 있다.)

( ex. 안면인식 카메라 등 )


머신러닝, 정형 데이터, 비정형 데이터

머신러닝( Machine Learning )

인공지능의 하위 범주이다.

특정 프로그램이 없더라도 데이터를 기반으로 학습을 하여 정보를 예측 및 작업을 수행할 수 있는 방법론이다.

대량의 데이터에서 스스로 규칙을 학습할 수 있도록 하는 것이다.

( ex. 회귀, 분류, SVM, Decision Tree, 딥러닝 등 )

인공지능의 분야중 하나인 머신러닝

 

데이터셋

머신러닝 모델을 학습시키기 위해 모은 데이터 모음이다.

학습 데이터( Training data ) :

모델을 학습시킬 때 사용한다.

 

테스트 데이터( Test data ) :

학습이 완료된 이후 모델을 테스트해볼 때 사용한다.


정형 데이터

미리 정해놓은 형식&구조에 따라 수치가 저장되는 데이터를 의미한다.

엑셀 등의 표 형태로 나타낼 수 있다.

머신러닝, 딥러닝을 이용하여 학습시킬 경우 모두 좋은 학습 결과를 보인다.

( ex. 고객정보, 사람들의 신체 건강 정보 수치 표 등 )

 

ex. ' 고객 정보 데이터 ' :

정형 데이터 예시 ' 고객 정보 데이터 '

' 성별 '이라는 개체 타입에 ' 남, 여 '라는 값이 입력되는 형식으로 저장된다.

'나이, 성별, 체지방율, BMI지수'등과 같이 수치를 입력하는 항목들이 데이터 ' 고객 정보 ' 데이터'의 특징이다.

정형 데이터를 다루기 위해선 각 데이터의 특징을 사람이 직접 입력해야 한다.


비정형 데이터 :

정해진 규칙이 없거나 형태 혹은 구조가 복잡하여 정형화되지 않은 데이터를 의미한다.

정형 데이터보다 더 복잡한 정보를 포함하고 있다.

사람이 데이터의 구조에 맞게 저장하는 방식으로 생성이 불가하다.

데이터가 복잡하여 머신러닝 기법으로 학습시킬 경우 안 좋은 성능을 보일 때가 있다.

딥러닝의 경우 비정형 데이터와 같은 복잡한 데이터를 학습할 때 머신러닝보다 더 나은 성능을 보여준다.

( ex. 사진, 음성, 텍스트 데이터 등 )

 

ex. 고양이 사진

비정형 데이터 예시 ' 고양이 사진 '

사진을 이루는 픽셀 한 개마다 색을 의미하는 수치들이 해당 사진이 고양이라는 사실을 의미하진 못한다.

이 사진의 ' 고양이 '라는 특징은 사람이 쉽게 추출할 수 없는 추상적인 특징이다.


딥러닝과 퍼셉트론

딥러닝( Deep Learning )

머신러닝의 한 분야이다.

퍼셉트론을 여러 개 사용하여 복잡한 데이터를 잘 학습한다.

여러 개의 퍼셉트론으로 구성된 DNN( 심층신경망 )를 이용해 학습하는 것을 의미한다.

사람이 명확히 규정하기 어렵고, 복잡한 데이터의 특징을 대량으로 학습시키는데 용이하다.

복잡한 데이터를 다룰 때 머신러닝보다 더욱 우수한 성능을 보인다.

 

뉴런 :

N개의 신호가 도착하면 이를 신경세포에서 합친 후 합쳐진 신호가 임계치( 특정한 값 )을 넘으면 한 개의 출력 신호가 생성되어 다음 뉴런으로 전달되는 구조이다.

 

퍼셉트론 :

사람의 신경인 뉴런을 흉내 내어 기계로 구현한 연산 구조이며 대표적인 머신러닝 기법이다.

뉴런과 같이 N개의 입력을 받아 합쳐진 신호가 임계값보다 클 경우 1, 낮을 경우 0( 정보전달 X )을 출력한다. 

( '퍼셉트론'에 대해선 '[AI Friends School 1차시] 인공지능의 탄생 & 개념'에서 확인할 수 있다.)

 

인공신경망( 뉴럴 네트워크 Neural Network; NN ) :

여러 개의 퍼셉트론을 이어 붙여 만든 연산 구조이다.

 

심층신경망( 딥 뉴럴 네트워크 DeepNeural Network; DNN ) :

여러 개의 퍼셉트론이 2개 이상의 층을 이뤄 큰 규모를 이루는 인공 신경망이다.


다음 차시에는 머신러닝(지도, 비지도, 강화)의 용어와 원리 파악에 대해 배운다.

 

화이트 모드로 보시길 권장합니다

[AI Friends School] 시리즈는 MicroShcool에서 진행하는 온라인 인공지능 학습 학교이다.

 

AI Friends School 강의 내용을 말하기 전, AI Friends School에선 어떠한 것을 배우는지 알아보자

 

AI Friends School이란?

AI Friends School은 인공지능 기술을 적용해 세상의 문제를 해결할 수 있는 시티즌 디벨로퍼로 성장하는 것을 목표로 한다.

-AI Friends School 온라인 과정 ( 36차시, 3개월 )-1. 인공지능 들어가기(1차시 ~ 10차시) 2. 인공지능·영상처리 이론(11차시 ~ 15차시) 3. 인공지능·영상처리 실습(16차시 ~ 23차시) 4. 인공지능·음성 / 자연어 처리 이론(24차시 ~ 28차시) 5. 인공지능·음성 / 자연어 처리 실습(29차시 ~ 36차시)


 

컴퓨터란?

컴퓨터란?

'지시에 따라 다양한 일을 자동으로 처리할 수 있는 기계장치'를 의미한다.

 

컴퓨터 COM · PUTER의 유래

'계산하다의 compute' + '~을 하는 사람 er'이 결합된 합성어이다.


컴퓨터 시스템

컴퓨터 시스템

입력장치 :

정보입력받고 처리장치로 전달한다

( ex. 키보드, 마이크, 마우스 등 ).

 

처리장치 :

입력된 정보를 계산 후 계산 결과에 따라 장치를 제어한다

( ex. CPU, GPU ).

 

출력장치 :

컴퓨터 내부에서 받은 정보를 외부에서 사용자가 받을 수 있는 형태로 바꾸어 준다

( ex. 모니터, 스피커, 프린터 ).

 

기억장치 :

처리한 정보저장함.

주기억장치 : 컴퓨터가 접근 쉬운 저장장치이다 ( RAM & ROM으로 이루어짐 ).

보조기억장치 : 많은 양의 데이터를 보관할 수 있다.

컴퓨터 시스템 구성 요소

 

컴퓨터 시스템 활용

컴퓨터 시스템을 활용할 때 '입력 -> 처리 -> 출력'으로 수식화 될 수 있다.

컴퓨터 시스템 활용 수식화


 

컴퓨터 기술

컴퓨터 기술 발전

Computer Science :

정보 처리 효율성에 대해 연구하는 'Computer Science ; CS'로 불리는 컴퓨터 과학 분야만 존재했다.

 

Computer Engineering :

CS분야 + 전자 공학 분야 = 컴퓨터가 활용되는 분야가 넓어지게 되었다.

위 분야를 '컴퓨터 공학 분야 Computer Engineering ; CE'로 부르기 시작했다.

 

CE의 활용 :

CE가 발전하게 되며 연구 결과가 항공우주, 로봇, 금융, 교육 등 사회 각 분야에 적용되었다.


 

4차 산업혁명 핵심 기술과 인공지능

4차 산업혁명의 핵심기술

사회 전반에 컴퓨터가 사용되게 되었다.

모바일, 클라우드 컴퓨팅, 사물인터넷, 인공지능, 빅데이터는 4차 산업혁명의 핵심기술이 되었다.

 

모바일

'모바일 Mobile' 이란 움직이기 쉬운, 이동성의, 라는 의미가 있는 단어이다.

이동통신 기술을 기반으로 한 기술을 일컫는다

( ex. 자동차, 대중교통, 로봇 청소기, 핸드폰 등 ).

 

사물인터넷( Internet Of Things ; IoT )

다양한 모바일 기기들이 하나의 망으로 묶여 서로 정보를 주고받으며 발전한 기술을 말한다.

사람과 사물, 공간 등이 센서와 통신 기능을 내장하여 인터넷에 연결되어 데이터가 생성되고 수집되고 공유 및 활용되는 것을 말한다.

( ex. 로봇청소기, AI 스피커, 스마트 자동차 등을 핸드폰, 인터넷 등으로 제어할 수 있는 스마트 홈, 스마트 팜 등 )

 

빅데이터( Big-Data )

사물인터넷 기술이 다양한 분야와 장소에 활용되며 쌓인 많은 데이터를 말한다.

데이터의 크기가 너무 방대하여 데이터를 수집, 저장, 처리, 분석하는 분야로 발전하게 되었다.

 

클라우드 컴퓨팅

빅데이터 분야의 발전과 함께 나타난 데이터 저장과 처리 부분의 한계를 해결하고자 발단한 기술을 말한다.

클라우드(구름)의 공간 제약이 없으며 비를 내리고 물을 흡수하는 특징을 본떠 어디에서나 데이터에 접근하여 사용할 수 있도록 한 기술이다.

인터넷이 연결돼있다면 어디서나 데이터를 처리 및 공유할 수 있도록 한 것이다.

( ex. 구글 드라이브, iCloud, OneDrive 등 )

 

인공지능

4차 산업혁명의 핵심 기술들, 특히 빅데이터 & 클라우드 컴퓨팅의 발전은 인공지능이 필요로 하는 학습 데이터를 효율적으로 다룰 수 있는 역할을 한다.

방대한 데이터와 학습능력으로 자동화를 이루어 노동력 & 생산 비용을 절감하였다.

사람이 해결하기 힘들거나 시간이 많이 걸리는 문제를 분석 및 예측하며 세상에 영향을 끼치고 있다.


 

일상생활 속 인공지능

인공지능 응용 분야

전문가 시스템 : 

한 분야의 전문가가 전문 분야에 대한 지식을 정리 및 체계화하여 인공지능에 제공하고, 이를 바탕으로 인공지능이 판단하는 기술이다.

( ex. 의료분야 질병 진단, 화학분야 물질 종류 인지, 설계 분야 결함 발견 등 )

 

자연어 처리 :

자연어 : 사람이 일상적으로 사용하는 언어

사람의 언어를 인공지능이 분석 및 판단하여 이에 따라 행동할 수 있도록 하는 기술이다.

( ex. 챗봇, 번역기 등 )

 

음성인식 :

사람 음성으로 된 말을 주파수로 입력받고 이를 분석 및 판단하여 컴퓨터가 이해할 수 있는 데이터로 변환하는 기술이다.

( ex. 구글 어시스턴트, 빅스비, 시리, 알렉사 등 )

 

컴퓨터 비전 :

시각 정보를 인공지능을 통해 인식할 수 있도록 하는 기술이다.

사물에 대한 인식 정확도가 사람과 비슷하고 인식 속도 또한 빨라 일상생활에서 많이 이용된다.

( ex. 카메라 필터, 마스크 착용 여부 인식 장치 등 )

 

지능로봇 :

로봇에 인공지능을 탑재한 기술이다.

이를 통해 인간의 단순화된 노동 등의 활동을 대체하는 데 사용된다.

( ex. 공장 로봇, 로봇 청소기, 공항 안내 로봇 등 )

인공지능 응용 분야의 종류


다음 차시에는 인공지능의 범주&개념에 대해 배운다.

 

+ Recent posts