Asia-Pacific Region Intelligence Center
인공지능 학습(Training) 기술 본문
머신러닝(Machine Learning) 기술은 컴퓨터를 인간처럼 학습시킴으로써 컴퓨터가 새로운 규칙을 생성할 수 있지 않을까 하는 시도에서 시작되었다. 이 기술은 2000년대에 들어서 시작된 인공지능을 구현하는 방법의 하나로, 빅데이터를 스스로 분석하고 그 내용을 바탕으로 결론을 도출하는 기술dl다.
여기서 빅데이터란, 기존 데이터베이스 관리 도구의 최대 데이터 처리 용량을 넘어서는 대량(예: 수십 테라 ~ 페타 바이트)의 정형 또는 비정형의 데이터를 뜻한다. 기술 향상으로 컴퓨터 시스템이 꾸준히 발전하면서 시스템을 개발, 운영하는 과정에서 수많은 데이터들이 쌓이기 시작했다.
새로운 데이터를 통해 학습과 경험을 얻고, 이를 통해 기계 및 컴퓨터가 스스로 판단하고 예측할 수 있는 기능을 갖추는 과정을 학습(training이라고 지칭함)이라고 부르며, 학습 결과로 얻어진 지능을 실제 응용에 적용하는 기술을 바로 “머신러닝 (Machine Learning)”이라고 부른다.
과거에는 컴퓨터에 데이터를 제공하여 문제를 푸는 방식을 가르쳐주었으나, 이제는 문제를 푸는 방식을 가르쳐주지 않아도 컴퓨터 스스로 데이터를 학습하고 문제를 풀게 된다.
인지과학 분야에서 사람의 학습을 몇 가지 방법으로 구분하고 있다. 이러한 방법론을 적용하여 머신러닝은 크게 3가지 학습 방법, 즉 지도학습, 비지도학습, 강화학습으로 구분할 수 있다.
지도학습이란 인간이 개입하여 데이터를 제공하는 방식으로, 입력 값과 함께 결과 값(정답 레이블)을 같이 주고 학습을 시키는 방법을 말한다. 인간이 기계에게 문제와 함께 정답을 가르쳐주면, 기계는 많은 문제지와 정답지를 비교해가며 패턴을 스스로 익히게 된다.
따라서 문제지와 정답지가 많을수록 유사한 문제에서 정답을 찾을 가능성이 높아지게 되며, 반복 학습을 통해 오류를 줄여가며 점차 정답에 가까워지게 된다. 대표적인 알고리즘으로는 ‘분류(Classification)’와 ‘회귀(Regression)’가 있다.
분류 알고리즘은 데이터가 번주형 변수를 예측할 때 사용되며, 스팸 필터에 활용되어 여러 가지 메일과 발송 기관 등을 샘플로 훈련하여 스팸메일인지 아닌지를 분류한다. 회귀 알고리즘은 트레이닝 데이터를 이용하여 연속적인 값을 예측할 때 사용된다. 예컨대, 중고차 가격 예측에 회귀 알고리즘을 활용하면, 대량의 중고차 판매 데이터에서 주행거리, 연식, 브랜드 등을 사용하여 중고차 가격을 예측한다.
비지도학습이란 지도 학습과 달리 정답을 알려주지 않고 기계가 스스로 정답을 예측하는 방법으로, 정답을 모르더라도 유사한 것들과 서로 다른 것들을 구분해서 군집을 만들 수 있는 학습 방법이다. 대표적인 비지도학습 알고리즘으로는 ‘클러스터링(Clustering)’과 ‘차원 축소(Dimension Reduction)’ 가 있다. “클러스터링”은 특정 기준에 따라 유사한 데이터 사례들을 하나의 세트로 그룹화하는 기술이다.
강화학습은 보상 및 벌칙과 함께 여러 번의 시행착오를 거쳐 스스로 학습하는 방법을 말한다. 이는 기존의 지도학습, 비지도학습과 달리 보상과 벌칙이 반영된 데이터가 필요하기 때문에 반복 시행을 통해서 보상/벌칙인 반영된 데이터를 스스로 만들어가면서 학습해야 한다.
딥러닝(Deep Learning, DL)은 머신러닝의 특정한 한 분야로써, 연속된 층(layer)에서 점진적으로 의미 있는 표현을 배우는 데 강점이 있으며, 데이터로부터 표현을 학습하는 새로운 방식의 머신러닝 기술이다.
딥러닝의 ‘딥(deep)’이란 단어는 어떤 깊은 통찰을 얻을 수 있는 것을 의미하지는 않고, 그냥 연속된 층으로 표현을 학습한다는 개념을 나타냅니다. 데이터로부터 모델을 만드는 데 얼마나 많은 층을 사용 했는지가 그 모델의 깊이가 된다. 최근의 딥러닝 모델은 표현 학습을 위해 수십 개, 수백 개의 연속된 층을 가지고 있다. 이 층들을 모두 훈련 데이터에 노출해서 자동으로 학습시킨다.
딥러닝에서는 기본 층을 겹겹이 쌓아 올려 구성한 인간의 뉴런과 비슷한 신경망(neural network)이라는 모델을 사용하여 정보를 처리한다. 즉, 컴퓨터가 스스로 모든 신경망에서 얻어지는 정보들을 처리하여, 문제점 파악부터 해결책까지 스스로 찾아간다. 이는 컴퓨터의 지능을 한 차원 더 높인 개념 및 기술로써, 데이터를 분석할 뿐만 아니라 데이터의 상관관계를 스스로 학습하여 새로운 지식을 찾는 일까지 스스로 수행하게 된다.
딥러닝은 머신러닝의 하위 분야에 오래 전부터 속해온 기술이었지만, 2010년대 초반이 되어서야 유명해지기 시작했다. 그 이후 수년간 딥러닝 분야에서 일어난 혁신은 2010년 이전의 기술혁신과 비교해서, 결코 작지 않는 수준이었다.
사람에게는 자연스럽고 직관적으로 보이지만 기계에게는 오랫동안 해결하기 어려웠던 시각 및 청각 같은 인지 및 지각의 문제에서 딥러닝 기술은 괄목할 만한 성과를 냈다. 사람과 비슷한 수준의 이미지 분류, 음성 인식, 필기 인식, 자율 주행 능력, 향상된 기계 번역, 향상된 TTS(Text-To-Speech) 변환, 구글 나우(Now)와 아마존 알렉사(Alexa) 같은 디지털 비서, 사람을 능가하는 바둑 실력 등 딥러닝은 머신러닝으로는 해결하기 어려웠던 분야에서 획기적인 발전과 성과를 창출하였다.
인공지능 학습(Training) 기술 < AI < 4차산업 시대 < 기사본문 - 디지털비즈온 (digitalbizon.com)
'Guide Ear&Bird's Eye6 > 4차 산업을 찾다' 카테고리의 다른 글
'대신 회의도 참석해드려요'...마이크로소프트의 새로운 AI 어시스턴트 '코파일럿' (0) | 2023.10.20 |
---|---|
中 로봇산업, 올 상반기 안정적 성장 이어가 (0) | 2023.10.16 |
“소프트웨어”… 자동차를 위한 AI는 핵심 (0) | 2023.10.16 |
토마토가 신선한지 확인해주는 정확하고 친절한 로봇 개발 (0) | 2023.10.09 |
밝히기 어려운 조현병 원인 찾아주는 AI 마커 발굴 (0) | 2023.10.03 |