-
머신러닝(Machine Learning, 기계학습)AI/기타 2020. 11. 20. 16:00728x90
인공지능에 많이 활용되는 신경망 알고리즘은 1950년대 부터 존재한 역사가 있지만 패턴을 파악할 수 있다는 점을 강조하고 싶으면 패턴 인식이라고 쓰고, 기존에 알기 힘든 정보를 제공한다는 측면을 강조하고 싶으면 데이터 마이닝을, 신경망 형태를 통해 스스로 학습한다는 측면을 강조하고 싶으면 머신러닝이라고 분류하고, 신경망이 좀 더 복잡해졌다는 걸 강조하고 싶으면 딥러닝이라고 부르는 것
1. 머신러닝의 개념데이터를 기반으로 기계가 직접 학습함.
데이터를 스스로 만드는 것은 알파고와 같은 강화 학습(Reinforcement Learning)에서 주로 사용하는 방법
2. 지도학습 / 비지도학습
지도학습(Supervised Learning)
지도학습의 예시를 들어보면 여러 장의 사진을 주고 개와 고양이 사진을 구분하라고 시키는 것. 이 때 어떤 것이 고양이 사진인지, 개 사진인지 답을 알려준다. 이렇게 학습하도록 주는 데이터를 훈련 데이터(Train Set)이라고 하고, 훈련 데이터에 답지를 달아주는 것을 레이블링(Labeling)이라고 한다.
이렇게 레이블링한 훈련 데이터를 넣어주면 지도학습 알고리즘은 나름대로 학습해서 앞으로 들어오는 사진이 개인지 고양이인지 구분할 수 있다. 이렇게 훈련받은 알고리즘은 개와 고양이를 구분할 수 있는 모델(Model)이 된다.
그러면 이 모델은 앞으로 레이블링 되지 않은(답지가 안달린) 데이터를 받아도 고양이와 개를 적절히 구분할 수 있게 된다. 이 때 레이블링 되지 않은 데이터는 테스트 데이터(Test Set)이라고 하고 얼마나 정확하게 답을 맞췄냐에 따라 알고리즘의 성능이 결정되게 된다.
비지도학습(Unsupervised Learning)
답을 주지 않으므로 비지도학습은 답을 맞히는 목적으로 학습하지는 않는다. 하지만 어떤 데이터들이 서로 비슷한지 그룹지어주거나, 어떤 성질이 데이터를 잘 정의하는 지를 판단하는 등 답을 내지 않는 문제에 대해 나름대로 유용한 정보를 제공해주는 역할을 한다.
앞과 동일하게 개와 고양이 사진 구분을 목적으로 사진들을 입력하는 상황에서 비지도학습은 어느 사진이 개인지 고양이인지 알려주지 않는다.(즉 레이블링 하지 않는다.)
하지만 알고리즘은 사진을 보고 어떤 사진끼리 비슷한지 파악은 할 수 있다. 그래서 고양이처럼 생긴 사진끼리 한 그룹으로, 개처럼 생긴 사진끼리 또 다른 그룹으로 구분하고, 이렇게 구분은 할 수 있지만 이 그룹의 정체는 알려주지 못 한다. 구분이 잘 되었는지, 그리고 그 그룹을 어떻게 정의하는지 최종 판단하는 것은 사람의 몫 이다. 위의 경우 알고리즘은 고양이 사진이 고양이이고, 개 사진이 개라고 답을 내주지는 않지만, 고양이 사진과 개 사진이 서로 다른 그룹이라고 구분은 잘 해냈으므로 사람은 그 결과를 보고 한 그룹은 고양이 사진, 다른 그룹은 개 사진이라고 판단할 수 있는 근거가 된다.
이렇게 비지도학습은 최종적을 답을 알려주는 용도로는 사용할 수 없지만 데이터의 특성을 파악할 수 있는 유용한 정보를 주어서 사람이 의사결정을 하는 데 도움이 되기 때문에 지도학습과 마찬가지로 널리 사용되고 있다.
출처: https://ellun.tistory.com/103 [Ellun's Library]728x90반응형'AI > 기타' 카테고리의 다른 글
C# 폼간 변수 전달 (0) 2021.03.04 엑셀 회귀분석 해석 (1) 2020.11.27 2020 인공지능 및 머신러닝 소프트웨어 및 프레임워크 20 (0) 2020.11.20 엑셀로 회귀 분석 하기 (0) 2020.11.13 단순선형회귀분석 (0) 2020.11.13