1. 인공지능 / 머신러닝
1-1. 인공지능이란?
- 인공지능(artificial intelligence): 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술
- 인공지능의 종류
- 인공일반지능(artificial generalinteligence) 혹은 강인공지능(Strong AI)
: 영화에 나오는 인공지능을 생각하면 됨! 사람과 구분하기 어려운 지능을 가진 컴퓨터시스템이 인공일반지능이다. - 약인공지능(Week AI)
: 현실에서 우리가 마주하고 있는 인공지능. 아직까지는 특정 분야에서 사람의 일을 도와주는 보조 역할만 가능하다. (예: 음성비서, 자율주행 자동차, 음악추천, 기계번역 등)
- 인공일반지능(artificial generalinteligence) 혹은 강인공지능(Strong AI)
1-2. 머신러닝이란?
- 머신러닝(machine learning)
- 규칙을 일일이 프로그래밍 하지 않아도 자동으로 데이터에서규칙을 학습하는 알고리즘을 연구하는 분야
- 인공지능의 하위 분야 중에서 지능을 구현하기 위한 소프트웨어를 담당하는 핵심분야
- 통계학과의 깊은 연관
: 통계학에서 유래된 머신러닝 알고리즘이 많고, 통계학과 컴퓨터 과학 분야가 상호작용하면서 발전하고 있다
- 사이킷런(scikit-learn): 대표적인 머신러닝 라이브러리
2. 머신러닝으로 할 수 있는 것
2-1. 회귀(Regression)
- 회귀는 연속된 데이터를 취급할 때 사용하는 기법
- 독립변수(X)와 종속변수(Y)간의 관계를 모델링하고, 이를 기반으로 새로운 입력 값에 대한 출력값을 예측하는 것을 목표로 함
- 독립변수는 대부분 여러개다
- 독립변수가 하나인 경우는 선형회귀라고 한다
- 대표적인 예시로는 시계열 데이터 다루기가 있다
(시계열 데이터-> 시간적인 변화를 연속적으로 관측한 데이터) - 예) 과거 주식 추세를 학습해서 내일의 주가를 예측하는 시스템을 개발
2-2. 분류(Classification)
- 주어진 데이터를 사전 정의된 클래스 또는 범주별로 구별해내는 과정
- 데이터와 데이터의 레이블값을 학습시키고 어느 범주에 속한 데이터인지 판단하고 예측
- 예) 스팸메일인지 아닌지 구별해주는 시스템
2-3. 클러스터링(Clustering)
- 분류와 비슷하지만 데이터에 레이블(정답데이터)이 없다
- 유사한 속성들을 갖는 데이터를 일정한 수의 군집으로 그룹핑하는 비지도학습
- 예) SNS데이터를 통해 소셜 및 사회 이슈를 파악
3. 학습
3-1. 지도학습
- 문제와 정답을 모두 학습시켜 예측 또는 분류하는 문제
- y=f(x)에 대하여 입력변수x와 출력변수y의 관계에 대하여 모델링 하는것
- y에 대하여 예측 또는 분류하는 문제
3-2. 비지도학습
- 출력변수y가 존재하지 않고, 입력변수x간의 관계에 대해 모델링 하는것
- 군집분석: 유사한 데이터들까리 그룹화(이게 클러스터링!)
- PCA: 독립변수들의 차원을 축소화
3-3. 강화학습
- 수많은 시뮬레이션을 통해 현재의 선택이 미래에 최대보상이 되도록 학습
'KDT 수업 > Python' 카테고리의 다른 글
[머신러닝 딥러닝] 사이킷런 Scikit-learn 모듈 (2) | 2023.06.19 |
---|---|
[데이터분석] Pandas 판다스-1 (2) | 2023.06.09 |
[데이터분석] 행렬연산 (0) | 2023.06.08 |
[데이터분석] NUMPY 넘파이 (0) | 2023.05.30 |
28. DB를 이용한 단어장 만들기 (0) | 2023.03.22 |