KDT 수업/Python

[머신러닝 딥러닝] 인공지능 / 머신러닝

니니는 진짜 전설이다 2023. 6. 18. 17:19

1. 인공지능 / 머신러닝

1-1. 인공지능이란?

  • 인공지능(artificial intelligence): 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술
  • 인공지능의 종류
    • 인공일반지능(artificial generalinteligence) 혹은 강인공지능(Strong AI) 
      : 영화에 나오는 인공지능을 생각하면 됨! 사람과 구분하기 어려운 지능을 가진 컴퓨터시스템이 인공일반지능이다. 
    • 약인공지능(Week AI)
      : 현실에서 우리가 마주하고 있는 인공지능. 아직까지는 특정 분야에서 사람의 일을 도와주는 보조 역할만 가능하다. (예: 음성비서, 자율주행 자동차, 음악추천, 기계번역 등)

 

 

1-2. 머신러닝이란?

  • 머신러닝(machine learning)
    • 규칙을 일일이 프로그래밍 하지 않아도 자동으로 데이터에서규칙을 학습하는 알고리즘을 연구하는 분야
    • 인공지능의 하위 분야 중에서 지능을 구현하기 위한 소프트웨어를 담당하는 핵심분야
    • 통계학과의 깊은 연관
      : 통계학에서 유래된 머신러닝 알고리즘이 많고, 통계학과 컴퓨터 과학 분야가 상호작용하면서 발전하고 있다
  • 사이킷런(scikit-learn): 대표적인 머신러닝 라이브러리

 

 


2. 머신러닝으로 할 수 있는 것

2-1. 회귀(Regression)

  • 회귀는 연속된 데이터를 취급할 때 사용하는 기법
  • 독립변수(X)와 종속변수(Y)간의 관계를 모델링하고, 이를 기반으로 새로운 입력 값에 대한 출력값을 예측하는 것을 목표로 함
    • 독립변수는 대부분 여러개다
    • 독립변수가 하나인 경우는 선형회귀라고 한다
  • 대표적인 예시로는 시계열 데이터 다루기가 있다
    (시계열 데이터-> 시간적인 변화를 연속적으로 관측한 데이터)
  • 예) 과거 주식 추세를 학습해서 내일의 주가를 예측하는 시스템을 개발

 

2-2. 분류(Classification)

  • 주어진 데이터를 사전 정의된 클래스 또는 범주별로 구별해내는 과정
  • 데이터와 데이터의 레이블값을 학습시키고 어느 범주에 속한 데이터인지 판단하고 예측 
  • 예) 스팸메일인지 아닌지 구별해주는 시스템

 

2-3. 클러스터링(Clustering)

  • 분류와 비슷하지만 데이터에 레이블(정답데이터)이 없다
  • 유사한 속성들을 갖는 데이터를 일정한 수의 군집으로 그룹핑하는 비지도학습
  • 예) SNS데이터를 통해 소셜 및 사회 이슈를 파악

 


3. 학습

3-1. 지도학습

  • 문제와 정답을 모두 학습시켜 예측 또는 분류하는 문제
  • y=f(x)에 대하여 입력변수x와 출력변수y의 관계에 대하여 모델링 하는것 
  • y에 대하여 예측 또는 분류하는 문제 

 

3-2. 비지도학습

  • 출력변수y가 존재하지 않고, 입력변수x간의 관계에 대해 모델링 하는것
  • 군집분석: 유사한 데이터들까리 그룹화(이게 클러스터링!)
  • PCA: 독립변수들의 차원을 축소화

 

3-3. 강화학습 

  • 수많은 시뮬레이션을 통해 현재의 선택이 미래에 최대보상이 되도록 학습