Skip to main content

2.파이썬 머신러닝 완벽 가이드

섹션 2. 파이썬 기반의 머신러닝과 생태계 이해

머신러닝의 개념

머신러닝의 유형과 데이터의 중요성

📌 머신러닝 개념

  • 머신러닝이란 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 추론하는 알고리즘 기법을 통칭.
  • 현실 세계의 매우 복잡한 조건으로 인해 기존의 소프트웨어 코드만으로 해결하기 어려웠던 많은 문제점들을 이제 머신러닝을 이용해 해결해 나가고 있습니다.
  • 데이터 마이닝, 영상인식, 음성 인식, 자연어 처리에서 머신러닝을 적용 하면서 급속하게 발전이 가능하게 되었습니다.

일반적인 컴퓨터 과학에서의 접근

  • 정답과 수식을 작성하여 답을 도출함. 블랙박스가 답 부분이다.

머신러닝의 접근

  • 정답과 답이 있음, 가장 잘 맞는 수식을 찾아낸다. 블랙박스가 수식.

머신러닝은 문제와 답을 주고 규칙을 찾음.

  • 많은 데이터 분석가와 데이터 과학자가 머신러닝 알고리즘 기반의 새로운 예측 모델을 이용해
  • 더욱 정확한 예측 및 의사 결정을 도출하고 있으며, 데이터에 감춰진 새로운 의미와 인사이트를 발굴해 놀랄 만한 이익으로 연결시키고 있습니다.

📌 머신러닝 유형

  • 머신러닝은 지도학습(Supervised Learning)과 비지도학습(Un-supervised Learning), 강화학습(Reinforcement Learning)으로 분류
    • 지도 학습
      • 분류
      • 회귀
      • 추천 시스템
      • 시각/음성 감지/인지
    • 비지도 학습
      • 군집화(클러스터링)
      • 차원 축소
      • 토픽 모델링, 문서 군집화

📌 머신러닝의 단점

  • 데이터에 너무 의존적입니다. (Garbage In, Garbage Out )
  • 학습시에 최적의 결과를 도출하기 위해 수립된 머신러닝 모델은 실제 환경 데이터 적용 시 과적합 되기 쉽다. (실전에 약한 시험만 잘푸는 경우)
  • 복잡한 머신러닝 알고리즘으로 인해 도출된 결과에 대한 논리적인 이해가 어려울 수 있습니다 ( 머신러닝은 블랙박스 )
  • 데이타만 집어 넣으면 자동으로 최적화된 결과를 도출할 것이라는 것은 환상입니다
    • (특정 경우에는 개발자 만든 코드보다 정확도가 더 떨어질수 있습니다).
    • 끊임없이 모델을 개선하기 위한 노력이 필요하기 때문에 데이터의 특성을 파악하고 최적의 알고리즘과 파라미터를 구성할 수 있는 고급 능력이 필요합니다.