Skip to main content

2.파이썬 머신러닝 완벽 가이드

섹션 2. 파이썬 기반의 머신러닝과 생태계 이해

2.파이썬 머신러닝 완벽 가이드
- 머신러닝의 개념
- 머신러닝의 유형과 데이터의 중요성

머신러닝의 개념

머신러닝의 유형과 데이터의 중요성

📌 머신러닝 개념

머신러닝이란 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 추론하는 알고리즘 기법을 통칭.
현실 세계의 매우 복잡한 조건으로 인해 기존의 소프트웨어 코드만으로 해결하기 어려웠던 많은 문제점들을 이제 머신러닝을 이용해 해결해 나가고 있습니다.
데이터 마이닝, 영상인식, 음성 인식, 자연어 처리에서 머신러닝을 적용 하면서 급속하게 발전이 가능하게 되었습니다.

일반적인 컴퓨터 과학에서의 접근

정답과 수식을 작성하여 답을 도출함. 블랙박스가 답 부분이다.

머신러닝의 접근

정답과 답이 있음, 가장 잘 맞는 수식을 찾아낸다. 블랙박스가 수식.

머신러닝은 문제와 답을 주고 규칙을 찾음.

많은 데이터 분석가와 데이터 과학자가 머신러닝 알고리즘 기반의 새로운 예측 모델을 이용해
더욱 정확한 예측 및 의사 결정을 도출하고 있으며, 데이터에 감춰진 새로운 의미와 인사이트를 발굴해 놀랄 만한 이익으로 연결시키고 있습니다.

📌 머신러닝 유형

머신러닝은 지도학습(Supervised Learning)과 비지도학습(Un-supervised Learning), 강화학습(Reinforcement Learning)으로 분류
- 지도 학습
  - 분류
  - 회귀
  - 추천 시스템
  - 시각/음성 감지/인지
- 비지도 학습
  - 군집화(클러스터링)
  - 차원 축소
  - 토픽 모델링, 문서 군집화

📌 머신러닝의 단점

데이터에 너무 의존적입니다. (Garbage In, Garbage Out )
학습시에 최적의 결과를 도출하기 위해 수립된 머신러닝 모델은 실제 환경 데이터 적용 시 과적합 되기 쉽다. (실전에 약한 시험만 잘푸는 경우)
복잡한 머신러닝 알고리즘으로 인해 도출된 결과에 대한 논리적인 이해가 어려울 수 있습니다 ( 머신러닝은 블랙박스 )
데이타만 집어 넣으면 자동으로 최적화된 결과를 도출할 것이라는 것은 환상입니다
- (특정 경우에는 개발자 만든 코드보다 정확도가 더 떨어질수 있습니다).
- 끊임없이 모델을 개선하기 위한 노력이 필요하기 때문에 데이터의 특성을 파악하고 최적의 알고리즘과 파라미터를 구성할 수 있는 고급 능력이 필요합니다.

머신러닝의 개념
머신러닝의 유형과 데이터의 중요성