[머신러닝] 성능 평가
·
Dev/머신러닝
1. 성능 평가 기준1) 분류 모델- 대부분 binary 를 이야기 함. 0인지 1인지 예측- 실제 값과 예측 값 둘다 0 or 1- 예측 값과 실제 값이 많이 같을 수록 좋은 모델임 (갯수) -> 정확히 예측한 비율로 모델 성늘을 평가 (정확도)ex) 100개를 예측했는데 몇개를 맞추었는가? 2) 회귀모델- 정확한 값을 예측하긴 어려움- 예측값과 실제 값에 차이(오차)가 존재 할 것- 예측값과 실제 값이 가까울 수록 좋은 모델임-> 예측한 값과 실제 값의 차이로 모델 성능을 평가 (오차) 2. 회귀 모델 성능 평가1) 실젯값, 평균값,예측값 실젯값 (y, y_test)-실제로 예측하고 싶은 값, target(목표값)- 이 값과 비교하여 모델의 성능을 평가- 오차 : 실제값과 예측값과 차이  평균값 ( ..
[머신러닝] Scikit-Learn 모델링 코드 구조 및 과정
·
Dev/머신러닝
Sklearn (사이킷런)지도/ 비지도 학습 알고리즘을 제공하는 대표적인 파이썬 라이브러리 - 오픈소스로서 누구나 무료로 사용가능- 여러 알고리즘을 같은 구조의 코드로 사용할 수 있음- 다양한 예제 데이터셋(토이 데이터 셋)을 포함하고 있음 ex) Iris, Boston 1. 환경 준비기본 라이브러리와 대상 데이터를 불러오기 라이브러리 불러오기# 라이브러리 불러오기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings(action='ignore')%config InlineBackend.figure_format = 'retina' 데이..
[머신러닝] 머신 러닝의 이해와 개념
·
Dev/머신러닝
머신러닝에 대한 이해 인간의 경험 = 머신의 데이터데이터로 학습을 해서 1. 학습에 따른 분류  2. 과제에 따른 분류 1) 지도 학습a) 분류 문제 (Classification)    : 이미 분류된 데이터를 학습하여 분류 규칙을 찾음. 그 규칙 기반으로 새로운 데이터를 적절히 분류하는 것b) 회귀 문제 (Regression)    : 이미 결과값이 있는 데이터를 학습하여 입력 값과 결과 값의 연관성을 찾음. 그 연관성 기반으로 새로운 데이터 값을     예측하는 것    **혼동하지 않게 주의!!!!** 2)비지도 학습c) 클러스터링    : 주어진 데이터를 학습하여 적절한 분류 규칙을 찾아 데이터 분류 하는 것. 정답이 없어 성능 평가 어려움.  분류와 회귀 구분법**원하는 결과 값(target)이..