5차 미니프로젝트는 AICE 시 대비 특강으로 진행되었습니다.
AICE ASSOCIATE
aice는 kt가 주관하는 인공 지능 능력시험이고 5개의 레벨로 구성되어 있습니다.
제가 목표로 하는 단계는 ASSOCIATE 입니다!
강사님이 주신 예시 과제를 수행하고 팀원들과 코드리뷰를 통해 더 나은 결과물을 도출했습니다.
[1일차] 과제1: VOC 고객해지예측
미션 | 고객의 VOC 정보를 내용 바탕으로 해지 여부 예측하기 |
데이터 출처 | 기업 실무 데이터 |
데이터 | Tabular 데이터 csv 파일 1 개 ( voc_data ) |
목표 | 1. 고객의 VOC 정보를 바탕으로 해지여부를 예측하여 해지 방어 마케팅 활용 2. Tabular 데이터 전처리, 머신러닝/딥러닝 모델링, 평가하고 관련 코드 숙지 |
필요한 라이브러리 설치
!pip install seaborn
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
Tabular 데이터 로딩
df = pd.read_csv('voc_data.csv')
데이터의 구성 확인
파일의 앞부분 5줄, 뒷부분 5줄을 출력
df.head()
df.tail()
데이터프레임 정보(컬럼정보, Null 여부, 타입) 출력
df.info()
데이터프레임 인덱스를 확인
df.index
데이터프레임 컬럼을 확인
df.columns
데이터프레임 값(value)을 확인
df.values
DataFrame 컬럼 항목에 Null 존재하는지 확인
df.isnull().sum()
특정 컬럼의 데이터를 확인
df['특정 컬럼 이름']
특정 컬럼 데이터별 건수를 나열
df['특정 컬럼 이름'].value_counts()
컬럼들의 데이터타입을 확인
df.dtypes
데이터의 결측치 처리
컬럼을 삭제
df1 = df.drop(columns=['삭제할 컬럼 이름1','삭제할 컬럼 이름2',...])
'df1' DataFrame의 특정 컬럼에 '_' 값이 몇 개 있는지 확인
count = (df1['특정칼럼이름'] == '_').sum()
df1의 남아있는 '_'값을 null로 변경
df2 = df1.replace('_', np.nan)
'대외활동 > 에이블스쿨' 카테고리의 다른 글
[에이블 스쿨] 1차 에이블 데이 (3) | 2024.12.02 |
---|---|
[에이블 스쿨] 2차 코딩마스터스 | 1일 1코딩 리뷰 이벤트 (2) | 2024.11.28 |
[에이블 스쿨] 4차 미니프로젝트 | 이미지데이터모델링-얼굴인식(Face Recognition) (2) | 2024.11.25 |
[에이블 스쿨] 3차 미니프로젝트 | DL 모델링 (3) | 2024.11.07 |
[에이블 스쿨] KES 2024, 한국 전자전 후기 | 스터디 활동 (2) | 2024.10.29 |