본문 바로가기

빅데이터분석기사4

[빅분기 실기] 작업형1 문제 유형별 코드 정리 내가 헷갈린 문제 유형만 정리한 문서  1. 날짜 데이터 활용# 날짜 형식으로 변환print(pd.to_datetime(df['datetime']))# 초 단위로 변환print(df['datetime']).dt.total_seconds())# 분 단위로 변환print(df['datetime']).dt.total_seconds() / 60)# 날짜만 추출print(df['datetime']).dt.date)# 시간만 추출print(df['datetime']).dt.hour)# 분만 추출print(df['datetime']).dt.minute)# 요일 추출print(df['datetime']).dt.day_name())# date type 인덱스에서 주 단위로 sum() 집계 하기print(df.resamp.. 2024. 11. 24.
[빅분기 실기] 연습 사이트 총정리 실습 환경https://dataq.goorm.io/exam/3/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 수업, 기업/edu.goorm.io  1,2,3유형https://github.com/lovedlim/BigDataCertificationCourses GitHub - lovedlim/BigDataCertificationCourses: 빅데이터 분석기사 실기 준비 자료빅데이터 분석기사 실기 준비 자료. Contribute to lovedlim/B.. 2024. 11. 16.
[빅분기 실기] 작업형2 다중 분류 문제 예시 코드 빅분기 실기 작업형2 다중 분류 문제를 매우 간단하게 풀이할 수 있는 코드를 정리해보았다. tips 데이터로 다중 분류 문제를 만들어보았다.1. 데이터 로드import seaborn as snstips = sns.load_dataset('tips')tips 데이터를 로드해준다. 2. 결측치 제거df = tips.dropna()print(df.shape, tips.shape) # (244, 7) (244, 7)결측를 제거한다. 3. 인덱스 생성 df = df.reset_index()최종코드 제출시 인덱스 매칭이 필요하므로, 인덱스를 만들어준다. 4. 독립 변수, 종속 변수 분리X = df.drop('day', axis=1)y = df.day다중 분류 문제로 사용 가능한 day를 종속변수를 사용해주었다. d.. 2024. 11. 16.
[빅분기 실기] 모듈 이름, 함수 사용법 생각 안날 때 대처 방법 sklearn에서 불러와야할 모듈 이름이 생각이 나지 않는다고 하면, 아래와 같은 방법으로 모듈을 조회해보자.import sklearnprint(sklearn.__all__) ['calibration', 'cluster', 'covariance', 'cross_decomposition', 'datasets', 'decomposition', 'dummy', 'ensemble', 'exceptions', 'experimental', 'externals', 'feature_extraction', 'feature_selection', 'gaussian_process', 'inspection', 'isotonic', 'kernel_approximation', 'kernel_ridge', 'linear_model'.. 2024. 11. 16.