본문 바로가기

전체 글159

깃허브 액션(Github Actions) 기초 사용 방법 with GCP Github Actions이란, 소프트웨어 개발(ex. streamlit 대시보드)을 지원하기 위한 Github의 자동화 서비스이다.  주요 개념Workflows프로젝트 Repository의 .github/workflows/ 디렉터리에 저장된 YAML 파일 사용하여 정의워크플로 트리거에 의해 YAML 파일 사용Workflow 파일 생성아래 사이트를 참고https://docs.github.com/ko/actions/writing-workflows/about-workflowshttps://github.com/marketplace/actions/streamlit-app-action Workflow 파일 주요 코드주요 코드설명nameGithub Action Workflow의 이름run-nameWorkflow를 .. 2025. 1. 7.
24년 결산, 회고 올해 내가 계획했던 건 대부분 많이 이룬 것같다. 그래서 올해 이룬 것들을 정리해보았다. 1. 하루 3시간 이상 자기계발에 투자하기나는 앱시트로 자기계발에 투자한 시간을 전부 기록해두어서 총 시간이 자동으로 계산되게끔 해놓았는데, 이번연도는 지금까지 총 759시간을 투자했다. 3시간 x 365일 = 1,095시간이니까 69.3% 달성했다. 100% 달성하려면, 한달 평균 91.5시간(5,475분)을 투자해야한다. 아쉽게도 1월달과 7월 달을 제외하면 전부 평균에 미치지 못했다. 원인을 분석해보면, 2월에는 설날, 3월에는 이사준비 및 결혼식 4월도 이사준비 및 결혼식, 5월 이사, 8월 여행, 9월 추석, 10월 여행, 11월 휴가, 12월 여행이 있었다. 그럼에도 불구하고 딱히 행사가 없는 주말에 너무.. 2024. 12. 14.
이동욱 CTO님, 양승화 데이터분석가님과의 만남 이번년도에는 정말 운이 좋게도 내가 제일 닮고 싶은 인물 TOP2로 선정된 이동욱 CTO님과 양승화 데이터분석가님을 모두 뵐 수 있었다. IT기업에서 현업을 뛰다보니 자연스럽게 이 쪽 분야에서 유명하신 분들이 어떻게 그렇게 성장할 수 있었는지가 참 궁금했었다.특히 직업이 강사가 아니고, 현업을 뛰시는 분들인데 블로그, 강의, 강연, 책, 영상, 북토크 등을 통해 지식을 후배들에게 전파하고, 현업에서만 알 수 있는 문제들에 대해 이야기하는 점 때문에 더 많이 궁금했었것같다.먼저 동욱님과의 만남 후기에 대해서 적어보겠다. 동욱님은 사실 사내 인사팀에서 초청을 해주셔서 뵙게 되었다. 주제는 더 좋은 의사결정에 대한 이야기였다.정확하게 기억이 나지는 않지만 동욱님은 나와 비슷한 학과였었다. 나는 전자공학과였는데.. 2024. 11. 30.
데이터리안 그로스해킹 - 양승화 독서 회고 처음 그로스 마케터로 일을 시작하기 전부터 이 책을 3회독은 했었던 것같다. 그리고 나서 일하면서도 간간히 계속 봐왔었고, 까먹은 내용들도 많다보니 한번 내용 정리를 처음부터 끝까지 해야겠다는 생각을 했었는데, 마침 데이터리안에서 독서 챌린지에 더해서 양승화님을 직접 뵐 수 있는 기회까지 마련을 해주셔서 다시 한 번 독서를 하게 되었다. 예전에 읽었다가 지금 다시 읽으니 실무에서 겪어왔던 문제들에 대한 이야기가 많아서 하나하나 더 와닿았고, 한편으로는 앞으로 해야할 일이 정말 많다는 생각이 들었다. 지금 내가 다니고 있는 회사는 그로스 조직이 있지않고, 그동안 서비스 기획을 할 때 데이터를 크게 보지 않았기 때문에 데이터에 대한 중요함도 크게 느끼고 있지 않았었던 것같다. 그러다가 그로스 마케터로 취업을.. 2024. 11. 24.
[빅분기 실기] 작업형1 문제 유형별 코드 정리 내가 헷갈린 문제 유형만 정리한 문서  1. 날짜 데이터 활용# 날짜 형식으로 변환print(pd.to_datetime(df['datetime']))# 초 단위로 변환print(df['datetime']).dt.total_seconds())# 분 단위로 변환print(df['datetime']).dt.total_seconds() / 60)# 날짜만 추출print(df['datetime']).dt.date)# 시간만 추출print(df['datetime']).dt.hour)# 분만 추출print(df['datetime']).dt.minute)# 요일 추출print(df['datetime']).dt.day_name())# date type 인덱스에서 주 단위로 sum() 집계 하기print(df.resamp.. 2024. 11. 24.
그로스해킹 - 양승화 1. 그로스해킹이란?"서비스 출시는 끝이 아닌 시작에 가깝다." '아이디어-개발-측정-개선'으로 이어지는 피드백 순환고리(feedback loop)를 최대한 빨리 진행하면서 작은 성공을 쌓아 서비스를 점진적으로 개선하는 것이 린 스타트업이다. 이는 그로스해킹이 가진 철학과 일맥상통하다. 우리가 그로스해킹을 공부하는 이유는 데이터에서 찾아낸 인사이트를 바탕으로 제품이나 서비스를 지속적으로 개선해 나가는 방법을 익히기 위해서이다. 그로스해킹을 배울 때 기술이 목적이 되어서는 안된다. 그로스해킹 책이나 글에서 공통적으로 강조하는 4가지1) 크로스펑셔널 팀(Cross-Functional Team)* 기능 기반 조직의 경직된 협업이 아니라 목적 기반으로 구성된 조직에서 여러 직군의 구성원들이 치열하게 협업할 떄 .. 2024. 11. 17.
[빅분기 실기] 연습 사이트 총정리 실습 환경https://dataq.goorm.io/exam/3/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 수업, 기업/edu.goorm.io  1,2,3유형https://github.com/lovedlim/BigDataCertificationCourses GitHub - lovedlim/BigDataCertificationCourses: 빅데이터 분석기사 실기 준비 자료빅데이터 분석기사 실기 준비 자료. Contribute to lovedlim/B.. 2024. 11. 16.
[빅분기 실기] 작업형2 다중 분류 문제 예시 코드 빅분기 실기 작업형2 다중 분류 문제를 매우 간단하게 풀이할 수 있는 코드를 정리해보았다. tips 데이터로 다중 분류 문제를 만들어보았다.1. 데이터 로드import seaborn as snstips = sns.load_dataset('tips')tips 데이터를 로드해준다. 2. 결측치 제거df = tips.dropna()print(df.shape, tips.shape) # (244, 7) (244, 7)결측를 제거한다. 3. 인덱스 생성 df = df.reset_index()최종코드 제출시 인덱스 매칭이 필요하므로, 인덱스를 만들어준다. 4. 독립 변수, 종속 변수 분리X = df.drop('day', axis=1)y = df.day다중 분류 문제로 사용 가능한 day를 종속변수를 사용해주었다. d.. 2024. 11. 16.
[빅분기 실기] 모듈 이름, 함수 사용법 생각 안날 때 대처 방법 sklearn에서 불러와야할 모듈 이름이 생각이 나지 않는다고 하면, 아래와 같은 방법으로 모듈을 조회해보자.import sklearnprint(sklearn.__all__) ['calibration', 'cluster', 'covariance', 'cross_decomposition', 'datasets', 'decomposition', 'dummy', 'ensemble', 'exceptions', 'experimental', 'externals', 'feature_extraction', 'feature_selection', 'gaussian_process', 'inspection', 'isotonic', 'kernel_approximation', 'kernel_ridge', 'linear_model'.. 2024. 11. 16.