본문 바로가기

분류 전체보기153

깃허브 액션(Github Actions) 기초 사용 방법 with GCP Github Actions이란, 소프트웨어 개발(ex. streamlit 대시보드)을 지원하기 위한 Github의 자동화 서비스이다.  주요 개념Workflows프로젝트 Repository의 .github/workflows/ 디렉터리에 저장된 YAML 파일 사용하여 정의워크플로 트리거에 의해 YAML 파일 사용Workflow 파일 생성아래 사이트를 참고https://docs.github.com/ko/actions/writing-workflows/about-workflowshttps://github.com/marketplace/actions/streamlit-app-action Workflow 파일 주요 코드주요 코드설명nameGithub Action Workflow의 이름run-nameWorkflow를 .. 2025. 1. 7.
24년 결산, 회고 올해 내가 계획했던 건 대부분 많이 이룬 것같다. 그래서 올해 이룬 것들을 정리해보았다. 1. 하루 3시간 이상 자기계발에 투자하기나는 앱시트로 자기계발에 투자한 시간을 전부 기록해두어서 총 시간이 자동으로 계산되게끔 해놓았는데, 이번연도는 지금까지 총 759시간을 투자했다. 3시간 x 365일 = 1,095시간이니까 69.3% 달성했다. 100% 달성하려면, 한달 평균 91.5시간(5,475분)을 투자해야한다. 아쉽게도 1월달과 7월 달을 제외하면 전부 평균에 미치지 못했다. 원인을 분석해보면, 2월에는 설날, 3월에는 이사준비 및 결혼식 4월도 이사준비 및 결혼식, 5월 이사, 8월 여행, 9월 추석, 10월 여행, 11월 휴가, 12월 여행이 있었다. 그럼에도 불구하고 딱히 행사가 없는 주말에 너무.. 2024. 12. 14.
이동욱 CTO님, 양승화 데이터분석가님과의 만남 이번년도에는 정말 운이 좋게도 내가 제일 닮고 싶은 인물 TOP2로 선정된 이동욱 CTO님과 양승화 데이터분석가님을 모두 뵐 수 있었다. IT기업에서 현업을 뛰다보니 자연스럽게 이 쪽 분야에서 유명하신 분들이 어떻게 그렇게 성장할 수 있었는지가 참 궁금했었다.특히 직업이 강사가 아니고, 현업을 뛰시는 분들인데 블로그, 강의, 강연, 책, 영상, 북토크 등을 통해 지식을 후배들에게 전파하고, 현업에서만 알 수 있는 문제들에 대해 이야기하는 점 때문에 더 많이 궁금했었것같다.먼저 동욱님과의 만남 후기에 대해서 적어보겠다. 동욱님은 사실 사내 인사팀에서 초청을 해주셔서 뵙게 되었다. 주제는 더 좋은 의사결정에 대한 이야기였다.정확하게 기억이 나지는 않지만 동욱님은 나와 비슷한 학과였었다. 나는 전자공학과였는데.. 2024. 11. 30.
데이터리안 그로스해킹 - 양승화 독서 회고 처음 그로스 마케터로 일을 시작하기 전부터 이 책을 3회독은 했었던 것같다. 그리고 나서 일하면서도 간간히 계속 봐왔었고, 까먹은 내용들도 많다보니 한번 내용 정리를 처음부터 끝까지 해야겠다는 생각을 했었는데, 마침 데이터리안에서 독서 챌린지에 더해서 양승화님을 직접 뵐 수 있는 기회까지 마련을 해주셔서 다시 한 번 독서를 하게 되었다. 예전에 읽었다가 지금 다시 읽으니 실무에서 겪어왔던 문제들에 대한 이야기가 많아서 하나하나 더 와닿았고, 한편으로는 앞으로 해야할 일이 정말 많다는 생각이 들었다. 지금 내가 다니고 있는 회사는 그로스 조직이 있지않고, 그동안 서비스 기획을 할 때 데이터를 크게 보지 않았기 때문에 데이터에 대한 중요함도 크게 느끼고 있지 않았었던 것같다. 그러다가 그로스 마케터로 취업을.. 2024. 11. 24.
[빅분기 실기] 작업형1 문제 유형별 코드 정리 내가 헷갈린 문제 유형만 정리한 문서  1. 날짜 데이터 활용# 날짜 형식으로 변환print(pd.to_datetime(df['datetime']))# 초 단위로 변환print(df['datetime']).dt.total_seconds())# 분 단위로 변환print(df['datetime']).dt.total_seconds() / 60)# 날짜만 추출print(df['datetime']).dt.date)# 시간만 추출print(df['datetime']).dt.hour)# 분만 추출print(df['datetime']).dt.minute)# 요일 추출print(df['datetime']).dt.day_name())# date type 인덱스에서 주 단위로 sum() 집계 하기print(df.resamp.. 2024. 11. 24.
그로스해킹 - 양승화 1. 그로스해킹이란?"서비스 출시는 끝이 아닌 시작에 가깝다." '아이디어-개발-측정-개선'으로 이어지는 피드백 순환고리(feedback loop)를 최대한 빨리 진행하면서 작은 성공을 쌓아 서비스를 점진적으로 개선하는 것이 린 스타트업이다. 이는 그로스해킹이 가진 철학과 일맥상통하다. 우리가 그로스해킹을 공부하는 이유는 데이터에서 찾아낸 인사이트를 바탕으로 제품이나 서비스를 지속적으로 개선해 나가는 방법을 익히기 위해서이다. 그로스해킹을 배울 때 기술이 목적이 되어서는 안된다. 그로스해킹 책이나 글에서 공통적으로 강조하는 4가지1) 크로스펑셔널 팀(Cross-Functional Team)* 기능 기반 조직의 경직된 협업이 아니라 목적 기반으로 구성된 조직에서 여러 직군의 구성원들이 치열하게 협업할 떄 .. 2024. 11. 17.
[빅분기 실기] 연습 사이트 총정리 실습 환경https://dataq.goorm.io/exam/3/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 수업, 기업/edu.goorm.io  1,2,3유형https://github.com/lovedlim/BigDataCertificationCourses GitHub - lovedlim/BigDataCertificationCourses: 빅데이터 분석기사 실기 준비 자료빅데이터 분석기사 실기 준비 자료. Contribute to lovedlim/B.. 2024. 11. 16.
[빅분기 실기] 작업형2 다중 분류 문제 예시 코드 빅분기 실기 작업형2 다중 분류 문제를 매우 간단하게 풀이할 수 있는 코드를 정리해보았다. tips 데이터로 다중 분류 문제를 만들어보았다.1. 데이터 로드import seaborn as snstips = sns.load_dataset('tips')tips 데이터를 로드해준다. 2. 결측치 제거df = tips.dropna()print(df.shape, tips.shape) # (244, 7) (244, 7)결측를 제거한다. 3. 인덱스 생성 df = df.reset_index()최종코드 제출시 인덱스 매칭이 필요하므로, 인덱스를 만들어준다. 4. 독립 변수, 종속 변수 분리X = df.drop('day', axis=1)y = df.day다중 분류 문제로 사용 가능한 day를 종속변수를 사용해주었다. d.. 2024. 11. 16.
[빅분기 실기] 모듈 이름, 함수 사용법 생각 안날 때 대처 방법 sklearn에서 불러와야할 모듈 이름이 생각이 나지 않는다고 하면, 아래와 같은 방법으로 모듈을 조회해보자.import sklearnprint(sklearn.__all__) ['calibration', 'cluster', 'covariance', 'cross_decomposition', 'datasets', 'decomposition', 'dummy', 'ensemble', 'exceptions', 'experimental', 'externals', 'feature_extraction', 'feature_selection', 'gaussian_process', 'inspection', 'isotonic', 'kernel_approximation', 'kernel_ridge', 'linear_model'.. 2024. 11. 16.
PC방 로컬 환경에서 파이썬 개발 하는 법 1. 파이썬 설치2. 메모장에서 개발3. cmd 창에서 python 파일명.py 입력 모듈은 cmd 창에서 설치 경 변수에 경로가 포함되어 있는지 확인하는 방법은 다음과 같습니다:환경 변수 열기:'내 컴퓨터' 또는 '내 PC' 아이콘을 오른쪽 클릭합니다.'속성'을 선택합니다.왼쪽 메뉴에서 '고급 시스템 설정'을 클릭합니다.'환경 변수' 버튼을 클릭합니다.Path 변수 확인:시스템 변수(SYSTEM VARIABLES) 또는 사용자 변수(USER VARIABLES) 목록에서 Path 변수를 찾습니다.Path 변수를 선택하고 '편집' 버튼을 클릭합니다.경로 확인:열린 편집 창에서 목록에 C:\Users\Win10\AppData\Local\Packages\PythonSoftwareFoundation.Python.. 2024. 11. 10.
GCP 가상머신 만들기 GCE 가상머신 만드는 방법에 대해서 알아보자. 새 프로젝트 생성GCP 메뉴에서 [Compute Engine > VM 인스턴스] 클릭첫 프로젝트 생성 시, API 사용 활성화 버튼 클릭(3-5분 소요) 가상머신 인스턴스 생성인스턴스 만들기 클릭인스턴스 만들기이름 설정리전은 서울로 설정머신 유형 선택(ex. 범용, E2)메모리 선택(ex. 2GB)호스팅 유지보수 선택부팅 디스크 선택(ex. 운영체제 : Ubuntu, 버전 : Ubuntu 20.04 LTS, 크기 : 10GB)서비스 계정 설정(ex. 모든 Cloud API에 대한 전체 엑세스 허용)방화벽 설정(ex. HTTP 트래픽 허용, HTTPS 트래픽 허용) 고정 IP 주소 등록외부 IP를 고정 IP로 변경메뉴에서 [VPC 네트워크 > IP주소] 클릭.. 2024. 11. 10.
컨버티드 - 닐호인 1. 대화1-1. 데이터를 다루는 3가지 원칙(선택과 집중)일단 시작하라- 당장은 모든 것을 최대한 간소하고 가볍게 유지할 것. - 데이터를 추가할 시, 구체적인 목적을 가지고 진행할 것.- 지금 가지고 있는 데이터를 어떻게 사용할 것인지에 초점사람에서부터 시작하라데이터는 사람에서부터, 곧 돈에서부터 시작해야한다.모든 고객의 이름을 알아두어라- 고객 이름 : 고객의 실제 이름, 이메일, 충성고객 프로그램의 고유 번호 등.- 이는 여러 개의 시스템에 존재하는 여러 명이 실제로 동일인임을 알아볼 수 있게 해준다.- 고객이 자기계정을 만들어 등록하도록 장려하는 인센티브를 시도해라.ex. 회원 정룔 콘텐츠 제공, 판매 촉진 행사 참가권 발행, 할인 쿠폰 발행 등- 고객의 이름 부르기 : 제목에 수신자 이름을 넣.. 2024. 11. 10.