전체 글152 t-test에 대한 모든 것 이 글에서는 t-test이란 무엇인지, 언제 사용되는지, 그리고 이와 관련된 중요한 통계 개념들을 예시와 함께 아주 쉽게 설명해보겠습니다.1. t-test란?t-검정은 두 그룹의 평균이 서로 다른지 비교하는 통계적인 방법입니다. 예를들어 남녀 간의 연봉차이, 지역별 소득 차이 등을 비교할 때 쓰이죠. 두 그룹의 평균은 그냥 평균을 계산해서 비교하면 끝나는 작업인데, 왜 t-test라는 통계적 기법이 필요한 걸까요?그 이유는 두 그룹으로 나눈 데이터가 편향된 데이터일 수 있기 때문입니다. 예를 들어 남녀 간의 연봉차이를 비교할 건데, 수집한 연봉 데이터의 80%가 부산 사람들이었다고 하면, 편향된 데이터라고 할 수 있죠. 대한민국 전체 5,000만명의 데이터는 '모집단'이라고 하고, 그 중 일부 데이터를 .. 2025. 4. 6. Git에서 실수없이 작업하려면?(git status, git diff, git checkout) 로컬에서 push를 한 다음, 서버에서 pull로 땡겨올 때, 오류가 발생한 적이 있습니다. 그 이유는 서버에서의 코드가 일부 변경된 부분이 있어서 였습니다. 저는 서버에서 코드가 변경이 되었다는 사실을 모르고 있었습니다. 이 상황에서 pull이 동작하게 하려면 어떻게 해야할까요? git statusgit diffgit checkout {파일명}1️⃣ git status – 지금 내 작업 상태 확인하기git status먼저 git status로 작업 상태를 확인해야합니다. 현재 어떤 파일이 변경되었는지, staging 상태는 어떤지 확인할 수 있어요.On branch mainChanges not staged for commit: (use "git add ..." to update what will be.. 2025. 4. 5. Python 로깅 최적화 방법 Python 로깅 멋지게 하는 방법의 글을 참고해서 세팅한 후, Python에서 logging 모듈을 사용할 때, 로그가 과도하게 쌓이는 문제를 해결하는 방법을 정리합니다.1. 로그 레벨 낮추기현재 level="NOTSET"으로 설정되어 있으면 모든 로그가 기록됩니다. 필요 없는 디버그 로그를 줄이려면 INFO 이상만 기록하도록 조정합니다.logging.basicConfig(level=logging.INFO)수준사용 시점NOTSET DEBUG상세한 정보. 보통 문제 진단할 때만 필요합니다.INFO예상대로 작동하는지에 대한 확인WARNING예상치 못한 일이 발생했거나 가까운 미래에 발생할 문제ERROR더욱 심각한 문제로 인해, 소프트웨어가 일부 기능을 수행하지 못했습니다.CRITICAL심각한 에러. 프로그.. 2025. 3. 28. Python 터미널 명령어에서 인자 받기: argparse 터미널에서 Python 스크립트를 실행할 때 특정한 파라미터(인자)를 입력해서 동작을 다르게 하고 싶을 때가 있습니다. 예를 들어, ETL(Extract, Transform, Load) 프로세스를 실행하는데 모드를 선택해서 실행하고 싶다면 다음과 같이 실행할 수 있습니다.python main.py --mode=1이 글에서는 Python에서 argparse 모듈을 활용하여 터미널에서 입력한 값을 받아오는 방법을 자세히 설명하겠습니다.🔍 argparse란?argparse는 Python에서 터미널에서 입력된 명령줄 인자(Command-line arguments)를 처리하기 위한 표준 라이브러리입니다. 이를 활용하면 사용자가 직접 입력한 값을 받아서 프로그램의 동작을 제어할 수 있습니다.기본적으로 Python.. 2025. 3. 28. 지표에 대하여(종류, 정의 프로세스, Metric Store) 현업 프로젝트에서 지표를 활용할 수 있게 정리한 글이다. 이 전 글인 문제정의 파트와 함께 보면 좋다. 인프런의 [카일스쿨] PM을 위한 데이터 리터러시(프로덕트 데이터 분석) 강의를 참고하였다. 목차1. 좋은 지표의 조건2. 지표의 종류3. 프로젝트 성공과 관련된 지표4. 지표 정의 Process5. 지표 활용 가이드6. Metric Store 좋은 지표의 조건Objective: 업무의 목적과 관련된 지표Measureable: 측정 가능한 지표Actionable한 지표: 지표를 토대로 행동을 할 수 있는 지표Understand: 누구나 이해할 수 있는 지표Specific: 정의를 명확하게 한 지표 다양한 관점으로 해석되지 않는 지표 지표의 종류Input MetricOutput Metrice을 구성하는.. 2025. 3. 19. 문제 정의 프레임워크 3가지(MECE, Logic Tree, So What) 복잡한 문제를 단순화 시켜 보다 쉽게 문제 정의를 할 수 있는 문제 정의 프레임워크 3가지를 소개하는 글이다. 목차1. MECE2. Logic Tree3. So What? Why So? 1. MECEMutually Exclusive Collectively Exhaustive의 약자로, 상호 배타적이면서 모두 합하면 전체가 된다는 뜻이다. 아래 이미지처럼 상호 배타적(ME), 집합적 완전성(CE) 2가지 조건을 모두 만족해야한다. 이 프레임워크를 사용하면 복잡한 문제를 단순화 시킬 수 있다. 예를 들어, 매출을 높여야한다는 과제가 주어졌다고 하면, 뭘 해야 매출이 올라가는지 모호하다. 이 때, MECE 프레임워크를 사용하면, 매출을 카테고리별로 작게 쪼갤 수 있다. 배달의 민족을 예로 들면, 크게 매장.. 2025. 3. 18. 지금까지 경험 점검(+앱 서비스 데이터 분석가가 된 이유) 2년차 데이터 분석가로써 현재의 나는 이러한 역량을 가지게 되었다. 1) 데이터 분석 역량- 프로덕트 개선에 필요한 지표 정의- 매출, 사용자 행동 데이터 분석(주로 BigQuery, MySQL, Python) 및 액션 아이템 도출- 결과 데이터 추출 및 대시보드 제작(주로 Looker Studio) 2) 데이터 엔지니어링 역량- 사용자 행동 로그 설계 및 데이터 QA(GA4, Firbase 기반)- 파이썬 기반 ETL 자동화 파이프라인 구축- 크롤링을 통한 공공 데이터 수집- 딥링크 파라미터 정의 현재 일하고 있는 부동산 중개 앱 서비스 회사에서는 다음과 같은 프로젝트를 진행했다.1) Mobile Web Organic 앱 설치율 개선 프로젝트 - 문제 정의: Mobile Web은 APP보다 트래픽이 .. 2025. 3. 3. GitHub 리포지토리 생성 시 선택하는 라이선스란? GitHub에서 리포지토리를 생성할 때, 초기 설정에서 "라이선스(License)"를 선택하는 옵션이 있습니다. 이 옵션은 해당 프로젝트를 사용하거나 수정, 배포하려는 사용자들이 어떤 규칙을 따라야 하는지 명시합니다. 간단히 말해, 라이선스는 소프트웨어의 사용 권한을 정하는 법적 문서입니다.라이선스를 설정하는 이유오픈소스 프로젝트를 공유할 때 라이선스를 설정하지 않으면, 다른 사용자는 해당 소프트웨어를 자유롭게 사용할 수 없습니다. GitHub의 기본 정책에 따르면, 라이선스가 없는 코드의 사용은 제한적이며, 이를 사용하려면 명시적인 허가가 필요합니다.라이선스를 추가하면 다음과 같은 이점이 있습니다:저작권 보호: 프로젝트에 대한 저작권이 저자에게 있음을 명시.사용 허가 범위 명확화: 다른 사용자가 코드를.. 2025. 1. 26. .gitignore 이란? Git은 소스 코드를 관리하는 데 매우 유용한 도구입니다. 하지만 프로젝트를 진행하다 보면 버전 관리에 포함시키고 싶지 않은 파일들이 생기곤 합니다. 예를 들어, 개발 중 생성된 로그 파일, 컴파일된 바이너리 파일, 또는 민감한 정보가 담긴 환경 설정 파일 등이 그 예입니다. 이러한 파일들을 Git의 추적 대상에서 제외하기 위해 사용하는 것이 바로 .gitignore 파일입니다..gitignore 파일의 역할.gitignore 파일은 Git이 특정 파일 또는 디렉터리를 무시하도록 지시하는 설정 파일입니다. 이 파일에 정의된 규칙에 따라 Git은 불필요한 파일을 추적하지 않으며, 이를 통해 저장소를 깔끔하게 유지하고 불필요한 파일이 저장소에 포함되지 않도록 방지할 수 있습니다.주요 활용 예시빌드 아티팩트 .. 2025. 1. 26. 이전 1 2 3 4 ··· 17 다음