본문 바로가기

분류 전체보기141

Matplotlib Subplot 활용해서 그래프 여러개 그리는 3가지 방법 Python에서 데이터 시각화를 할 때, 여러 그래프를 하나의 화면에 표시하고 싶다면 'Subplot'이 해결책입니다. 이 글에서는 Python의 대표적인 시각화 라이브러리인 Matplotlib, Seaborn, Plotly를 사용하여 Subplot을 그리는 방법에 대해 알아보겠습니다. 목차 Subplot 그리는 방법 1. plt.subplot(O행, O열, O번째) 2. fig, ax = plt.subplot(O행, O열) 3. Gridspec 라이브러리별 Subplot 적용 방법 1. matplotlib 2. seaborn 3. plotly Subplot 그리는 방법 subplot을 그리는 대표적인 3가지 방법을 소개합니다. 이 3가지 방법은 matplotlib와 seaborn을 활용하여 그린 그래프.. 2023. 10. 12.
데이터 시각화를 하는 이유, 좋은 시각화 핵심 법칙 데이터 시각화를 하는 이유와 기업에서의 활용 방법을 소개합니다. 또한, 액션 가능한 인사이트를 얻기 위한 다양한 그래프 유형과 좋은 시각화 핵심 법칙을 알아보겠습니다. 인간이 어떤 정보를 받아들일 때 70%를 시각으로 받아들인다고 합니다. 오른쪽 사진처럼 색상 속성을 활용하면, 같은 정보라도 훨씬 빠르게 정보를 이해할 수 있죠. 이처럼 쉽게 이해할 수 있게 시각적으로 표현하면, 보다 수월한 커뮤니케이션을 진행할 수 있습니다. 기업에서 시각화를 하는 이유 기업에서 데이터 시각화를 하는 이유는 궁극적으로 액션 가능한 인사이트를 찾고 커뮤니케이션을 하기 위해서입니다. 제품과 서비스가 실패하는 대부분의 이유는 제품-시장 적합성(Product-Market Fit, PMF)을 찾지 못했기 때문입니다. 사람들의 필요.. 2023. 10. 11.
plt.legend 옵션으로 그래프 범례 모양 커스터마이즈하기 이 글은 plt.legend 함수를 통해 그래프 범례 모양을 내 마음대로 커스터마이즈하고 싶은 분들을 위한 글입니다. 이를 위한 label, loc, ncol, fontsize, frameon, shadow 총 6가지의 옵션과 기타 옵션들에 대해서 예시와 함께 설명하며, 실습합니다. plt.legend는 그래프의 범례를 표기할 때 사용하는 함수입니다. 다음과 같이 matplotilb 라이브러리를 불러오면 사용이 가능하죠. import matplotlib.pyplot as plt plt.legend 함수에는 다양한 옵션들이 있는데, 이 옵션들을 사용하면 범례의 위치, 스타일, 크기 등을 커스터마이즈 할 수 있습니다. 주요 옵션에는 다음과 같은 것들이 있습니다. 목차 label loc ncol fontsiz.. 2023. 10. 10.
이어드림스쿨 3기 5,6개월차 후기 및 회고 완료한 일 [19주차: 07.31~08.06] 이어드림 스쿨 9주차: 선형대수, 이력서&자소서 특강 패캠 태블로 강의 3~6챕터(총 4개 챕터) 수강 및 실습 SQL 문제 풀이 18개 파이썬 문제 풀이 4개 티스토리 블로그 6개 SQL 3개 데이터 분석의 목적 및 프로세스 양승화, 그로스해킹이란? 이어드림스쿨 3기 4개월차 후기 및 회고 운동 4회 독서 3파트(그로스해킹 1,2,3장) 영어 회화 2강 스터디 1회(영어 스터디) 영어 발표 자료 완성 크몽 거래 1회 채용 공고 크롤링 [20주차: 08.07~08.13] 이어드림 스쿨 20주차: 기계학습 심화 데이터리안 GA4 강의 1주차 완료, 2주차 4개 강의 완료 태블로 강의 2개 챕터(7,8,9) SQL 22문제 파이썬 코테 3문제 블로그 6개 SQL.. 2023. 10. 3.
구글 스프레드시트 SPARKLINE : 100% 누적 바 그래프 함수로 그리기 100% 누적 바 그래프를 어떻게 하면 손쉽게 그릴 수 있을까요? 구글 스프레드시트의 SPARKLINE 함수를 사용하면, 아주 간단하게 그래프를 그릴 수 있습니다. 위 이미지는 태블로를 통해 표현된 100% 누적 바 차트입니다. 이러한 유료 프로그램을 사용하지 않고, 아래와 같은 표를 이용해서 100% 누적 바 차트를 그리려면 어떻게 해야 할까요? 2가지 방법이 있습니다. 첫 번째, 차트를 삽입한다. 두 번째, 함수를 활용한다. 차트 삽입하는 방법은 메뉴 -> 삽입 -> 차트를 클릭하면 쉽게 삽입을 할 수 있으니 오늘은 보다 생소하고, 간편한 방법인 Sparkline 함수를 이용해서 그래프 그리는 방법을 알아보겠습니다. SPARKLINE 함수로 그릴 수 있는 그래프 종류 SPARKLINE(데이터, [옵션.. 2023. 9. 18.
구글 SEO 글쓰기 필수 요소 총정리 2023 본 가이드는 구글 SEO에 최적화된 글쓰기를 통해 첫 페이지에 검색 노출이 되는 방법을 알고자 하는 블로거와 콘텐츠 마케터들에게 좋은 가이드입니다. SEO는 Search Engine Optimization의 약자로 번역하면 검색엔진최적화입니다. 유료광고의 경우엔 클릭 한 번 당 100원 ~ 10만원까지도 지불이 되는 반면, SEO를 고려한 글쓰기를 통해서 콘텐츠를 구글 첫 페이지에 노출시키면 무료로 광고를 하는 효과를 얻을 수 있습니다. 그래서 블로거와 콘텐츠 마케터분들에겐 SEO 공부가 필수이죠. 블로그 주제 또는 내가 속한 산업에 따라서 네이버 SEO가 중요할 수도 있고, 구글 SEO가 중요할 수도 있습니다. 네이버와 구글의 SEO는 다른 점이 너무나 많기 때문에 구글에서의 검색노출을 목표로 하시는 .. 2023. 9. 15.
구글 스프레드시트 데이터 분석 핵심 함수 5가지 구글 스프레드시트 데이터 분석 업무에 가장 많이 쓰이는 핵심 함수 5가지를 소개합니다. 계산을 한 번에 해주는 ARRAYFORMULA 함수부터 VLOOKUP, FILTER, QUERY와 같은 조건 검색 함수, 그리고 여러 파일을 연결시켜 주는 IMPORTRANGE 함수까지 설명합니다. 기본적으로 구글 스프레드시트에서 제공하는 함수들은 아래 사이트에서 전부 확인해 볼 수 있습니다. 본 블로그에서는 실무에서 가장 많이 사용하는 '조건에 맞는 데이터를 가져와 분석하는 함수'를 다루겠습니다. Google Sheets 함수 목록 1. 구글 스프레드시트 효율 끝판왕 함수 : ARRAYFORMULA 함수 : ARRAYFORMULA(배열 수식) ARRAYFORMULA 함수는 배열 연산을 수행하기 위해 설계된 함수입니다.. 2023. 8. 27.
A/B 테스트 설계 및 방법과 유의 사항 with 실무예제 목차 1. A/B 테스트 설계 방법 2. A/B 테스트 설계 시 유의사항 3. A/B 테스트 결과를 분석하는 방법 3-1. A/B테스트 계산기 3-2. 테스트 비용과 효과 크기 💡 A/B 테스트란? 두 개의 변형 A와 B를 사용하는 종합 대조 실험. 두 가지 서로 다른 옵션에 대한 사용자의 반응을 측정함으로써 어떤 옵션이 더 효과적인지를 검증하는 과정이다. 1. A/B 테스트 설계 방법 가설 : A/B테스트의 출발점은 가설. 가설은 독립변수와 종속 변수가 무엇인지를 정의하고 종속 변수의 목표 수준을 정하는 형태로 이뤄진다. 실험 집단/통제 집단 : 전체 모수 중 실험 조건에 할당되는 사용자들을 어떤 기준으로 구분하고, 어떤 비율로 할당할 것인지 정의해야 한다. 가장 중요한 정차는 통제 변수 관리와 엄격한.. 2023. 8. 14.
[프로그래머스 SQL] 특정 기간동안 대여 가능한 자동차들의 대여비용 구하기 정답 쿼리 SELECT DISTINCT(C.CAR_ID), C.CAR_TYPE, ROUND(DAILY_FEE * 30 - (DAILY_FEE * 30 * (DISCOUNT_RATE/100))) AS FEE FROM CAR_RENTAL_COMPANY_CAR C JOIN CAR_RENTAL_COMPANY_RENTAL_HISTORY H ON C.CAR_ID = H.CAR_ID JOIN CAR_RENTAL_COMPANY_DISCOUNT_PLAN P ON C.CAR_TYPE = P.CAR_TYPE WHERE C.CAR_TYPE IN ('세단', 'SUV') AND C.CAR_ID NOT IN ( SELECT CAR_ID FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY WHERE START_D.. 2023. 8. 14.
[그로스해킹] AARRR 프레임워크란? 과업 기반 지표관리 vs 프레임워크 기반 지표관리 오늘 소개할 AARRR은 결국 지표(metric)에 대한 이야기이다. 그로스 해킹은 핵심 지표를 찾고, 그 지표를 성장시키는 방법을 찾는 활동이라고 할 수 있다. 지표를 측정하고 관리하는 방법은 크게 2가지이다. 과업 기반(Task-based) 지표 관리 프레임워크 기반(Framework-based) 지표 관리 결론만 이야기하면, 과업 기반 지표 관리는 비효율적이다. 조직도에 따라 분류된 팀 별로(과업기반으로) 지표를 선정하고 모니터링하는 방식으로 지표를 관리하는 방식인데, 이는 여러 가지 문제점이 있기 때문이다. 전사 관점에서의 지표 우선순위를 정의하기 어렵고, 서비스/프로덕트 관점이 아닌 팀별(마케팅팀, 운영팀, 개발팀, 사업팀 등)로 각각 관리되기 .. 2023. 8. 11.
기초 통계 용어 정리 목차 1. 확률, 표본 공간, 실험, 사건 2. 확률 변수 3. 복원 샘플링과 비복원 샘플링 4. 수치형 변수, 범주형 변수 5. 도수, 평균, 기댓값, 중앙값 6. 분산, 표준편차 1. 확률, 표본 공간, 실험, 사건 표본공간 : 일어날 수 있는 모든 경우의 수(ex. 주사위의 모든 눈 1,2,3,4,5,6) 실험 : 결과를 예측할 수 없는 행동을 취하는 것 (ex. 주사위를 굴리는 행위) 사건 : 실험에 의해 벌어진 일이나 그 값 (ex. 굴렸더니 주사위의 눈이 6이 나옴) 확률 : 어떤 일이 일어날 가능성(ex. 주사위 굴렸을 때 1이 나올 확률은 1/6) $$ P(A) = \frac{A}{S} $$ P(A) : Probability = A라는 사건이 발생할 확률 A : A 사건이 일어날 경우의 수.. 2023. 8. 9.
[그로스해킹]제품-시장 적합성(Product-Market Fit, PMF) 제품-시장 적합성(Product-Market Fit, PMF)은 그로스 해킹의 전제조건으로, 넷스케이프 창업자인 마크 앤드리슨 은 PMF를 다음과 같이 정의했다. 제품-시장 적합성(PMF)이란 좋은 시장에, 그 시장을 만족시킬 수 있는 제품을 갖고 있는 것. 저번에 저자 양승화님의 을 읽고, 리뷰한 글에 이어서 이번에는 2장에 나오는 개념인 PMF에 대해서 정리해보려고한다. 양승화, 그로스해킹이란? 네이버, 이음소시어스, SK텔레콤을 거쳐 지금은 여행 스타트업 마이리얼트립(MyRealTrip)의 데이터&인사이트실 실장(Head of Data&Insight)으로 일하고 있으신 양승화님께서 작성한 책인 '그로스 해킹'이 coduking.com 정말 많은 제품 관리자가 하는 실수 1. 제품을 먼저 만들고, 그.. 2023. 8. 8.