DATA INTELLIGENCE

DATA INTELLIGENCE

빅쿼리를 활용한 AARRR 기반 코호트 분석

빅쿼리를 활용한 AARRR 기반 코호트 분석은 단순한 리포팅 도구를 넘어서 비즈니스 성장의 핵심이 되고 있습니다. 단순한 마케팅 방법론을 뛰어 넘어 지속가능한 비즈니스 성과를 달성하세요.

위그로스

2025년 8월 15일

위그로스

2025년 8월 15일

데이터 기반 의사결정이 비즈니스 성패를 좌우하는 2025년, 단순한 고객 획득을 넘어서 고객 생애주기를 최적화하는 것이 전 세계 기업들의 핵심 과제가 되었습니다. 특히 AARRR 퍼널 각 단계에서 발생하는 고객 이탈을 정확히 진단하고 예측하는 코호트 분석은 데이터 인텔리전스의 핵심 영역으로 자리잡고 있습니다.

AARRR (Acquisition, Activation, Retention, Referral, Revenue) 퍼널은 데이브 맥클루어(Dave McClure)가 2007년 제안한 '해적 지표'로, 스타트업부터 글로벌 기업까지 널리 활용되는 성장 측정 프레임워크입니다. 하지만 단순한 전환율(CVR) 측정만으로는 고객 행동의 시간적 패턴과 세그먼트별 차이를 파악하기 어렵습니다.

MIT Sloan MBA(경영대학원)의 Data-Science 연구에 따르면, 코호트 분석을 통해 AARRR 각 단계를 분석하는 기업들이 전체 고객 생애가치(CLV)를 평균 23% 더 정확하게 예측할 수 있다고 밝혔습니다. 이는 고객의 행동 패턴이 획득(Acqusition) 시점, 첫 활성화(Activation) 경험, 그리고 초기 리텐션(Retention) 단계에서의 경험에 따라 장기적으로 다른 플로우를 그리기 때문입니다.


코호트 분석이란?

출처: How to Perform User Cohort Analysis SQL: 4 Easy Steps | Hevo

코호트 분석(Cohort Analysis)은 공통된 특성이나 행동을 기준으로 사용자를 그룹화하여 시간 경과에 따른 행동 패턴을 추적하는 분석 방법입니다. 단순히 전체 고객을 하나의 집단으로 보는 것이 아니라, 특정 기간에 획득된 고객들, 특정 행동을 수행한 고객들, 또는 유사한 특성을 가진 고객들로 세분화하여 각 그룹의 장기적인 행동 변화를 관찰합니다.

예를 들어 2025년 3월에 가입한 고객들이 6개월 후에도 활성 상태를 유지하는 비율과 2025년 6월에 가입한 고객들의 동일 기간 리텐션율을 비교함으로써, 시기별 고객 품질 차이제품 개선의 효과를 정량적으로 평가할 수 있습니다.

코호트 분석을 위한 주요 지표는 다음과 같습니다(Key metrics to measure by cohort).

지표

설명

코호트 분석에서의 중요성

Retention - D1, D7, D30

설치 후 사용자가 얼마나 재방문하는지

사용자의 이탈 시점과 캠페인·지역별 트렌드 파악에 핵심적

Churn Rate / Bounce Rate (이탈률)

사용자가 웹/앱 사용을 중단하는 시점

사용자 감소의 조기 신호를 포착하고 재참여 전략을 설계하는 데 도움

Lifetime value (LTV, 고객생애가치)

사용자가 시간에 따라 창출하는 총 수익

채널 및 지역별 코호트의 장기적 수익 비교, UA 예산 최적화

Average revenue per user (ARPU, 평균 사용자당 수익)

일정 기간 동안 사용자 1명이 발생시키는 수익

기간별, 코호트별 수익화 패턴 이해에 유용

Conversion rate (전환율)

핵심 액션(회원가입, 구매 등)을 완료한 사용자 비율

코호트별로 퍼널 단계를 얼마나 효율적으로 통과하는지 파악할 수 있음

Funnel progression (퍼널 진행률)

온보딩→구매 등 단계별 사용자 이동 경로

사용자 여정 내 장애 요소(마찰 지점) 파악 및 개선에 활용

Sessions & engagement (세션 및 참여도)

세션 수, 사용 시간, 기능 사용 빈도

사용자 활동 깊이 및 코호트별 유지 요인 진단

Time to first key action (첫 핵심 액션까지의 시간)

사용자가 의미 있는 주요 액션(구매, 가입 등)을 얼마나 빠르게 완료하는지

온보딩 및 활성화 단계별 장애 요소를 찾아내고 개선 전략 수립에 활용


글로벌 데이터 전문가들의 코호트 분석

출처: Comparative age-period-cohort analysis | BMC Medical Research Methodology

Johns Hopkins University데이터 분석 전문가 Dr. Marie Diener-West는 "코호트 분석의 핵심은 시간 경과에 따른 인과관계 추론에 있다"고 강조합니다. 단순한 상관관계를 넘어서 특정 고객 행동이 장기 리텐션에 미치는 인과적 영향을 규명하는 것이 비즈니스 전략 수립의 핵심이라는 것입니다.

또한 Columbia University의 Age-Period-Cohort 분석 연구진은 코호트 효과를 다음 세 가지 차원에서 분석할 것을 권장합니다.

  • 연령 효과(Age Effect): 고객의 생애주기 단계에 따른 행동 변화

  • 기간 효과(Period Effect): 외부 환경 변화가 모든 코호트에 미치는 영향

  • 코호트 효과(Cohort Effect): 특정 코호트만의 고유한 특성과 경험


코호트 분석법 (How to Conduct Cohort Analysis)

출처: Your essential guide to cohort analysis in mobile marketing | Adjust

1단계: 명확한 목표와 질문 설정

효과적인 코호트 분석의 첫 번째 단계는 해결하고자 하는 비즈니스 문제를 명확히 정의하는 것입니다. 단순히 데이터를 분석하는 것이 아니라, 구체적인 비즈니스 질문에 답하기 위한 분석이어야 합니다.

비즈니스 문제 정의

  • 어떤 마케팅 채널에서 유입된 고객들이 가장 높은 장기 리텐션을 보이는가?

  • 제품의 특정 기능을 사용한 고객들의 이탈률이 일반 고객들보다 낮은가?

  • 프리미엄 요금제로 업그레이드한 고객들의 생애가치(LTV)는 얼마나 되는가?

  • 온보딩 프로세스를 완료한 고객들과 그렇지 않은 고객들의 6개월 후 활동 차이는?

2단계: 핵심 지표(Key Metrics) 정의

분석 목표에 따라 추적할 핵심 지표를 구체적으로 정의해야 합니다. 각 지표는 측정 가능하고 비즈니스 성과와 직접적으로 연결되어야 합니다.

주요 코호트 분석 지표

  • 리텐션율(Retention Rate): 특정 기간 후에도 활성 상태를 유지하는 고객 비율

  • 평균 사용자당 수익(ARPU): 각 코호트가 생성하는 평균 수익

  • 고객 생애가치(CLV): 고객이 생애 동안 기업에 가져다주는 총 가치

  • 이탈률(Churn Rate): 서비스를 중단하는 고객의 비율

  • 전환율(Conversion Rate): 특정 액션(구매, 구독 등)을 수행하는 고객 비율

  • 참여도(Engagement): 세션 수, 페이지뷰, 기능 사용 빈도 등

3단계: 코호트 정의 및 세분화

코호트를 어떻게 정의하느냐가 데이터 분석의 질을 좌우합니다. 비즈니스 모델과 데이터 분석 목적에 따라 적절한 코호트 기준을 선택해야 합니다.

시간 기반 코호트 SQL 예시

-- 월별 가입 코호트 생성
WITH user_cohorts AS (
  SELECT
    user_id,
    DATE_TRUNC(signup_date, MONTH) as cohort_month,
    signup_date,
    first_purchase_date
  FROM users
  WHERE signup_date >= '2024-01-01'
),

-- 코호트별 기본 통계
cohort_summary AS (
  SELECT
    cohort_month,
    COUNT(DISTINCT user_id) as cohort_size,
    COUNT(DISTINCT CASE WHEN first_purchase_date IS NOT NULL THEN user_id END) as converted_users,
    AVG(DATE_DIFF(first_purchase_date, signup_date, DAY)) as avg_days_to_convert
  FROM user_cohorts
  GROUP BY cohort_month
)

SELECT * FROM cohort_summary ORDER BY

행동 기반 코호트 SQL 예시

-- 온보딩 완료 여부에 따른 코호트 분류
WITH behavioral_cohorts AS (
  SELECT
    u.user_id,
    u.signup_date,
    CASE
      WHEN oe.completed_steps >= 5 THEN 'Complete_Onboarding'
      WHEN oe.completed_steps BETWEEN 1 AND 4 THEN 'Partial_Onboarding'
      ELSE 'No_Onboarding'
    END as cohort_type
  FROM users u
  LEFT JOIN onboarding_events oe ON u.user_id = oe.user_id
)

SELECT
  cohort_type,
  COUNT(DISTINCT user_id) as cohort_size
FROM behavioral_cohorts
GROUP BY

4단계: 데이터 수집 및 전처리

고품질의 일관된 데이터가 정확한 분석의 전제조건입니다. 데이터 수집 과정에서 다음 사항들을 점검해야 합니다.

데이터 품질 검증 체크리스트

  • 완성도(Completeness): 필수 필드의 누락 데이터 비율이 5% 이하인가?

  • 일관성(Consistency): 동일한 사용자의 데이터가 여러 시스템에서 일치하는가?

  • 정확성(Accuracy): 논리적으로 불가능한 값(미래 날짜, 음수 수익 등)이 있는가?

  • 최신성(Recency): 분석에 필요한 최신 데이터가 반영되어 있는가?

-- 데이터 품질 검증 쿼리
SELECT
  'Total Users' as metric,
  COUNT(*) as value
FROM users
UNION ALL
SELECT
  'Users with Missing Signup Date',
  COUNT(*)
FROM users
WHERE signup_date IS NULL
UNION ALL
SELECT
  'Users with Invalid Future Dates',
  COUNT(*)
FROM users
WHERE signup_date > CURRENT_DATE()
UNION ALL
SELECT
  'Duplicate User Records',
  COUNT(*) - COUNT(DISTINCT user_id)
FROM

5단계: 코호트 분석 실행 및 시각화

준비된 데이터를 바탕으로 실제 코호트 분석을 수행하고 해석 가능한 형태로 시각화합니다.

리텐션 코호트 분석 SQL

WITH cohort_data AS (
  SELECT
    user_id,
    DATE_TRUNC(signup_date, MONTH) as cohort_month,
    signup_date
  FROM users
),

user_activities AS (
  SELECT
    cd.user_id,
    cd.cohort_month,
    cd.signup_date,
    a.activity_date,
    DATE_DIFF(a.activity_date, cd.signup_date, MONTH) as period_number
  FROM cohort_data cd
  JOIN activities a ON cd.user_id = a.user_id
),

cohort_table AS (
  SELECT
    cohort_month,
    period_number,
    COUNT(DISTINCT user_id) as active_users
  FROM user_activities
  GROUP BY cohort_month, period_number
),

cohort_sizes AS (
  SELECT
    cohort_month,
    COUNT(DISTINCT user_id) as cohort_size
  FROM cohort_data
  GROUP BY cohort_month
)

SELECT
  ct.cohort_month,
  ct.period_number,
  ct.active_users,
  cs.cohort_size,
  ROUND(ct.active_users * 100.0 / cs.cohort_size, 2) as retention_rate
FROM cohort_table ct
JOIN cohort_sizes cs ON ct.cohort_month = cs.cohort_month
ORDER BY ct.cohort_month,

6단계: 결과 해석 및 액션 플랜 수립

분석된 코호트 리포트 결과를 비즈니스 관점에서 해석하고 구체적인 개선 방안을 도출하는 것이 가장 중요한 단계입니다.

패턴 식별 방법

  • 가로축 분석: 특정 코호트의 시간별 리텐션 변화 추이

  • 세로축 분석: 동일 기간에서의 코호트별 성과 차이

  • 대각선 분석: 최신 트렌드와 계절적 패턴 파악

액션 플랜 예시

  • 높은 이탈률 구간 발견: 해당 시점의 사용자 경험 개선

  • 성과 좋은 코호트 식별: 성공 요인을 다른 코호트에 적용

  • 채널별 차이 발견: 마케팅 예산을 효과적인 채널로 재배치


빅쿼리(BigQuery) 기반 코호트 분석의 필요성

출처: How to create a GA4 user retention cohort table in BigQuery

빅쿼리가 코호트 분석에 최적화된 이유는 빅쿼리의 가장 큰 장점인 확장성(Scalability) 때문입니다. 전통적인 데이터베이스에서는 수백만 건의 거래 데이터로 코호트 분석을 수행할 때 성능 문제가 발생하지만, 빅쿼리는 페타바이트(Petabyte, PB) 규모의 데이터를 초 단위로 처리할 수 있습니다.

서버리스 아키텍처를 통해 복잡한 인프라 관리 없이도 자동 확장이 가능합니다. 이는 특히 실시간 코호트 분석이 필요한 상황에서 큰 이점을 제공합니다. 또한 머신러닝 통합 기능으로 코호트 분석 결과를 바탕으로 한 예측 모델링을 원스톱으로 수행할 수 있습니다. Google의 AutoML 기능을 활용하면 코호트별 이탈 확률 예측 모델을 자동으로 생성할 수 있습니다.

Google Cloud의 Data Analysis 전문가 Thomas Remy는 "BigQuery의 머신러닝 기능을 활용한 코호트 분석이 마케팅 캠페인 효과를 최대 79%까지 향상시킬 수 있다"고 밝혔습니다. 특히 대용량 데이터에서 실시간으로 코호트를 생성하고 분석하는 능력이 경쟁 우위의 핵심이라고 강조했습니다.


실전 코호트 분석 SQL 구현

빅쿼리는 대규모 데이터셋에서 코호트 분석을 수행하기에 가장 대표적인 플랫폼입니다. 다음은 사용자의 첫 방문일을 기준으로 코호트를 생성하는 기본 쿼리입니다.

이 쿼리는 첫 구매월을 기준으로 코호트를 생성하고, 각 기간별 리텐션율을 계산합니다. 빅쿼리의 윈도우 함수와 집계 함수를 활용해 대용량 데이터도 효율적으로 처리할 수 있습니다.

WITH user_cohorts AS (
  SELECT
    user_id,
    DATE_TRUNC(first_purchase_date, MONTH) as cohort_month,
    DATE_DIFF(purchase_date, first_purchase_date, MONTH) as period_number
  FROM (
    SELECT
      user_id,
      purchase_date,
      MIN(purchase_date) OVER(PARTITION BY user_id) as first_purchase_date
    FROM purchases
  )
),

cohort_sizes AS (
  SELECT
    cohort_month,
    COUNT(DISTINCT user_id) as cohort_size
  FROM user_cohorts
  WHERE period_number = 0
  GROUP BY cohort_month
),

retention_table AS (
  SELECT
    cohort_month,
    period_number,
    COUNT(DISTINCT user_id) as active_users
  FROM user_cohorts
  GROUP BY cohort_month, period_number
)

SELECT
  r.cohort_month,
  r.period_number,
  r.active_users,
  c.cohort_size,
  ROUND(r.active_users * 100.0 / c.cohort_size, 2) as retention_rate
FROM retention_table r
JOIN cohort_sizes c ON r.cohort_month = c.cohort_month
ORDER BY cohort_month,

수익(Revenue) 기반 코호트 분석

단순 방문 및 회원가입 등 사용자 행동 리텐션을 넘어서 수익 기반 코호트 분석을 통해 각 코호트의 고객생애가치(LTV) 패턴을 파악할 수 있습니다. 이 분석을 통해 코호트별 수익 성장 패턴을 파악하고, 조기 경고 신호를 식별할 수 있습니다.

WITH cohort_revenue AS (
  SELECT
    cohort_month,
    period_number,
    SUM(revenue) as cohort_period_revenue,
    COUNT(DISTINCT user_id) as active_users
  FROM user_cohorts uc
  JOIN purchases p ON uc.user_id = p.user_id
    AND DATE_DIFF(p.purchase_date, uc.cohort_month, MONTH) = uc.period_number
  GROUP BY cohort_month, period_number
),

clv_analysis AS (
  SELECT
    cohort_month,
    SUM(cohort_period_revenue) OVER(
      PARTITION BY cohort_month
      ORDER BY period_number
      ROWS UNBOUNDED PRECEDING
    ) as cumulative_revenue,
    LAG(cohort_period_revenue) OVER(
      PARTITION BY cohort_month
      ORDER BY period_number
    ) as prev_period_revenue
  FROM cohort_revenue
)

SELECT
  cohort_month,
  cumulative_revenue,
  CASE
    WHEN prev_period_revenue > 0
    THEN (cohort_period_revenue - prev_period_revenue) * 100.0 / prev_period_revenue
    ELSE NULL
  END as revenue_growth_rate
FROM


리텐션 보고서의 종류와 분석 방식

출처: How to create a GA4 user retention cohort table in BigQuery

1. 클래식 코호트 리텐션 보고서

가장 기본적인 형태로, 획득 시점을 기준으로 고객을 그룹화하고 시간 경과에 따른 활성 고객 비율을 추적합니다.

  • 가로(행) 분석: 특정 코호트의 시간별 리텐션 변화 추이

  • 세로(열) 분석: 동일 기간에서의 코호트별 리텐션 차이 비교

  • 대각선 분석: 최신 데이터 트렌드와 계절성 패턴 파악

2. 수익 기반 코호트 보고서

고객 생애가치(CLV) 관점에서 코호트를 분석합니다. 단순한 활성도가 아닌 실제 수익 기여도를 기준으로 평가하여 마케팅 ROI를 정확히 측정할 수 있습니다. Netflix는 구독료 기반의 수익 코호트 분석을 통해 콘텐츠 투자 ROI를 월별로 추적하고 있습니다. 특히 오리지널 콘텐츠 출시 후 신규 가입자들의 12개월 리텐션율이 기존 대비 35% 향상된 것을 확인했습니다.

3. 행동 기반 코호트 보고서

특정 기능 사용이나 행동 완료를 기준으로 코호트를 생성합니다. 이는 제품-시장 적합성(Product-Market Fit) 측정에 특히 유용합니다.

Spotify플레이리스트 생성 코호트 분석을 통해 첫 주에 플레이리스트를 만든 사용자들의 6개월 리텐션율 73%로, 일반 사용자(41%)보다 현저히 높음을 확인했습니다. 그리고 소셜 기능 활용 코호트 분석을 통해 친구와 음악을 공유한 사용자들의 연간 구독 갱신율이 89%에 달함을 파악했습니다.

4. 예측적 코호트 분석 보고서

머신러닝 모델을 활용해 미래 행동을 예측하는 고도화된 분석입니다. 빅쿼리의 ML 기능을 활용하면 다음과 같은 예측이 가능합니다.

CREATE OR REPLACE MODEL `project.dataset.cohort_churn_model`
OPTIONS(
  model_type='logistic_reg',
  labels=['will_churn']
) AS
SELECT
  cohort_month,
  period_number,
  retention_rate,
  revenue_per_user,
  engagement_score,
  IF(period_number = 12 AND retention_rate < 0.3, TRUE, FALSE) as will_churn
FROM


비즈니스 성과 향상을 위한 데이터 시각화 대시보드 구축

출처: How to build your own GA4 attribution model comparison tool in BigQuery and Looker Studio

빅쿼리 기반 코호트 분석은 실시간 대시보드와 연동하여 즉각적인 비즈니스 의사결정을 지원할 수 있습니다. 위그로스는 비즈니스모델 기반의 Looker Studio 또는 Tableau와의 연동을 통해, 실무자가 쉽게 이해하며 의사결정 할 수 있는 시각화 대시보드를 제공합니다.

핵심 KPI 대시보드 구성

  • 코호트별 리텐션 히트맵: 시각적으로 문제 구간 식별

  • 예측 이탈 알림: 머신러닝 기반 조기 경고 시스템

  • 세그먼트별 CLV 트렌드: 마케팅 투자 우선순위 결정 지원

  • 실시간 캠페인 성과: A/B 테스트 결과 즉시 반영


결론: 데이터 인텔리전스 기반 데이터 분석환경 구축의 중요성

출처: Google Cloud BigQuery - Features, Working, and Pricing

빅쿼리를 활용한 AARRR 기반 코호트 분석은 단순한 리포팅 도구를 넘어서 비즈니스 성장의 핵심이 되고 있습니다. 특히 고객 생애주기 전반에 걸친 깊이 있는 인사이트를 제공함으로써, 기업들이 데이터 기반의 정확한 의사결정을 내릴 수 있도록 지원합니다. 고객의 인지적 특성과 행동 패턴을 코호트 분석으로 인사이트 도출하여 더욱 정교한 마케팅 전략 설계 및 성과 극대화가 가능합니다.

데이터가 곧 성과로 연결되는 현 시점, 데이터 인텔리전스 역량이 필수입니다. 단순히 데이터를 수집하고 저장하는 것을 넘어서, 빅쿼리와 같은 데이터 웨어하우스 플랫폼을 통해 데이터로부터 실행 가능한 인사이트를 도출하고 이를 실제 비즈니스 성과로 연결시키는 능력이 중요합니다.

위그로스(Wegrowth)는 이러한 데이터 인텔리전스 구축을 통해 고객사의 지속 가능한 성장 동력을 확보하는 데 전문성을 집중하고 있습니다. 그로스 마케팅, 데이터 인텔리전스, 브랜딩, 글로벌 마케팅의 통합적 접근을 통해 측정 가능한 성과를 만들어내는 것이 핵심 목표입니다. 단순한 마케팅 방법론을 뛰어 넘어 위그로스의 국내외 마케팅 실무 전문성을 바탕으로 실질적이며 지속 가능한 비즈니스 성장을 달성하세요.

위그로스 문의하기

위그로스 오픈카톡방 입장하기

Read More

Read More

편안함의 습격에 맞서는 전략적 불편함: 고객 세분화 전략

‘편안함 증후군’에 빠진 마케팅 전략의 구조적 한계와 이를 해결하기 위한 전략적 불편함에 대해 그로스 마케팅 관점의 고객 세분화 전략을 정의합니다.

GROWTH MARKETING

2025년 8월 11일

편안함의 습격에 맞서는 전략적 불편함: 고객 세분화 전략

‘편안함 증후군’에 빠진 마케팅 전략의 구조적 한계와 이를 해결하기 위한 전략적 불편함에 대해 그로스 마케팅 관점의 고객 세분화 전략을 정의합니다.

GROWTH MARKETING

2025년 8월 11일

B2C 온라인커머스 업셀링·크로스셀링 마케팅 전략

신규 고객 확보 비용이 기존 고객 유지 비용의 5배에서 25배에 달하는 상황에서, 업셀링과 크로스셀링이 핵심 성장 동력으로 자리 잡았습니다.

GROWTH MARKETING

2025년 8월 8일

B2C 온라인커머스 업셀링·크로스셀링 마케팅 전략

신규 고객 확보 비용이 기존 고객 유지 비용의 5배에서 25배에 달하는 상황에서, 업셀링과 크로스셀링이 핵심 성장 동력으로 자리 잡았습니다.

GROWTH MARKETING

2025년 8월 8일

Growth Loop와 Retention: 감정적 애착이 만드는 지속가능한 매커니즘

Death Valley를 넘어 지속가능한 Retention Plateau 달성을 위해선 사용자가 자발적으로 머물고 공유하고 싶어지는 경험을 데이터 기반으로 비즈니스 매커니즘을 설계해야 합니다.

GROWTH MARKETING

2025년 8월 6일

Growth Loop와 Retention: 감정적 애착이 만드는 지속가능한 매커니즘

Death Valley를 넘어 지속가능한 Retention Plateau 달성을 위해선 사용자가 자발적으로 머물고 공유하고 싶어지는 경험을 데이터 기반으로 비즈니스 매커니즘을 설계해야 합니다.

GROWTH MARKETING

2025년 8월 6일

DATA INTELLIGENCE

DATA INTELLIGENCE

빅쿼리를 활용한 AARRR 기반 코호트 분석

빅쿼리를 활용한 AARRR 기반 코호트 분석은 단순한 리포팅 도구를 넘어서 비즈니스 성장의 핵심이 되고 있습니다. 단순한 마케팅 방법론을 뛰어 넘어 지속가능한 비즈니스 성과를 달성하세요.

위그로스

2025년 8월 15일

위그로스

2025년 8월 15일

데이터 기반 의사결정이 비즈니스 성패를 좌우하는 2025년, 단순한 고객 획득을 넘어서 고객 생애주기를 최적화하는 것이 전 세계 기업들의 핵심 과제가 되었습니다. 특히 AARRR 퍼널 각 단계에서 발생하는 고객 이탈을 정확히 진단하고 예측하는 코호트 분석은 데이터 인텔리전스의 핵심 영역으로 자리잡고 있습니다.

AARRR (Acquisition, Activation, Retention, Referral, Revenue) 퍼널은 데이브 맥클루어(Dave McClure)가 2007년 제안한 '해적 지표'로, 스타트업부터 글로벌 기업까지 널리 활용되는 성장 측정 프레임워크입니다. 하지만 단순한 전환율(CVR) 측정만으로는 고객 행동의 시간적 패턴과 세그먼트별 차이를 파악하기 어렵습니다.

MIT Sloan MBA(경영대학원)의 Data-Science 연구에 따르면, 코호트 분석을 통해 AARRR 각 단계를 분석하는 기업들이 전체 고객 생애가치(CLV)를 평균 23% 더 정확하게 예측할 수 있다고 밝혔습니다. 이는 고객의 행동 패턴이 획득(Acqusition) 시점, 첫 활성화(Activation) 경험, 그리고 초기 리텐션(Retention) 단계에서의 경험에 따라 장기적으로 다른 플로우를 그리기 때문입니다.


코호트 분석이란?

출처: How to Perform User Cohort Analysis SQL: 4 Easy Steps | Hevo

코호트 분석(Cohort Analysis)은 공통된 특성이나 행동을 기준으로 사용자를 그룹화하여 시간 경과에 따른 행동 패턴을 추적하는 분석 방법입니다. 단순히 전체 고객을 하나의 집단으로 보는 것이 아니라, 특정 기간에 획득된 고객들, 특정 행동을 수행한 고객들, 또는 유사한 특성을 가진 고객들로 세분화하여 각 그룹의 장기적인 행동 변화를 관찰합니다.

예를 들어 2025년 3월에 가입한 고객들이 6개월 후에도 활성 상태를 유지하는 비율과 2025년 6월에 가입한 고객들의 동일 기간 리텐션율을 비교함으로써, 시기별 고객 품질 차이제품 개선의 효과를 정량적으로 평가할 수 있습니다.

코호트 분석을 위한 주요 지표는 다음과 같습니다(Key metrics to measure by cohort).

지표

설명

코호트 분석에서의 중요성

Retention - D1, D7, D30

설치 후 사용자가 얼마나 재방문하는지

사용자의 이탈 시점과 캠페인·지역별 트렌드 파악에 핵심적

Churn Rate / Bounce Rate (이탈률)

사용자가 웹/앱 사용을 중단하는 시점

사용자 감소의 조기 신호를 포착하고 재참여 전략을 설계하는 데 도움

Lifetime value (LTV, 고객생애가치)

사용자가 시간에 따라 창출하는 총 수익

채널 및 지역별 코호트의 장기적 수익 비교, UA 예산 최적화

Average revenue per user (ARPU, 평균 사용자당 수익)

일정 기간 동안 사용자 1명이 발생시키는 수익

기간별, 코호트별 수익화 패턴 이해에 유용

Conversion rate (전환율)

핵심 액션(회원가입, 구매 등)을 완료한 사용자 비율

코호트별로 퍼널 단계를 얼마나 효율적으로 통과하는지 파악할 수 있음

Funnel progression (퍼널 진행률)

온보딩→구매 등 단계별 사용자 이동 경로

사용자 여정 내 장애 요소(마찰 지점) 파악 및 개선에 활용

Sessions & engagement (세션 및 참여도)

세션 수, 사용 시간, 기능 사용 빈도

사용자 활동 깊이 및 코호트별 유지 요인 진단

Time to first key action (첫 핵심 액션까지의 시간)

사용자가 의미 있는 주요 액션(구매, 가입 등)을 얼마나 빠르게 완료하는지

온보딩 및 활성화 단계별 장애 요소를 찾아내고 개선 전략 수립에 활용


글로벌 데이터 전문가들의 코호트 분석

출처: Comparative age-period-cohort analysis | BMC Medical Research Methodology

Johns Hopkins University데이터 분석 전문가 Dr. Marie Diener-West는 "코호트 분석의 핵심은 시간 경과에 따른 인과관계 추론에 있다"고 강조합니다. 단순한 상관관계를 넘어서 특정 고객 행동이 장기 리텐션에 미치는 인과적 영향을 규명하는 것이 비즈니스 전략 수립의 핵심이라는 것입니다.

또한 Columbia University의 Age-Period-Cohort 분석 연구진은 코호트 효과를 다음 세 가지 차원에서 분석할 것을 권장합니다.

  • 연령 효과(Age Effect): 고객의 생애주기 단계에 따른 행동 변화

  • 기간 효과(Period Effect): 외부 환경 변화가 모든 코호트에 미치는 영향

  • 코호트 효과(Cohort Effect): 특정 코호트만의 고유한 특성과 경험


코호트 분석법 (How to Conduct Cohort Analysis)

출처: Your essential guide to cohort analysis in mobile marketing | Adjust

1단계: 명확한 목표와 질문 설정

효과적인 코호트 분석의 첫 번째 단계는 해결하고자 하는 비즈니스 문제를 명확히 정의하는 것입니다. 단순히 데이터를 분석하는 것이 아니라, 구체적인 비즈니스 질문에 답하기 위한 분석이어야 합니다.

비즈니스 문제 정의

  • 어떤 마케팅 채널에서 유입된 고객들이 가장 높은 장기 리텐션을 보이는가?

  • 제품의 특정 기능을 사용한 고객들의 이탈률이 일반 고객들보다 낮은가?

  • 프리미엄 요금제로 업그레이드한 고객들의 생애가치(LTV)는 얼마나 되는가?

  • 온보딩 프로세스를 완료한 고객들과 그렇지 않은 고객들의 6개월 후 활동 차이는?

2단계: 핵심 지표(Key Metrics) 정의

분석 목표에 따라 추적할 핵심 지표를 구체적으로 정의해야 합니다. 각 지표는 측정 가능하고 비즈니스 성과와 직접적으로 연결되어야 합니다.

주요 코호트 분석 지표

  • 리텐션율(Retention Rate): 특정 기간 후에도 활성 상태를 유지하는 고객 비율

  • 평균 사용자당 수익(ARPU): 각 코호트가 생성하는 평균 수익

  • 고객 생애가치(CLV): 고객이 생애 동안 기업에 가져다주는 총 가치

  • 이탈률(Churn Rate): 서비스를 중단하는 고객의 비율

  • 전환율(Conversion Rate): 특정 액션(구매, 구독 등)을 수행하는 고객 비율

  • 참여도(Engagement): 세션 수, 페이지뷰, 기능 사용 빈도 등

3단계: 코호트 정의 및 세분화

코호트를 어떻게 정의하느냐가 데이터 분석의 질을 좌우합니다. 비즈니스 모델과 데이터 분석 목적에 따라 적절한 코호트 기준을 선택해야 합니다.

시간 기반 코호트 SQL 예시

-- 월별 가입 코호트 생성
WITH user_cohorts AS (
  SELECT
    user_id,
    DATE_TRUNC(signup_date, MONTH) as cohort_month,
    signup_date,
    first_purchase_date
  FROM users
  WHERE signup_date >= '2024-01-01'
),

-- 코호트별 기본 통계
cohort_summary AS (
  SELECT
    cohort_month,
    COUNT(DISTINCT user_id) as cohort_size,
    COUNT(DISTINCT CASE WHEN first_purchase_date IS NOT NULL THEN user_id END) as converted_users,
    AVG(DATE_DIFF(first_purchase_date, signup_date, DAY)) as avg_days_to_convert
  FROM user_cohorts
  GROUP BY cohort_month
)

SELECT * FROM cohort_summary ORDER BY

행동 기반 코호트 SQL 예시

-- 온보딩 완료 여부에 따른 코호트 분류
WITH behavioral_cohorts AS (
  SELECT
    u.user_id,
    u.signup_date,
    CASE
      WHEN oe.completed_steps >= 5 THEN 'Complete_Onboarding'
      WHEN oe.completed_steps BETWEEN 1 AND 4 THEN 'Partial_Onboarding'
      ELSE 'No_Onboarding'
    END as cohort_type
  FROM users u
  LEFT JOIN onboarding_events oe ON u.user_id = oe.user_id
)

SELECT
  cohort_type,
  COUNT(DISTINCT user_id) as cohort_size
FROM behavioral_cohorts
GROUP BY

4단계: 데이터 수집 및 전처리

고품질의 일관된 데이터가 정확한 분석의 전제조건입니다. 데이터 수집 과정에서 다음 사항들을 점검해야 합니다.

데이터 품질 검증 체크리스트

  • 완성도(Completeness): 필수 필드의 누락 데이터 비율이 5% 이하인가?

  • 일관성(Consistency): 동일한 사용자의 데이터가 여러 시스템에서 일치하는가?

  • 정확성(Accuracy): 논리적으로 불가능한 값(미래 날짜, 음수 수익 등)이 있는가?

  • 최신성(Recency): 분석에 필요한 최신 데이터가 반영되어 있는가?

-- 데이터 품질 검증 쿼리
SELECT
  'Total Users' as metric,
  COUNT(*) as value
FROM users
UNION ALL
SELECT
  'Users with Missing Signup Date',
  COUNT(*)
FROM users
WHERE signup_date IS NULL
UNION ALL
SELECT
  'Users with Invalid Future Dates',
  COUNT(*)
FROM users
WHERE signup_date > CURRENT_DATE()
UNION ALL
SELECT
  'Duplicate User Records',
  COUNT(*) - COUNT(DISTINCT user_id)
FROM

5단계: 코호트 분석 실행 및 시각화

준비된 데이터를 바탕으로 실제 코호트 분석을 수행하고 해석 가능한 형태로 시각화합니다.

리텐션 코호트 분석 SQL

WITH cohort_data AS (
  SELECT
    user_id,
    DATE_TRUNC(signup_date, MONTH) as cohort_month,
    signup_date
  FROM users
),

user_activities AS (
  SELECT
    cd.user_id,
    cd.cohort_month,
    cd.signup_date,
    a.activity_date,
    DATE_DIFF(a.activity_date, cd.signup_date, MONTH) as period_number
  FROM cohort_data cd
  JOIN activities a ON cd.user_id = a.user_id
),

cohort_table AS (
  SELECT
    cohort_month,
    period_number,
    COUNT(DISTINCT user_id) as active_users
  FROM user_activities
  GROUP BY cohort_month, period_number
),

cohort_sizes AS (
  SELECT
    cohort_month,
    COUNT(DISTINCT user_id) as cohort_size
  FROM cohort_data
  GROUP BY cohort_month
)

SELECT
  ct.cohort_month,
  ct.period_number,
  ct.active_users,
  cs.cohort_size,
  ROUND(ct.active_users * 100.0 / cs.cohort_size, 2) as retention_rate
FROM cohort_table ct
JOIN cohort_sizes cs ON ct.cohort_month = cs.cohort_month
ORDER BY ct.cohort_month,

6단계: 결과 해석 및 액션 플랜 수립

분석된 코호트 리포트 결과를 비즈니스 관점에서 해석하고 구체적인 개선 방안을 도출하는 것이 가장 중요한 단계입니다.

패턴 식별 방법

  • 가로축 분석: 특정 코호트의 시간별 리텐션 변화 추이

  • 세로축 분석: 동일 기간에서의 코호트별 성과 차이

  • 대각선 분석: 최신 트렌드와 계절적 패턴 파악

액션 플랜 예시

  • 높은 이탈률 구간 발견: 해당 시점의 사용자 경험 개선

  • 성과 좋은 코호트 식별: 성공 요인을 다른 코호트에 적용

  • 채널별 차이 발견: 마케팅 예산을 효과적인 채널로 재배치


빅쿼리(BigQuery) 기반 코호트 분석의 필요성

출처: How to create a GA4 user retention cohort table in BigQuery

빅쿼리가 코호트 분석에 최적화된 이유는 빅쿼리의 가장 큰 장점인 확장성(Scalability) 때문입니다. 전통적인 데이터베이스에서는 수백만 건의 거래 데이터로 코호트 분석을 수행할 때 성능 문제가 발생하지만, 빅쿼리는 페타바이트(Petabyte, PB) 규모의 데이터를 초 단위로 처리할 수 있습니다.

서버리스 아키텍처를 통해 복잡한 인프라 관리 없이도 자동 확장이 가능합니다. 이는 특히 실시간 코호트 분석이 필요한 상황에서 큰 이점을 제공합니다. 또한 머신러닝 통합 기능으로 코호트 분석 결과를 바탕으로 한 예측 모델링을 원스톱으로 수행할 수 있습니다. Google의 AutoML 기능을 활용하면 코호트별 이탈 확률 예측 모델을 자동으로 생성할 수 있습니다.

Google Cloud의 Data Analysis 전문가 Thomas Remy는 "BigQuery의 머신러닝 기능을 활용한 코호트 분석이 마케팅 캠페인 효과를 최대 79%까지 향상시킬 수 있다"고 밝혔습니다. 특히 대용량 데이터에서 실시간으로 코호트를 생성하고 분석하는 능력이 경쟁 우위의 핵심이라고 강조했습니다.


실전 코호트 분석 SQL 구현

빅쿼리는 대규모 데이터셋에서 코호트 분석을 수행하기에 가장 대표적인 플랫폼입니다. 다음은 사용자의 첫 방문일을 기준으로 코호트를 생성하는 기본 쿼리입니다.

이 쿼리는 첫 구매월을 기준으로 코호트를 생성하고, 각 기간별 리텐션율을 계산합니다. 빅쿼리의 윈도우 함수와 집계 함수를 활용해 대용량 데이터도 효율적으로 처리할 수 있습니다.

WITH user_cohorts AS (
  SELECT
    user_id,
    DATE_TRUNC(first_purchase_date, MONTH) as cohort_month,
    DATE_DIFF(purchase_date, first_purchase_date, MONTH) as period_number
  FROM (
    SELECT
      user_id,
      purchase_date,
      MIN(purchase_date) OVER(PARTITION BY user_id) as first_purchase_date
    FROM purchases
  )
),

cohort_sizes AS (
  SELECT
    cohort_month,
    COUNT(DISTINCT user_id) as cohort_size
  FROM user_cohorts
  WHERE period_number = 0
  GROUP BY cohort_month
),

retention_table AS (
  SELECT
    cohort_month,
    period_number,
    COUNT(DISTINCT user_id) as active_users
  FROM user_cohorts
  GROUP BY cohort_month, period_number
)

SELECT
  r.cohort_month,
  r.period_number,
  r.active_users,
  c.cohort_size,
  ROUND(r.active_users * 100.0 / c.cohort_size, 2) as retention_rate
FROM retention_table r
JOIN cohort_sizes c ON r.cohort_month = c.cohort_month
ORDER BY cohort_month,

수익(Revenue) 기반 코호트 분석

단순 방문 및 회원가입 등 사용자 행동 리텐션을 넘어서 수익 기반 코호트 분석을 통해 각 코호트의 고객생애가치(LTV) 패턴을 파악할 수 있습니다. 이 분석을 통해 코호트별 수익 성장 패턴을 파악하고, 조기 경고 신호를 식별할 수 있습니다.

WITH cohort_revenue AS (
  SELECT
    cohort_month,
    period_number,
    SUM(revenue) as cohort_period_revenue,
    COUNT(DISTINCT user_id) as active_users
  FROM user_cohorts uc
  JOIN purchases p ON uc.user_id = p.user_id
    AND DATE_DIFF(p.purchase_date, uc.cohort_month, MONTH) = uc.period_number
  GROUP BY cohort_month, period_number
),

clv_analysis AS (
  SELECT
    cohort_month,
    SUM(cohort_period_revenue) OVER(
      PARTITION BY cohort_month
      ORDER BY period_number
      ROWS UNBOUNDED PRECEDING
    ) as cumulative_revenue,
    LAG(cohort_period_revenue) OVER(
      PARTITION BY cohort_month
      ORDER BY period_number
    ) as prev_period_revenue
  FROM cohort_revenue
)

SELECT
  cohort_month,
  cumulative_revenue,
  CASE
    WHEN prev_period_revenue > 0
    THEN (cohort_period_revenue - prev_period_revenue) * 100.0 / prev_period_revenue
    ELSE NULL
  END as revenue_growth_rate
FROM


리텐션 보고서의 종류와 분석 방식

출처: How to create a GA4 user retention cohort table in BigQuery

1. 클래식 코호트 리텐션 보고서

가장 기본적인 형태로, 획득 시점을 기준으로 고객을 그룹화하고 시간 경과에 따른 활성 고객 비율을 추적합니다.

  • 가로(행) 분석: 특정 코호트의 시간별 리텐션 변화 추이

  • 세로(열) 분석: 동일 기간에서의 코호트별 리텐션 차이 비교

  • 대각선 분석: 최신 데이터 트렌드와 계절성 패턴 파악

2. 수익 기반 코호트 보고서

고객 생애가치(CLV) 관점에서 코호트를 분석합니다. 단순한 활성도가 아닌 실제 수익 기여도를 기준으로 평가하여 마케팅 ROI를 정확히 측정할 수 있습니다. Netflix는 구독료 기반의 수익 코호트 분석을 통해 콘텐츠 투자 ROI를 월별로 추적하고 있습니다. 특히 오리지널 콘텐츠 출시 후 신규 가입자들의 12개월 리텐션율이 기존 대비 35% 향상된 것을 확인했습니다.

3. 행동 기반 코호트 보고서

특정 기능 사용이나 행동 완료를 기준으로 코호트를 생성합니다. 이는 제품-시장 적합성(Product-Market Fit) 측정에 특히 유용합니다.

Spotify플레이리스트 생성 코호트 분석을 통해 첫 주에 플레이리스트를 만든 사용자들의 6개월 리텐션율 73%로, 일반 사용자(41%)보다 현저히 높음을 확인했습니다. 그리고 소셜 기능 활용 코호트 분석을 통해 친구와 음악을 공유한 사용자들의 연간 구독 갱신율이 89%에 달함을 파악했습니다.

4. 예측적 코호트 분석 보고서

머신러닝 모델을 활용해 미래 행동을 예측하는 고도화된 분석입니다. 빅쿼리의 ML 기능을 활용하면 다음과 같은 예측이 가능합니다.

CREATE OR REPLACE MODEL `project.dataset.cohort_churn_model`
OPTIONS(
  model_type='logistic_reg',
  labels=['will_churn']
) AS
SELECT
  cohort_month,
  period_number,
  retention_rate,
  revenue_per_user,
  engagement_score,
  IF(period_number = 12 AND retention_rate < 0.3, TRUE, FALSE) as will_churn
FROM


비즈니스 성과 향상을 위한 데이터 시각화 대시보드 구축

출처: How to build your own GA4 attribution model comparison tool in BigQuery and Looker Studio

빅쿼리 기반 코호트 분석은 실시간 대시보드와 연동하여 즉각적인 비즈니스 의사결정을 지원할 수 있습니다. 위그로스는 비즈니스모델 기반의 Looker Studio 또는 Tableau와의 연동을 통해, 실무자가 쉽게 이해하며 의사결정 할 수 있는 시각화 대시보드를 제공합니다.

핵심 KPI 대시보드 구성

  • 코호트별 리텐션 히트맵: 시각적으로 문제 구간 식별

  • 예측 이탈 알림: 머신러닝 기반 조기 경고 시스템

  • 세그먼트별 CLV 트렌드: 마케팅 투자 우선순위 결정 지원

  • 실시간 캠페인 성과: A/B 테스트 결과 즉시 반영


결론: 데이터 인텔리전스 기반 데이터 분석환경 구축의 중요성

출처: Google Cloud BigQuery - Features, Working, and Pricing

빅쿼리를 활용한 AARRR 기반 코호트 분석은 단순한 리포팅 도구를 넘어서 비즈니스 성장의 핵심이 되고 있습니다. 특히 고객 생애주기 전반에 걸친 깊이 있는 인사이트를 제공함으로써, 기업들이 데이터 기반의 정확한 의사결정을 내릴 수 있도록 지원합니다. 고객의 인지적 특성과 행동 패턴을 코호트 분석으로 인사이트 도출하여 더욱 정교한 마케팅 전략 설계 및 성과 극대화가 가능합니다.

데이터가 곧 성과로 연결되는 현 시점, 데이터 인텔리전스 역량이 필수입니다. 단순히 데이터를 수집하고 저장하는 것을 넘어서, 빅쿼리와 같은 데이터 웨어하우스 플랫폼을 통해 데이터로부터 실행 가능한 인사이트를 도출하고 이를 실제 비즈니스 성과로 연결시키는 능력이 중요합니다.

위그로스(Wegrowth)는 이러한 데이터 인텔리전스 구축을 통해 고객사의 지속 가능한 성장 동력을 확보하는 데 전문성을 집중하고 있습니다. 그로스 마케팅, 데이터 인텔리전스, 브랜딩, 글로벌 마케팅의 통합적 접근을 통해 측정 가능한 성과를 만들어내는 것이 핵심 목표입니다. 단순한 마케팅 방법론을 뛰어 넘어 위그로스의 국내외 마케팅 실무 전문성을 바탕으로 실질적이며 지속 가능한 비즈니스 성장을 달성하세요.

위그로스 문의하기

위그로스 오픈카톡방 입장하기