Jukang

다차원 지표 기반의 서울시 자치구별 에너지 소비 패턴 및 정주 환경 분석 (2019–2024)

K-means 군집화 기반 에너지 소비 패턴 분석

분석 개요

서울 자치구별 인구, 가스 수급 가구수, 전력 사용량 데이터를 통합하여 자치구의 생활 기반과 에너지 소비 구조를 비교하고, 지역별 생활 중심성활동 중심성의 차이를 해석한다.

① 통계적 안정성 확보

(자치구 × 연도)를 하나의 관측치로 취급하여 총 150개 관측치로 군집화함으로써 중심점 추정과 실루엣 해석의 안정성을 확보하였다.

② 시간 차원의 해석

같은 자치구의 여러 연도가 동일 군집에 귀속되는지 여부는 해당 자치구 에너지 소비 구조의 안정성 혹은 구조적 변화를 판별하는 지표가 된다.

③ 코로나19 포함

코로나19 이전·확산·회복기를 모두 포함하여 단년도 이상치에 의한 해석 편향을 완화한다.

대상: 서울시 25개 자치구기간: 2019~2024년 (6개년)총 관측치: 150개 (25구 × 6년)최적 K: 6 (해석의 경제성 + 통계적 안정성)

출처: 서울시 전력 사용량(용도별) 통계 · 서울시 주민등록인구 · 서울시 상주인구 · 서울시 도시가스 이용현황 (서울 열린데이터광장)

로딩 중...

서울시 전체 현황 및 상관관계 분석

Pearson 상관관계 분석 결과 (2019–2024 통합) · |r| ≥ 0.7 강한 상관 / 0.4~0.7 중간 / <0.4 약한 상관

양의 상관
음의 상관

분석 데이터를 계산하고 있습니다...

최적 K 선정: 엘보우 분석

K 증가에 따른 Inertia 감소율이 급격히 완만해지는 변곡점이 최적 K 후보

k=5지점에서 경사가 완화되기 시작하였으며, K=5에서 K=6구간에서 Inertia 감소폭이 54.7로 이전 구간 대비 눈에 띄게 줄어드는 팔꿈치(Elbow)지점 이 관찰되었다.
2019-2024년 전체 데이터 (25개 자치구 x 6개 년도 = 150건)기준, K=6 320.57
로딩 중...

최적 K 선정: 실루엣 분석

값이 1에 가까울수록 군집 분리가 명확 · 해석 가능성과 통계적 안정성을 종합 고려

k=9에서 0.4202로 통계적 최댓값을 기록하였으나, 25개자치구 x 6개년 패널 데이터의 높은 피처 자기상관(0.9972) 구조에서는 K증가 시 실루엣이 인위적으로 상승하는 과적합이 발생한다. Bootstrap ARI 안정성 검증과 도시 맥락에서의 해석 가능성을 종합적으로 고려하여 최종 K=6을 채택했다.
로딩 중...

K-Means 클러스터링 결과

K = 6

자치구별 에너지 소비 구조 기반 군집 분류

인구, 총 가구수, 가스 보급률, 4가지 용도별 전력 사용 비율(가정용·공공용·서비스업·산업용) 등 총 7개 지표를 통합하여 K-means 알고리즘(k=6)으로 자치구의 에너지 소비 패턴 및 정주 환경을 군집화한 결과입니다.
생활 중심성활동 중심성의 구조적 분화가 뚜렷하게 확인됩니다.
로딩 중...

종합 분석 해석

상관관계 · 클러스터링 분석 결과를 종합한 주요 발견

K=6 선택한 이유

단순 실루엣 수치만 보면 K=9(0.4202)가 유리해 보인다. 하지만, 25개자치구 x 6개년 패널데이터의 높은 자기상관(0.9972) 구조에서는 K증가가 실제 군집 품질 향상이 아닌 수치 인플레이션으로 이어진다. K=6은 주거형·상업형·외곽형 등 실제 도시 맥락에서 해석 가능한 6개 유형과 일치하다고 판단, Bootstrap ARI 검증에서도 안정성이 확인되었다.

상관관계 분석

총 상주인구와 총 가구수는 (0.96)의 강한 양의 상관관계를 나타낸다. 가장 주목할 관계는 가정용 전력비율과, 서비스업 전력비율 간 (-0.86)의 강한 음의 상관으로, 주거 중심 자치구와 상업중심 자치구가 에너지 소비구조 면에서 명확히 분리됨을 보여준다.
총 인구가 많은 자치구일수록 가스공급 비율(-0.58)과 산업용 전력비율(-0.55)이 낮아지는 경향도 확인된다.

엘보우 분석

K 증가에 따른 군집 내 분산(Inertia) 감소추이를 분석하였다. K=2(734.7)에서 K=5(375.3)까지 급격히 감소하다가, K5에서 K6 구간(54.7 감소)부터 감소폭이 완만해진다.
K=6이후로는 추가적인 분산 감소 효과가 점차 줄어들어, K=6이 복잡도와 설명력의 균형점임을 확인하였다.

실루엣 계수 분석

수치상 최고점은 K=9(0.4202)지만, 본 데이터는 25개 자치구 x 6개년 패널 구조로 피처 자기상관이 (0.9972)에 달한다. 이 경우 K를 높일수록 실루엣이 인위적으로 상승하는 과적합이 발생한다.
Bootstrap ARI 안정성 검증 결과와, 도시 에너지 정책 맥락에서의 해석 가능성을 함께 고려하여 K=6(실루엣 0.3492)를 최종 선택하였다.