340만 개 태양광 패널

3 days ago 7
  • 미국 태양광 공간 데이터셋을 GeoPackage에서 Parquet로 변환해 옥상 배열, 배열, 패널을 함께 분석했고, 패널 레코드는 3,429,157개까지 집계됨
  • 옥상 배열은 5,822개, 배열은 18,980개로 정리됐으며, 좌표를 EPSG:4326으로 바꾸고 bbox와 WKB geometry를 함께 저장해 지도 기반 집계와 시각화에 활용함
  • 옥상 배열과 배열 모두 H3 히트맵과 대표 소스 지도로 분포를 비교했으며, 소스별 커버리지와 경계 형태가 서로 달라 같은 지역에서도 탐지 결과가 다르게 나타남
  • 옥상 배열에서는 modType이 거의 c-si에 집중됐고, 배열 데이터에서는 설치 연도별 AC/DC 용량 평균과 최대값이 1985년부터 2025년까지 함께 집계됨
  • 패널 시각화에는 실제 태양광 패널 외에 Ivanpah Solar Power Facility의 거울 구조물이 포함된 예외도 드러나며, 대규모 탐지 데이터의 활용성과 한계를 함께 보여줌

분석 준비된 데이터셋

  • GM-SEUS v2 ZIP 다운로드3.4 GB ZIP 파일을 내려받아 GeoPackage 파일을 추출해 사용함
  • GPKG 파일의 투영은 +proj=aea +lat_0=23 +lon_0=-96 +lat_1=29.5 +lat_2=45.5 ... +units=m +no_defs로 확인됨
  • Rooftop arrays, panels, arrays 데이터를 각각 Parquet 형식으로 변환했고, 좌표는 EPSG:4326으로 바꾼 뒤 bbox와 WKB geometry를 함께 저장함
    • 변환 과정에서 rooftop arrays는 DuckDB v1.4.4를 사용했으며, v1.5.1에서는 예외가 발생함
    • 저장 시 ZSTD, COMPRESSION_LEVEL 22, ROW_GROUP_SIZE 15000 설정을 사용함
  • Rooftop arrays 데이터셋

    • 레코드 수는 5,822개
    • 컬럼 요약에서 area는 NULL 비율 2.77%, 최소 15.0, 최대 487111.0으로 집계됨
    • azimuth, capMWAC, capMWDC, mount, tilt는 NULL 비율이 각각 89.63%, 89.52%, 87.12%, 87.53%, 90.64% 로 높게 나타남
    • instYr는 NULL 비율 72.43% 이며 값 범위는 2003~2025
    • modType은 고유값 2개로 c-si, thin-film이 포함됨
    • Source는 고유값 15개로 집계됨
  • Panels 데이터셋

    • 레코드 수는 3,429,157개
    • arrayID는 NULL 비율 0.03%, 고유값 약 12,653개로 집계됨
    • panelID는 NULL 비율 0.00%, 최대값 3,429,157까지 이어짐
    • pnlSource는 고유값 5개, Source는 고유값 12개
    • rowArea는 15.01~9982.68, rowAzimuth는 90.0~540.0, rowLength는 3.96~737.38, rowWidth는 0.45~135.33 범위로 집계됨
    • rowSpace는 NULL 비율 1.27%, 값 범위는 0.01~20.0
    • rowMount는 고유값 3개로 집계됨
  • Arrays 데이터셋

    • 레코드 수는 18,980개
    • arrayID는 고유값 약 16,914개이며 최대값은 18,980
    • avgAzimuth, avgLength, avgSpace, avgWidth는 모두 NULL 비율 32.88% 로 같음
    • capMWAC 최대값은 1128.931, capMWDC 최대값은 1467.61, capMWDCest 최대값은 1758.501
    • effInit은 NULL 비율 0.07%, 값 범위는 0.09~0.21
    • instYr는 1985~2025, instYrEst는 NULL 비율 0.32% 와 함께 2003~2025 범위로 집계됨
    • mount는 고유값 9개, modType은 고유값 3개, Source는 고유값 10개
    • tilt와 tiltEst는 모두 NULL 비율 46.39%
    • totArea는 30~19,603,313, totRowArea는 30~8,537,538 범위로 나타남

옥상 태양광 배열

  • Rooftop arrays 데이터셋을 H3 레벨 4 기준 히트맵으로 시각화함
  • 소스별 레코드 수는 OSM 2,175건, CECSFC 1,835건, TZSAM 1,024건, USPVDB 485건 순으로 많음
    • 그 밖에 GRW 93, GMSEUSdigArraysPanels_v2_0 54, gspt 46, SAM 43, GMSEUSgeoref_v2_0 24, CCVPV 16, GPPDB 15, CWSD 10, InSPIRE 2로 집계됨
  • H3 레벨 3 육각형별로 가장 많이 나타난 대표 소스를 따로 계산해 지도에 표시함
  • mount와 modType 교차 집계에서는 modType이 거의 c-si에 집중됨
    • fixed_axis는 c-si 381, thin-film 2로 나타남
    • single_axis는 c-si 210, dual_axis는 c-si 33, unknown은 c-si 98임
    • mount가 NULL인 행은 c-si 5096으로 가장 많음
  • 설치 연도별 면적 통계는 instYr 값이 있는 행만 사용했으며, 2003~2025 구간을 집계함
    • 2011년은 count 46, 평균 면적 41,511, 최대 487,111로 나타남
    • 2017년은 count 105, 평균 20,882, 최대 315,564
    • 2018년은 count 225로 연도별 개수가 가장 많고 평균 13,584, 최대 152,636
    • 2025년은 count 148, 평균 12,363, 최대 135,270으로 집계됨

옥상 배열 풋프린트

  • Los Angeles에서 Long Beach까지의 지도에서 탐지 결과를 소스별 색상으로 구분해 표시함
  • 일부 소스는 건물 외곽을 보수적으로 윤곽화
  • 다른 소스는 더 유기적인 형태의 경계를 가짐
  • gspt 소스는 탐지 결과를 대략적인 원형으로 표시함
    • 예시 이미지에서는 지붕 패널이 있는 창고 4개가 보이지만 탐지 결과는 큰 원 2개로만 나타남
  • Los Angeles 전역에는 탐지되지 않은 옥상 배열이 많이 남아 있음
    • 이 데이터셋은 레코드 수가 약 5K 수준이라 커버리지를 더 넓힐 여지가 큼

배열과 패널

  • Arrays 데이터셋도 H3 레벨 4 기준 히트맵으로 시각화함
  • 소스별 레코드 수는 OSM 5,222건, USPVDB 4,024건, TZSAM 3,278건, CECSFC 2,288건 순으로 집계됨
    • 이어서 GMSEUSgeoref_v2_0 1,697, GMSEUSdigArraysPanels_v2_0 1,291, GRW 957, CCVPV 155, CWSD 68이 포함됨
  • H3 레벨 3 육각형마다 가장 많이 나타난 대표 소스를 계산해 지도에 표시함
  • 가까운 위치의 태양광 발전소라도 탐지 소스가 서로 다를 수 있음
  • Arrays 데이터셋은 모든 태양광 발전소를 잡아내지 못하며, 배열 경계만 있고 패널 자체는 표시하지 않은 데이터셋도 있음
    • -118.355, 34.837 예시에서 패널은 보라색으로 표시됨
  • 설치 연도별 배열 용량 통계에서는 AC/DC 평균, 중앙값, 최대값을 함께 집계함
    • 1985년은 count 1, ACavg 14, DCavg 17임
    • 2014년은 count 913, ACavg 6, DCavg 7, ACmax 586, DCmax 752로 집계됨
    • 2020년은 count 1673, ACavg 11, DCavg 15, ACmax 638, DCmax 829임
    • 2021년은 count 1705, ACavg 19, DCavg 24로 커짐
    • 2023년은 count 2017, ACavg 34, DCavg 44, ACmax 1095, DCmax 1423로 나타남
    • 2024년은 count 730, ACavg 37, DCavg 44임
    • 2025년은 count 152, ACavg 18, DCavg 23, ACmax 1129, DCmax 1468로 집계됨

패널 시각화와 예외 항목

  • California -115.47, 35.57의 한 태양광 단지에서 azimuth 필드를 그라디언트로 시각화함
  • 이 탐지 결과는 panels 데이터셋에 들어 있지만, Hacker News 댓글에서는 해당 구조물이 패널이 아니라 거울이며 Ivanpah Solar Power Facility의 일부로 연결됨
  • 다른 공원에서도 같은 방식의 시각화를 보여줌
  • 사막 지역에는 마이크로칩처럼 보이는 패턴이 넓게 분포함
Read Entire Article