수조 달러를 쏟아붓고도 여전히 실패하는 대형 소프트웨어 프로젝트들

1 day ago 5

  • 전 세계 IT 지출이 2005년 이후 세 배 이상 증가했지만, 대규모 소프트웨어 프로젝트의 성공률은 거의 개선되지 않음
  • 캐나다의 Phoenix 급여 시스템, 영국 Post Office Horizon, 미국과 호주의 복지·행정 시스템 등에서 관리·조직·윤리적 실패가 반복
  • AI 도구나 코파일럿이 이런 문제를 해결할 수 없으며, 인간의 상상력 부족·비현실적 목표·위험 관리 실패가 여전히 주요 원인
  • 레거시 시스템 유지비용이 IT 예산의 70~75%를 차지하고, Agile·DevOps 도입도 조직적 리더십과 문화 변화 없이는 실패율이 높음
  • 반복되는 관리 착오와 책임 회피가 사회적 비용을 키우며, 투명성과 윤리, 인간 중심의 시스템 설계가 필수 과제로 제시됨

소프트웨어 실패의 지속적 문제

  • 지난 20년간 IT 지출은 1.7조 달러에서 5.6조 달러로 증가했으나 소프트웨어 성공률은 정체 상태
    • 실패는 국가, 산업, 조직 형태를 가리지 않고 발생
    • 실패의 사회적·경제적 비용이 지속적으로 증가
  • AI가 관리 문제를 해결할 수 없다는 한계 명시
    • 대규모 프로젝트의 복잡한 이해관계와 정치적 요인을 AI가 통제하기 어려움
    • IT 프로젝트는 이미 비합리적 의사결정이 많아 AI가 학습할 만한 사례가 부족함
  • 실패 원인은 인간의 상상력 부족, 불명확한 목표, 복잡성 관리 실패, 위험 통제 부재
    • 수십 년간 동일한 요인이 반복되어 “failure déjà vu” 현상 지속

캐나다 Phoenix 급여 시스템

  • 2016년 가동된 CA$310백만 규모의 Phoenix 시스템은 80,000개 급여 규칙과 105개 노조 협약을 통합하려다 실패
    • 예산 절감을 위해 테스트·파일럿 절차 축소, 핵심 기능 제거 등 무리한 절차 진행
  • 결과적으로 9년간 직원 43만 명 중 70%가 급여 오류 경험
    • 2025년 3월 기준 34만9천 건의 오류 미해결, 절반 이상이 1년 이상 지연
    • 직원 자살 사례까지 보고됨
  • 총비용은 CA$51억 이상, 감사원은 “프로젝트 관리와 감독의 불가해한 실패”로 평가

영국 Post Office Horizon 시스템

  • 1999년 도입된 Fujitsu의 Horizon POS 시스템은 내부 오류를 숨기며 3,500명 지점장을 허위 회계·사기 혐의로 기소
    • 900명 유죄, 236명 수감, 13명 이상 자살
  • 기술·관리·법적·윤리적 실패가 복합적으로 작용
    • 버그 많은 미들웨어, 통제되지 않은 스코프 확장, 테스트 부족, 인력 미비
    • 경영진은 문제 제기자에 적대적 태도, 증거 은폐, 조직적 은폐 시도
  • 2016년과 2021년 교체 시도도 실패, 여전히 Horizon 사용 중
    • 새 시스템 예산 £4.1억, 2026년 7월 결정 예정

다른 주요 실패 사례

  • 미네소타 MNLARS: 2016년 착수, 2019년 취소, 비용 $1억 달러
  • 호주 Modernising Business Registers: AU$4.8억 예산이 AU$28억으로 증가, 2022년 취소
  • 루이지애나 차량등록 시스템: 50년 된 메인프레임 반복 장애로 2025년 비상사태 선포
  • Jaguar Land Rover: 2025년 사이버공격으로 한 달 이상 전 세계 운영 중단, 손실 $12~19억
  • Lidl ERP: SAP 기반 €5억 ERP 실패 후 자체 시스템으로 복귀(2017년)
  • Boeing 737 Max: MCAS 설계 결함으로 346명 사망, 총비용 $740억 추정
  • F-35 Block 4 업그레이드: 일정 5년 지연, 비용 $105억→$165억 상승

실패의 경제적 비용

  • 미국 내 2022년 소프트웨어 실패 비용 $1.81조, 개발 실패 $2,600억
    • 총액은 국방예산($7,780억) 보다 큼
  • 레거시 시스템 유지비 연간 $5,200억, IT 예산의 70~75% 차지
    • 교체 비용이 높고 실패 위험이 커 교체 지연
  • NTT DATA 2024 보고서: 80% 조직이 노후 기술이 혁신을 저해한다고 응답
    • 경영진 대부분이 레거시 인프라가 시장 대응을 방해한다고 인식

Agile·DevOps의 한계

  • 반복적·점진적 개발 방식 확산에도 실패율 여전
    • 일부 보고서: Agile 프로젝트 실패율 65%, DevOps 90%까지 언급
  • 성공적 도입에는 리더십, 조직 규율, 훈련, 문화 변화 필요
    • 그러나 대부분 조직이 이를 지속하지 못함

반복되는 관리 착오와 학습 부재

  • IT 프로젝트 관리자는 종종 “우리 프로젝트는 다르다”며 과거 실패 교훈을 무시
    • 캐나다 정부는 1995년 첫 급여시스템 실패 교훈을 Phoenix에서 반복
  • 대부분의 실패는 혁신적 시도보다 평범한 관리 실수에서 비롯
    • “창조적 파괴”가 아닌 “재정적 파괴”에 가까움
  • AI 기반 행정 시스템 실패 사례
    • 미국 MiDAS 실업급여 시스템, 호주 Centrelink Robodebt가 잘못된 알고리듬으로 수십만 명을 부당 기소
    • 정부는 오류 인정과 보상에 소극적 태도

책임, 윤리, 투명성의 필요성

  • AI가 내재된 시스템의 불투명한 의사결정은 시민의 권리 침해 우려
    • EU는 ‘알고리듬 결정에 대한 설명권’ 을 법적으로 보장
    • 전 세계적으로 자동화 시스템의 투명성과 책임성을 인권으로 확립할 필요성 제기
  • 소프트웨어 책임법·전문가 면허제 논의 존재하지만 실현 가능성 낮음
  • 현실적 대안은 경영진의 정직·회의적 사고·윤리적 판단 강화
    • 위험을 명확히 인식하고, 공급업체의 과장된 약속에 경계 필요
    • AI 포함 모든 IT 시스템에 인간 중심 설계 원칙 적용 강조

결론: 반복된 실수를 멈출 때

  • 소프트웨어 개발은 본질적으로 복잡하고 취약하며, 작은 오류가 큰 결과로 이어짐
  • 성공적 프로젝트를 위해서는 충분한 자원·리더십·책임성이 필수
  • 사용자에게 미치는 정서적·경제적 피해까지 고려한 비용 산정 필요
  • 1968년 “소프트웨어 위기” 이후 50년 넘게 같은 실수를 반복
    • “새로운 실수를 하라”는 경고로 마무리, 지속적 학습과 책임 있는 관리 문화의 절실함 강조

Read Entire Article