LLMs는 저렴함

3 days ago 7

  • Large Language Models(LLMs) 의 운영 비용이 생각보다 저렴함
  • 초기 생성형 AI 열풍 당시에는 추론 비용이 높았으나, 지난 2년간 비용이 1000배 가까이 감소함
  • 웹 검색 API와 비교해볼 때 LLM 사용이 훨씬 저렴하거나 비슷한 수준임
  • 시장점유율을 위해 인위적으로 가격 책정된 것이 아니라, 실제로 대부분의 API는 단위 기준 수익성을 확보함
  • LLM 비용 구조는 이미 저렴해졌고 앞으로도 더욱 저렴해질 전망임

개요 및 문제 제기

  • 최근 수개월간 여러 번 반복된 논쟁을 정리하기 위해 이 글을 작성함
  • 많은 사람들이 ChatGPT와 같은 LLM의 운영 비용이 매우 비싸다고 오해하고 있음
  • 이로 인해 AI 업체의 사업성이 불투명하다거나, 소비자용 AI 서비스의 수익화에 불리하다는 오분석이 반복됨
  • 실제로는 LLM 추론 비용이 급격히 하락했고, 2년 만에 1000배나 저렴해진 현상임
  • 흔히 사용되는 "1백만 토큰당 가격 모델" 은 직관적으로 이해하기 어려움

웹 검색과 LLM 비용 비교

웹 검색 API 비용

  • Google의 Gemini API는 "Grounding with Google Search" 기능 기준 1,000건: $35 수준으로 제공함
  • Bing Search API는 1,000건: $15부터 이용 가능함
  • Brave Search API는 1,000건: $5~$9 사이이며, 단가가 높아질수록 오히려 가격이 오르는 구조를 가지고 있음
  • 전체적으로 웹 검색 API는 저렴하진 않으며, 서비스 질이 좋은 쪽이 더 비쌈

LLM 추론 비용

  • 검색과 비교 가능한 방식으로 LLM 단가 산정 필요: 한 질의당 토큰 출력 개수 + 토큰당 가격
  • 실제 검색 질의를 참고한 결과, 답변의 토큰 수는 평균 500~1,000토큰
  • 모델별 가격이 $/1k tokens 단위로 제공되기에, 검색 API와 직접 비교 가능함
  • 대부분의 LLM API는 웹 검색보다 최소 10배 이상 저렴
  • 배치 단위, 비피크 시간 할인 등 다양한 추가 할인 조건 고려시 더 저렴해짐

반론 및 주요 이슈

LLM 응답 텍스트가 더 길 경우

  • 일반적인 웹 검색 대체용 질의 기준 충분히 높은 범위를 적용하여 비교함
  • 코딩 등 일부 특수한 케이스는 별도의 비교가 필요함

LLM API 가격이 인위적으로 저렴하게 책정된 점에 대한 반론

  • 실제로 LLM API는 지속적으로 수익성이 확보된 상태로 제공되고 있음
  • 공개된 분석 데이터, Deepseek의 인퍼런스 효율 분석 등 실증 자료가 이를 뒷받침함
  • 일부 모델은 오픈웨이트로 제공되기에 외부 호스팅과의 차이도 거의 없음

인덱싱 및 학습비용 반영 관련

  • 검색 API는 인덱스 구축 및 갱신 비용이 포함된 반면, LLM 서비스는 주로 추론 비용만 반영됨
  • 그러나 인퍼런스 규모 증가로 인해 훈련 비용 역시 빠르게 상각되고 있음

마진 구조 차이

  • 검색 API의 마진이 더 높을 가능성을 배제할 수 없음
  • Deepseek R1 실측치에서 80% 마진 달성 예시 제시

응답 속도 문제

  • 웹 검색은 병렬화가 쉬워 빠르지만, 현재 LLM 추론은 순차적 특성상 상대적으로 느림

OpenAI 등업체의 적자 구조

  • OpenAI가 막대한 적자를 기록하는 것은 매출화가 미진한 무료 사용자가 많기 때문임
  • 현 사용자당 월 1달러 수준으로 광고 등 수익화를 적용한다면 비용 대응 구조는 충분함

왜 중요한가

  • 많은 미래 예측이 LLM이 비싸다는 잘못된 전제에 기반해 이루어지고 있음
  • 실제로는 비용 하락과 수요 증대가 동시에 발생, 향후 가격은 더 하락하며 시장 활성화 예상
  • Frontier AI 기업들은 수익화보다 시장 선점에 초점을 두며, 실제로 LLM 서비스 단가가 특히 낮음
  • 진짜 비용 문제는 LLM 자체가 아니라 후방의 외부 연동 서비스(예: 티켓팅 사이트 등) 에 있음
  • 이러한 외부 서비스들이 수익을 얻지 못하는 구조에서, 향후 AI와 백엔드 서비스 간 새로운 수익모델 또는 기술적 대립 가능성 존재

결론

  • LLM 운영 비용은 더 이상 문제의 핵심이 아님
  • AI 서비스의 실제 경쟁력은 연동 후방 서비스 인프라수익화 구조에 있음
  • AI 자체는 계속 저렴해지며, 활용 사례도 증가할 전망임

추가 참고 자료

  • 본문에 미반영된 참고 자료 목록 제공됨

Read Entire Article