OpenAI가 o3 가격을 80% 인하함

2 days ago 5

Hacker News 의견
  • 내 경험을 바탕으로 하나의 주의점을 공유하고 싶음. OpenRouter에서 이미 크레딧이 있어 o3를 활성화해보려고 했으나 "OpenAI는 o3 API 사용 시 직접 API 키를 제공해야 한다"는 메시지가 나옴. 그래서 OpenAI 계정으로 API 크레딧을 20달러 구매하고, 새로운 API 키와 o3 모델로 Aider를 시작했음. 요청을 보내니 "조직이 검증되어야 o3를 사용할 수 있다, 조직을 검증하려면 링크의 Verify Organization을 클릭하라"는 에러가 발생함. 점점 짜증이 밀려왔고, OpenAI로 돌아가 Verify Organization을 클릭하니 실제로는 본인 신원을 제3자인 Persona로 검증해야 했음. "Start ID Check"를 클릭하면 Persona의 개인정보 및 생체정보 수집, 사용, 그리고 그 데이터는 1년간 보관한다는 안내가 뜸. 단순히 API액세스에 몇 달러를 쓰려다 갑자기 본인 생체정보를 세계 최대 AI회사와 파트너 업체에게 제공하라는 요구까지 오게 된 것임. 환불은 어떻게 받아야 할지 모르겠음
    • 나도 이전에 다른 AI 회사에 환불을 못 받아서 캘리포니아 주 법무부에 연락해 환불을 해결한 적 있음. 이런 식으로 결제 이후 추가 요구사항을 들이밀지 못하게 우리가 바로잡아야 한다고 생각함. 그리고 개인정보로 이미 이름, 주소, 카드 정보를 받고 있는데 왜 전화번호도 요구하는지 궁금함. 혹시 모두에게 전화번호를 받는 이유를 아는 사람 있는지 질문하고 싶음
    • Sam Altman이 실제로는 신원 확인을 위해 생체 정보를 수집하는 암호화폐 회사(Worldcoin)를 운영하고 있지 않나 하는 의문이 듦. 익숙한 느낌임 Worldcoin 정보
    • 최근 한 달 내에 거의 똑같은 사연을 본 것 같아 데자뷔를 느끼거나, 아니면 뭔가 더 있는 게 아닐까 싶음
    • 사실 신원 확인이라도 시도할 수 있는 당신이 오히려 행운이라고 생각함. 나는 몇 달간 "세션 만료" 에러만 뜨고 지원팀은 답장하지도 않음
    • 동일 시기에 KYC(고객신원확인) 요구와 OpenAI가 모든 로그를 저장한다는 점이 함께 나타나는 상황임
  • 요즘 OpenAI가 "게을러졌다"고 느껴짐. 질문을 해도 전체 파일이나 수정사항을 직접 주지 않고 "이렇게 해야 한다"고만 하고, 실제로 해달라고 2~3번 정도 더 요청해야 실행함. deepseek에서는 이런 현상을 보지 않음. 리소스 절약을 위해 이렇게 답변하는 건지도 궁금함
    • OpenAI 직원임. 우리의 모델이 때때로 게으를 수 있음. 의도된 게 아니고, 앞으로 더 나아질 모델을 제공할 예정임. Netflix에서 일할 때도 낮은 품질의 추천을 의도적으로 하냐는 비슷한 의혹이 있었는데, 실제로는 제품 완성도가 그리 쉽게 오르지 않기 때문임. 결국 완벽한 제품을 만드는 건 정말 어려운 일임
    • 최근 화학 계산 관련해서 "X 대 Y 그래프 만들어줘"라고 했더니 답변이 설명만 장황하게 하고 "그래프 필요하면 말해줘!"로 끝내는 경우가 있었음. 뭔가 웃김
  • 어떻게 우리가 o3 모델이 quantized(정밀도 낮춤) 버전이 아닌지 알 수 있을지 의문임. 업체들이 벤치마크 결과만 좋게 발표해놓고 실제로는 점차 quantize(Q8에서 Q6, Q4 등)해서 성능을 떨어뜨릴 수도 있겠다는 생각이 듦. gpt-4-turbo가 빠르게 출시된 것도 이런 방식 때문이 아닐까 의심함. 실제 사용해보면 오리지널 GPT-4보다 별로였고, 아마도 turbo와 4o 등에서 벤치마크만 집중한 것 같음. 사용자들이 실제론 더 별로인데도 더 좋은 듯 인식함
    • 이게 실제로 업체들이 하는 방식일 것이고, 오리지널 o3를 o3-pro로 리브랜딩했다고 생각함
    • 언제나 새로운 모델이 처음엔 잘 나오다가 점점 결과가 나빠지는 것 같음. 예전엔 나쁜 출력 결과를 fine-tuning으로 제거하려다 성능까지 하향조정했다고 생각했는데, 이제는 quantizing 때문이 아닐까 더 의심하게 됨
    • OpenAI에서 일하는데, 모델은 동일하고 quantizing이나 꼼수 쓰지 않았음. API에서 개발자들에게 예고 없이 모델을 바꾸는 일은 절대 없음. ChatGPT에서는 사용자들에게 버전 넘버를 계속 노출하는 것이 번거로워서 좀 덜 명확하게 업데이트되긴 하지만, 그래도 완전히 조용히 바꾸는 건 아님. ChatGPT Release Notes에 모든 모델업데이트를 공개함. 단, chatgpt-4o-latest 포인터만 예외적으로 미리 알리지 않고 바꿈
    • 공식 발표 메일에서 "OpenAI o3 가격을 80% 인하해서 입력 100만 토큰에 2달러, 출력 100만 토큰에 8달러로 낮췄고, 인퍼런스 스택만 최적화해서 동일 모델이지만 더 싸짐"이라고 설명함
    • 발표 직후 o3에서 초당 700개 이상 토큰 속도가 나오길래, 정말 quantized 버전 아닌지 의심됨 관련 링크
  • ChatGPT Plus 사용자에게 o3 관련 주간 메시지 할당량도 같이 증가했는지 궁금함. 실제 내 경험상 o4-mini와 o4-mini-high는 유용성에서 o3에 한참 못 미치는데, o3는 속도 제한(limited rate) 때문에 주로 o4-mini 시리즈만 쓰게 됨. 이런 구조 자체가 "OpenAI의 사고(think) 모델이 경쟁 대비 뒤처진다"는 인상을 더 강화함
    • 나도 o3의 꽤 심한 속도 제한을 경험했고, o4-mini-high는 꽤 좋다고 느꼈지만, 확실히 o3를 훨씬 더 쓰고 싶음. 이 발표로 할당량도 늘어났으면 함
  • Google도 AI 쪽에서 빠르게 따라잡고 있음. 불과 몇 달 전만 해도 DeepSeek이 대세였는데, 이 분야가 정말 빠르게 진화하는 중임
    • 많은 사람들의 인식에서 Google Gemini 모델이 SOTA(State Of The Art, 최고 성능)라는 평이고, 코딩 태스크에서는 Claude도 꽤 잘한다고 봄
    • 최근 몇 달간 Google의 모델만 써왔는데, ChatGPT가 이제는 너무 사근사근하고 빈약하다고 느낌. 처음이나 끝뿐 아니라 답변 중간에도 빈 말만 많고, 실질적인 정보는 적음. 스타일을 바꿔달라고 요구하면 기술어만 남발하는 경향도 보임
    • Deepseek를 사람들이 기대했던 건 직접 모델을 다운로드 할 수 있었기 때문임. 하지만 Gemini 2.5 이래로 3등 자리에서 크게 벗어나지 못한 듯함
  • OpenAI가 왜 o3 사용을 위해 "조직" 인증(주정부 신분증 요구)을 하는지 이해가 안 감
    • 시도조차 할 필요 없다는 조언을 드리고 싶음. 많은 사람들이 검증 절차에 실패했고, 두 번째 기회도 없다는 피드백이 많음 사례1 사례2 사례3 사례4 사례5 사례6 사례7
    • Deepseek R2가 OpenAI 모델에 학습되지 않도록 하기 위한 목적도 있지 않을까 하는 생각임
  • LLM이 견고한 경쟁 우위(모트)가 없고 캐시를 태운다는 평가와 달리 OpenAI의 상황은 매우 고무적이라고 생각함. 연간화된 매출 100억 달러를 발표했고, 지난 3월 펀딩에서는 기업가치 3,000억 달러까지 올랐음. 50억 달러 적자를 봤지만, 매출 30배 성장과 5억 명 이상의 액티브 유저를 기록 중임. 이 성장세는 초기 Uber가 빠른 성장과 막대한 투자, 그리고 수익성으로 진전하는 모습을 떠올리게 함
    • 문제는 매출이 늘면 비용도 같이 오르는 구조라는 점임. 보통 규모를 키울수록 단가가 낮아지는데, OpenAI는 사용이 늘어날수록 컴퓨팅 비용이 그대로 늘어남. 부가수익원이 늘어나지 않는 한 규모의 경제가 미약함. 사례로 넷플릭스도 비슷한 상황임. 지속적 수익성 달성은 어렵다고 봄
    • 체감적으로 보면 OpenAI가 선점 효과를 가진 덕에 나도 월 결제를 유지하고, 굳이 여러 옵션을 전전하거나 바꿀 생각이 없음. 추후 시장이 안정되고 가격 경쟁이 세지면 기꺼이 갈아탈 의향도 있음. 결국 주요 매출원이 앱 사용자냐 API 플랜이냐에 따라 선점효과의 지속성이 달라짐. 신뢰도와 브랜드 네임 말고는 주변 이용자도 여러 대안을 적절히 고르는 분위기임
    • 결국 LLM 가격이 영원히 내려갈 것이고 무료 모델만 살아남을 것이라는 점에서 OpenAI의 경쟁력(모트)은 취약함. "생각하는 모델"만으로 복잡한 문제를 해결하지 못하며 과대평가된 측면도 있다고 봄
    • '모트 없음' 주장에는 동의하지 않음. 채팅 데이터 등 사용자 상호작용 데이터는 그 자체만으로도 매우 가치 있음
    • OpenAI의 성장만 긍정적으로 보면 고무적인 것은 맞으나, ChatGPT 등 AI 회사의 사회적 임팩트까지 따져보면 그리 밝진 않다고 생각함. 예를 들어 온라인 상점에 무의미한 AI 생성 콘텐츠가 대량 쏟아져 구매 경험도 하락함. ChatGPT에 과몰입된 일부 집단에서는 실제 친구 및 가족과의 소통에 엇나가거나 이혼까지 하는 등 이상 행태가 관찰됨. 교육 현장에서도 남용으로 인해 혼란이 심함. Uber의 성장처럼, OpenAI의 성공이 사회에 반드시 좋은 효과만 가져오는 것은 아니라고 생각함
  • o3 모델은 현재 최고 모델 중 하나이고, 가격도 Claude, Gemini와 같거나 더 저렴함. 경쟁사 숨 쉴 틈도 못 주는 느낌임
    • Gemini도 비슷한 수준(때로는 더 좋음)이어서 그 선택도 합리적이라고 생각함. o3-pro는 그 중에서도 한 수 위일지도 모름
  • 과거에는 구글 검색 성능이 형편없어지는데 수십 년이 걸렸다면, 이제는 AI 모델 성능이 망가지는 데 며칠이면 되는 놀라운 시대임
  • 아마도 o3-pro 출시도 관련 이유일 수 있다고 생각함

Read Entire Article