코덱스 연구 미리보기

10 hours ago 1

  • OpenAI는 소프트웨어 엔지니어링 전용 에이전트 Codex를 출시하여 반복 작업, 코드 작성, PR 제안 등을 자동화할 수 있게 함
  • Codex는 분리된 클라우드 샌드박스 환경에서 작업을 수행하며, 테스트와 로깅을 통해 결과를 투명하게 검증 가능함
  • AGENTS.md 파일을 통해 프로젝트별 관행과 테스트 방식을 Codex에 명시할 수 있으며, 사용자 코드베이스에 최적화 가능함
  • CLI 버전 Codex CLI도 함께 제공되어 로컬 개발 환경에서도 에이전트 활용 가능함
  • 초기 배포는 ChatGPT Pro·Team·Enterprise에 제공되며, 추후 Plus 및 Edu 사용자에게도 확장 예정임

Introducing Codex

Codex란?

  • Codex는 클라우드에서 실행되는 소프트웨어 엔지니어링 에이전트로, 사용자의 코드베이스를 읽고 다양한 작업을 자동으로 처리할 수 있음
  • 코드 기능 추가, 질문 응답, 버그 수정, PR 제안 등을 병렬로 수행 가능
  • 각 작업은 분리된 샌드박스 환경에서 독립적으로 실행되며, 사용자 레포지토리가 사전 로드되어 있음

작동 방식

  • ChatGPT 사이드바에서 Codex 기능을 통해 “Code” 또는 “Ask” 명령으로 작업을 시작
  • 파일을 읽고 수정하며 테스트, 린터, 타입체커 등 명령 실행 가능
  • 작업은 보통 1~30분 내 완료되며, 실시간 진행 상황 확인 가능
  • Codex는 작업 후 커밋을 생성하고, 터미널 로그 및 테스트 출력을 인용해 변경사항을 투명하게 설명함
  • 결과를 검토한 뒤 GitHub PR 생성 또는 직접 통합 가능

AGENTS.md 파일

  • 프로젝트 내에 위치한 AGENTS.md는 Codex가 코드베이스를 탐색하고 테스트하는 방법을 안내함
  • README와 유사한 형식의 문서로, 코드 스타일, 실행 명령, PR 메시지 형식 등을 포함 가능
  • 깊이 있는 디렉터리에 있는 파일이 우선시되며, 명시된 테스트를 모두 실행해야 함
  • Codex는 명시적 프롬프트가 AGENTS.md보다 우선이라는 규칙도 따름

내부 벤치마크 성능

  • OpenAI 내부 SWE 벤치마크에서 codex-1은 최대 192k 토큰, 중간 난이도 설정에서 우수한 정확도 달성
  • AGENTS.md 없이도 높은 성능을 보이며, 사람이 작성한 코드 스타일에 밀접하게 일치하는 결과 생성 가능

보안 및 신뢰성

  • Codex는 투명성 강화 및 보안 중심으로 설계되었으며, 출력 검증 가능
  • 작업 중 인터넷 연결은 차단되며, 지정된 레포지토리 및 의존성만 접근 가능
  • 악성 코드 개발 차단, 커널 수준의 정당한 작업은 허용하도록 구분 학습 수행

초기 활용 사례

  • OpenAI 내부에서는 반복적인 리팩토링, 테스트 작성, 문서화 등에 활용 중

  • 외부 파트너 예시:

    • Cisco: 실제 제품 전반에서 적용 테스트 및 피드백 제공
    • Temporal: 대규모 코드베이스의 디버깅, 테스트 실행, 리팩토링에 사용
    • Superhuman: QA 및 통합 실패 수정, PM의 경량 코드 변경 가능하게 지원
    • Kodiak: 자율 주행 기술 코드 분석 및 도구 개발 지원

Codex CLI 업데이트

  • Codex CLI는 터미널 기반의 경량 코딩 에이전트로, 로컬에서 o3, o4-mini 모델과 함께 작업 가능
  • 이번 업데이트로 o4-mini 기반의 codex-mini 모델 출시, CLI 최적화 및 저지연 응답 제공
  • ChatGPT 계정으로 로그인하면 API 키 자동 설정, Plus/Pro 사용자에게 무료 크레딧 제공

가격 및 제공 범위

  • Codex는 현재 Pro, Enterprise, Team 사용자에게 제공 중이며, Plus 및 Edu는 곧 확장 예정
  • 초기에는 추가 비용 없이 사용 가능, 추후에는 사용량 기반 가격 정책 도입
  • codex-mini-latest는 1M 입력 토큰당 $1.50, 출력 토큰당 $6, 75% 프롬프트 캐시 할인 적용

향후 계획

  • Codex는 장기적으로 비동기적 협업 에이전트로 발전 예정
  • Codex CLI, ChatGPT Desktop, 이슈 트래커, CI 도구와의 더 깊은 통합 계획
  • 중간 피드백, 구현 전략 논의, 능동적 진행 상황 보고 기능이 추가될 예정
  • 개발자들이 AI를 통해 더 빠르고 집중된 코딩이 가능해질 미래를 기대하고 있음

부록: codex-1 시스템 메시지 요약

  • 작업 전후 Git 상태를 확인하고, 반드시 커밋 완료 상태로 유지
  • AGENTS.md 파일 내 검증 절차는 단순 변경이라도 모두 실행 필요
  • PR 생성 시 파일/터미널 기반 인용 규칙 존재 (예: 【F:main.py†L12】)
  • 이전 PR 또는 코멘트 내용은 인용 금지, 오직 파일과 터미널 결과만 사용

이 시스템 메시지는 Codex 사용자 정의를 위해 모델 기본 행동을 이해하는 데 활용됨.

Read Entire Article