코덱스 연구 미리보기

10 hours ago 1

OpenAI는 소프트웨어 엔지니어링 전용 에이전트 Codex를 출시하여 반복 작업, 코드 작성, PR 제안 등을 자동화할 수 있게 함
Codex는 분리된 클라우드 샌드박스 환경에서 작업을 수행하며, 테스트와 로깅을 통해 결과를 투명하게 검증 가능함
AGENTS.md 파일을 통해 프로젝트별 관행과 테스트 방식을 Codex에 명시할 수 있으며, 사용자 코드베이스에 최적화 가능함
CLI 버전 Codex CLI도 함께 제공되어 로컬 개발 환경에서도 에이전트 활용 가능함
초기 배포는 ChatGPT Pro·Team·Enterprise에 제공되며, 추후 Plus 및 Edu 사용자에게도 확장 예정임

Introducing Codex

Codex란?

Codex는 클라우드에서 실행되는 소프트웨어 엔지니어링 에이전트로, 사용자의 코드베이스를 읽고 다양한 작업을 자동으로 처리할 수 있음
코드 기능 추가, 질문 응답, 버그 수정, PR 제안 등을 병렬로 수행 가능
각 작업은 분리된 샌드박스 환경에서 독립적으로 실행되며, 사용자 레포지토리가 사전 로드되어 있음

작동 방식

ChatGPT 사이드바에서 Codex 기능을 통해 “Code” 또는 “Ask” 명령으로 작업을 시작
파일을 읽고 수정하며 테스트, 린터, 타입체커 등 명령 실행 가능
작업은 보통 1~30분 내 완료되며, 실시간 진행 상황 확인 가능
Codex는 작업 후 커밋을 생성하고, 터미널 로그 및 테스트 출력을 인용해 변경사항을 투명하게 설명함
결과를 검토한 뒤 GitHub PR 생성 또는 직접 통합 가능

AGENTS.md 파일

프로젝트 내에 위치한 AGENTS.md는 Codex가 코드베이스를 탐색하고 테스트하는 방법을 안내함
README와 유사한 형식의 문서로, 코드 스타일, 실행 명령, PR 메시지 형식 등을 포함 가능
깊이 있는 디렉터리에 있는 파일이 우선시되며, 명시된 테스트를 모두 실행해야 함
Codex는 명시적 프롬프트가 AGENTS.md보다 우선이라는 규칙도 따름

내부 벤치마크 성능

OpenAI 내부 SWE 벤치마크에서 codex-1은 최대 192k 토큰, 중간 난이도 설정에서 우수한 정확도 달성
AGENTS.md 없이도 높은 성능을 보이며, 사람이 작성한 코드 스타일에 밀접하게 일치하는 결과 생성 가능

보안 및 신뢰성

Codex는 투명성 강화 및 보안 중심으로 설계되었으며, 출력 검증 가능
작업 중 인터넷 연결은 차단되며, 지정된 레포지토리 및 의존성만 접근 가능
악성 코드 개발 차단, 커널 수준의 정당한 작업은 허용하도록 구분 학습 수행

초기 활용 사례

OpenAI 내부에서는 반복적인 리팩토링, 테스트 작성, 문서화 등에 활용 중
외부 파트너 예시:
- Cisco: 실제 제품 전반에서 적용 테스트 및 피드백 제공
- Temporal: 대규모 코드베이스의 디버깅, 테스트 실행, 리팩토링에 사용
- Superhuman: QA 및 통합 실패 수정, PM의 경량 코드 변경 가능하게 지원
- Kodiak: 자율 주행 기술 코드 분석 및 도구 개발 지원

Codex CLI 업데이트

Codex CLI는 터미널 기반의 경량 코딩 에이전트로, 로컬에서 o3, o4-mini 모델과 함께 작업 가능
이번 업데이트로 o4-mini 기반의 codex-mini 모델 출시, CLI 최적화 및 저지연 응답 제공
ChatGPT 계정으로 로그인하면 API 키 자동 설정, Plus/Pro 사용자에게 무료 크레딧 제공

가격 및 제공 범위

Codex는 현재 Pro, Enterprise, Team 사용자에게 제공 중이며, Plus 및 Edu는 곧 확장 예정
초기에는 추가 비용 없이 사용 가능, 추후에는 사용량 기반 가격 정책 도입
codex-mini-latest는 1M 입력 토큰당 $1.50, 출력 토큰당 $6, 75% 프롬프트 캐시 할인 적용

향후 계획

Codex는 장기적으로 비동기적 협업 에이전트로 발전 예정
Codex CLI, ChatGPT Desktop, 이슈 트래커, CI 도구와의 더 깊은 통합 계획
중간 피드백, 구현 전략 논의, 능동적 진행 상황 보고 기능이 추가될 예정
개발자들이 AI를 통해 더 빠르고 집중된 코딩이 가능해질 미래를 기대하고 있음

부록: codex-1 시스템 메시지 요약

작업 전후 Git 상태를 확인하고, 반드시 커밋 완료 상태로 유지
AGENTS.md 파일 내 검증 절차는 단순 변경이라도 모두 실행 필요
PR 생성 시 파일/터미널 기반 인용 규칙 존재 (예: 【F:main.py†L12】)
이전 PR 또는 코멘트 내용은 인용 금지, 오직 파일과 터미널 결과만 사용

이 시스템 메시지는 Codex 사용자 정의를 위해 모델 기본 행동을 이해하는 데 활용됨.

Read Entire Article