Qwen3.6-Max-Preview: 에이전틱 코딩과 세계 지식이 강화된 차세대 모델
4 hours ago
7
- Qwen3.6-Plus의 후속으로, 전작 대비 에이전트형 코딩과 더 강한 세계 지식 및 지시 이행 성능 향상
- 6개 주요 코딩 벤치마크에서 최고 점수를 기록하며 코딩 에이전트 성능의 대폭 향상 확인
- preserve_thinking 기능을 지원해 에이전틱 작업 시 이전 턴의 사고 과정을 메시지에 보존하는 방식을 사용
- 세계 지식 벤치마크에서는 SuperGPQA +2.3, QwenChineseBench +5.3 등으로 개선됐고, 지시 이행에서는 ToolcallFormatIFBench +2.8 기록
- Qwen Studio에서 대화형 테스트가 가능하며, Alibaba Cloud Model Studio API를 통해 qwen3.6-max-preview로 호출 예정
주요 개선 사항
- Qwen3.6-Plus 대비 에이전틱 코딩 역량이 크게 향상: SkillsBench +9.9, SciCode +6.3, NL2Repo +5.0, Terminal-Bench 2.0 +3.8
- 세계 지식(world knowledge) 강화: SuperGPQA +2.3, QwenChineseBench +5.3
- 명령어 수행(instruction following) 개선: ToolcallFormatIFBench +2.8
- 6개 주요 코딩 벤치마크에서 최고 점수 달성: SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench, SciCode
모델 특징 및 접근 방식
- Alibaba Cloud Model Studio를 통해 제공되는 호스팅 독점 모델
- 실제 에이전트(real-world agent) 및 지식 신뢰성(knowledge reliability) 성능 향상
- Qwen Studio에서 대화형으로 즉시 테스트 가능
- API 모델명은 qwen3.6-max-preview이며, Alibaba Cloud Model Studio API에서 곧 사용 가능
API 사용 및 기능
- OpenAI 호환 chat completions 및 responses API, Anthropic 호환 인터페이스 등 업계 표준 프로토콜 지원
- preserve_thinking 기능을 통해 이전 턴의 추론 과정(reasoning content) 을 보존 가능하며, 에이전틱 작업에 권장
- enable_thinking: True 설정 시 추론 내용과 응답을 스트리밍 방식으로 분리 수신 가능
- API 지역별 Base URL 제공: 베이징, 싱가포르, 미국(버지니아)
개발 상태
- 현재 프리뷰 릴리스 단계로 반복 개선 지속 중이며, 이후 버전에서 추가 개선 예정
-
Homepage
-
Tech blog
- Qwen3.6-Max-Preview: 에이전틱 코딩과 세계 지식이 강화된 차세대 모델