Qwen3.6-Max-Preview: 에이전틱 코딩과 세계 지식이 강화된 차세대 모델

3 weeks ago 35

Qwen3.6-Plus의 후속으로, 전작 대비 에이전트형 코딩과 더 강한 세계 지식 및 지시 이행 성능 향상
6개 주요 코딩 벤치마크에서 최고 점수를 기록하며 코딩 에이전트 성능의 대폭 향상 확인
preserve_thinking 기능을 지원해 에이전틱 작업 시 이전 턴의 사고 과정을 메시지에 보존하는 방식을 사용
세계 지식 벤치마크에서는 SuperGPQA +2.3, QwenChineseBench +5.3 등으로 개선됐고, 지시 이행에서는 ToolcallFormatIFBench +2.8 기록
Qwen Studio에서 대화형 테스트가 가능하며, Alibaba Cloud Model Studio API를 통해 qwen3.6-max-preview로 호출 예정

주요 개선 사항

Qwen3.6-Plus 대비 에이전틱 코딩 역량이 크게 향상: SkillsBench +9.9, SciCode +6.3, NL2Repo +5.0, Terminal-Bench 2.0 +3.8
세계 지식(world knowledge) 강화: SuperGPQA +2.3, QwenChineseBench +5.3
명령어 수행(instruction following) 개선: ToolcallFormatIFBench +2.8
6개 주요 코딩 벤치마크에서 최고 점수 달성: SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench, SciCode

모델 특징 및 접근 방식

Alibaba Cloud Model Studio를 통해 제공되는 호스팅 독점 모델
실제 에이전트(real-world agent) 및 지식 신뢰성(knowledge reliability) 성능 향상
Qwen Studio에서 대화형으로 즉시 테스트 가능
API 모델명은 qwen3.6-max-preview이며, Alibaba Cloud Model Studio API에서 곧 사용 가능

API 사용 및 기능

OpenAI 호환 chat completions 및 responses API, Anthropic 호환 인터페이스 등 업계 표준 프로토콜 지원
preserve_thinking 기능을 통해 이전 턴의 추론 과정(reasoning content) 을 보존 가능하며, 에이전틱 작업에 권장
enable_thinking: True 설정 시 추론 내용과 응답을 스트리밍 방식으로 분리 수신 가능
API 지역별 Base URL 제공: 베이징, 싱가포르, 미국(버지니아)

개발 상태

현재 프리뷰 릴리스 단계로 반복 개선 지속 중이며, 이후 버전에서 추가 개선 예정

Read Entire Article