2025 AI 엔지니어 독서 목록
- AI 엔지니어를 위한 50개의 논문, 모델, 블로그를 10개의 분야로 나누어 선정함. LLMs, 벤치마크, 프롬프팅, RAG, 에이전트, 코드 생성, 비전, 음성, 확산, 파인튜닝 분야를 포함함.
섹션 1: 최전선 LLMs
-
GPT 시리즈 논문: GPT1부터 GPT4까지의 논문을 포함하며, 시스템 카드와 런칭 이벤트가 주로 강조됨.
-
Claude 3 및 Gemini 1 논문: 경쟁 모델을 이해하기 위한 최신 버전.
-
LLaMA 시리즈 논문: 오픈 모델의 선두주자 이해.
-
DeepSeekV1, Coder, MoE 시리즈 논문: 상대적으로 오픈된 모델 연구소.
-
Apple Intelligence 논문: 모든 Mac과 iPhone에 적용됨.
섹션 2: 벤치마크 및 평가
-
MMLU 논문: 주요 지식 벤치마크.
-
MuSR 논문: 긴 문맥 평가.
-
MATH 논문: 수학 대회 문제 모음.
-
IFEval 논문: 지시 따르기 평가.
-
ARC AGI 챌린지: 추상적 추론 "IQ 테스트" 벤치마크.
섹션 3: 프롬프팅, ICL 및 사고의 연쇄
-
프롬프트 리포트 논문: 프롬프팅 논문 조사.
-
사고의 연쇄 논문: 사고의 연쇄를 대중화한 논문 중 하나.
-
사고의 나무 논문: 앞을 내다보고 되돌아보는 방법 소개.
-
프롬프트 튜닝 논문: 프리픽스 튜닝 등 다양한 방법 소개.
-
자동 프롬프트 엔지니어링 논문: LLMs로 프롬프팅을 향상시킬 수 있음을 강조.
섹션 4: 검색 증강 생성
-
정보 검색 입문: RAG가 IR 문제임을 강조.
-
2020Meta RAG 논문: RAG 용어를 처음 사용.
-
MTEB 논문: 과적합 문제를 다룸.
-
GraphRAG 논문: 지식 그래프를 RAG에 추가.
-
RAGAS 논문: OpenAI가 추천하는 간단한 RAG 평가.
섹션 5: 에이전트
-
SWE-Bench 논문: 에이전트 벤치마크.
-
ReAct 논문: 도구 사용 및 함수 호출 LLMs 연구 시작.
-
MemGPT 논문: 장기 에이전트 메모리 모방 접근법.
-
Voyager 논문: 성능 향상을 위한 3가지 인지 아키텍처 구성 요소.
-
Anthropic의 효과적인 에이전트 구축: 2024년 상태 요약.
섹션 6: 코드 생성
-
The Stack 논문: 코드에 초점을 맞춘 오픈 데이터셋.
-
오픈 코드 모델 논문: 다양한 코드 모델 선택 가능.
-
HumanEval/Codex 논문: 코드 도메인 필수 지식.
-
AlphaCodeium 논문: 성능 향상을 위한 흐름 엔지니어링.
-
CriticGPT 논문: 코드 생성 시 보안 문제를 식별.
섹션 7: 비전
-
비LLM 비전 작업: YOLO 논문 등.
-
CLIP 논문: 성공적인 ViT.
-
MMVP 벤치마크: CLIP의 중요한 문제를 정량화.
-
Segment Anything Model 및 SAM 2 논문: 이미지 및 비디오 세분화 모델.
-
초기 융합 연구: 다양한 비전 LM 작업.
섹션 8: 음성
-
Whisper 논문: 성공적인 ASR 모델.
-
AudioPaLM 논문: Google의 음성 연구.
-
NaturalSpeech 논문: 주요 TTS 접근법.
-
Kyutai Moshi 논문: 고성능 음성-텍스트 모델.
-
OpenAI 실시간 API: 실시간 API 문서화.
섹션 9: 이미지/비디오 확산
-
잠재 확산 논문: 안정적 확산 논문.
-
DALL-E 시리즈 논문: OpenAI의 이미지 생성.
-
Imagen 시리즈 논문: Google의 이미지 생성.
-
일관성 모델 논문: LCMs의 증류 작업.
-
Sora 블로그 게시물: 텍스트에서 비디오로.
섹션 10: 파인튜닝
-
LoRA/QLoRA 논문: 저렴한 모델 파인튜닝 방법.
-
DPO 논문: PPO의 대안.
-
ReFT 논문: 기능에 초점을 맞춘 파인튜닝.
-
Orca 3/AgentInstruct 논문: 파인튜닝 데이터 획득 방법.
-
RL/추론 튜닝 논문: RL 파인튜닝 논의.
시작 방법
- 이 목록은 방대해 보일 수 있으며, 몇 번이고 중도에 포기할 수 있음. 하지만 다시 시작하면 됨. 2025년까지 계속 업데이트 예정.