Meta는 엔지니어링 조직을 망가뜨리고 있는가?

3 weeks ago 22

Meta는 오랫동안 빠른 실행과 엔지니어 자율성을 강점으로 삼았지만, 2026년 4월 전후 AI 중심 재편으로 내부 신뢰가 급격히 흔들림
AI 경쟁을 따라잡기 위해 Scale AI 지분 49%를 약 148억 달러($14.8b) 에 인수하고 Alexandr Wang에게 AI 전략을 맡기면서, 데이터 수집과 라벨링 중심의 운영 방식이 엔지니어 조직에 들어옴
핵심 팀 엔지니어의 30~50% 가 ADO로 이동하고 약 4,000~5,000명의 소프트웨어 엔지니어가 데이터 라벨링·RLHF 업무에 투입된 것으로 추정됨
키 입력·마우스 클릭 추적, AI 토큰 사용량 평가, 10% 감원 예고가 겹치며 제품 품질보다 측정 가능한 AI 활용을 최적화하는 압박이 커짐
Instagram 계정 탈취와 Facebook·Instagram 장애까지 이어지면서, Meta의 엔지니어링 조직이 profit center에서 비용 센터처럼 취급되고 있다는 비판이 핵심 takeaway임

빠른 실행과 자율성을 중시했던 Meta 문화

Meta의 엔지니어링 문화는 크게 두 단계로 바뀌어 왔음
- 2010년대의 “move fast and break things”
- 2020년대 초반의 “move fast with stable infra”
2012년 Facebook이 10억 사용자에 도달했을 때, 회사는 약 70쪽 분량의 내부 문화 책자를 직원 책상에 배포함
- 속도, 두려움 없음, 오너십, 틀 밖의 사고가 핵심 메시지였음
- 캠퍼스 곳곳에는 “Move Fast and Break Things”, “Done is Better Than Perfect”, “Fail Harder” 같은 문구가 걸려 있었음
2022년의 Meta는 여전히 엔지니어 중심 조직에 가까웠음
- 개인의 impact가 핵심 평가 축이었음
- Big Tech 중에서도 프로세스와 표준화가 비교적 적은 편이었음
- 테스트, 문서화, 코드 주석도 다른 Big Tech보다 적다고 평가됨
- 신규 엔지니어는 6주짜리 Bootcamp를 거쳐 Meta 문화에 익숙해지고 팀을 선택하는 온보딩을 경험함
Facebook과 Instagram은 빠른 실행을 뒷받침할 만큼 성숙한 인프라를 갖추고 있었음
- Facebook은 업계에서 정교한 자동 롤아웃 시스템을 가진 제품으로 소개됨
- Instagram은 Threads 출시 첫 주에 1억 사용자를 처리할 만큼 검증된 인프라를 갖춘 사례로 언급됨
당시 내부 엔지니어들은 자신들의 일이 회사 이익을 만드는 profit center에 속한다고 느꼈음

AI 플랫폼 기회를 놓치지 않으려는 투자

Meta는 Apple, Microsoft, Amazon, Google과 달리 자체 하드웨어 플랫폼이나 운영체제가 약한 Big Tech로 정리됨
- Apple은 iPhone, iPad, Mac을 보유함
- Google은 Android, ChromeOS, Pixel을 보유함
- Microsoft는 Windows를 보유함
- Amazon은 Kindle을 보유함
Mark Zuckerberg는 2010년대 자체 모바일 OS나 모바일 폰을 만들지 못한 뒤, 다음 플랫폼 기회를 놓치지 않으려는 방향으로 움직인 것으로 풀이됨
VR과 AR 투자는 그 흐름의 일부였음
- Oculus와 Meta Glasses에 큰 투자가 이뤄짐
- 2021년 Facebook은 사명을 Meta로 변경함
- 팬데믹 이후 VR에 대한 대중 관심은 크게 줄었다고 평가됨
2022년 AI가 대형 트렌드로 부상하자 Meta는 FAIR와 GenAI 제품 조직을 중심으로 Llama 계열 모델을 출시함
- Llama 1: 2023년 2월 출시, ChatGPT 출시 3개월 뒤, FAIR가 개발
- Llama 2: 2023년 6월 출시, GenAI 제품 조직이 개발
- Llama 3: 2024년 4월 출시, Meta의 가장 경쟁력 있는 LLM으로 소개됨
- Llama 4: 2025년 4월 출시, “깊이 실망스러운” 모델로 평가됨
2025년 6월 Meta는 Scale AI 지분 49%를 148억 달러에 인수해 AI 노력을 재시동함
- Scale AI CEO Alexandr Wang이 Meta의 AI 전략을 맡음
- Manus AI를 20억 달러에 인수하려던 건은 중국이 막아 완료 여부가 불확실한 상태임

Scale AI식 데이터 수집과 RLHF 강화

Scale AI가 Meta에 가져온 핵심 역량은 훈련 데이터와 사람 피드백 기반 모델 개선으로 정리됨
- Training data and labeling: 코드, 텍스트, 이미지, 비디오 등 고품질 라벨링 데이터셋 제공
- RLHF and fine-tuning: foundation model에 사람이 피드백을 주는 human-in-the-loop 데이터 엔진
Alexandr Wang은 훈련 데이터 생성, 데이터 라벨링, RLHF를 실행할 폭넓은 권한을 가진 것으로 묘사됨
4월 말 Meta는 엔지니어들에게 키 입력과 마우스 클릭을 추적하는 시스템 등록을 알림
- 목적은 Meta의 새 AI를 위한 훈련 데이터 생성이었음
- 옵트아웃 방법은 없었다고 되어 있음
- 개인 은행 계정, 개인 이메일, 개인 통화 응답 같은 상황에서 추적 범위가 어디까지인지 개인정보 우려가 제기됨
Reuters 보도에 따르면 Meta는 직원 반발 뒤 일부 수집 계획을 축소함
- 직원이 데이터 수집을 최대 30분까지 일시 중지할 수 있는 제어 기능이 추가됨
- 예외 신청도 가능해짐
현재 Meta 엔지니어들과의 대화 기준으로, 해당 로깅 시스템은 데이터 보호 규제로 인해 영국에는 롤아웃되지 않음

ADO로 밀려난 제품 엔지니어들

4월 말부터 제품 엔지니어링 팀에는 30~50%의 엔지니어를 ADO(Agent Data Optimisation) 조직으로 보내라는 지시가 내려옴
이 재배치가 “강제적”으로 받아들여진 이유는 Meta의 기존 문화와 정면으로 충돌했기 때문임
- 과거 엔지니어는 특정 팀이 아니라 회사에 채용되는 방식이었음
- 신규 입사자는 6주 Bootcamp 후 팀을 선택했음
- 팀 매칭은 여러 팀과 이야기하고 작은 일을 해보며 적합한 곳을 찾는 방식이었음
- 내부 이동은 쉽고, 엔지니어 주도로 이뤄지는 경우가 많았음
Bootcamp를 통한 팀 선택은 2024년 무렵 약해지기 시작했지만, 2년 이상 재직한 Meta 엔지니어들은 자신이 무엇을 할지 선택해온 경험을 갖고 있음
인프라와 보안 팀은 특히 큰 타격을 받음
- 여러 인프라 조직에서 30~50%가 ADO로 이동함
- 일부 경우 가장 뛰어난 엔지니어들이 빠져나감
ADO 조직은 약 6,500명 규모로 설명됨
- 이 중 약 4,000~5,000명이 소프트웨어 엔지니어로 추정됨
- Meta 전체 엔지니어가 약 25,000명이라는 점에서, 엔지니어 5~6명 중 1명꼴로 데이터 라벨링을 전담할 수 있는 상황임
ADO로 이동한 엔지니어들은 직무 자체와 상명하달식 의사결정에 불만을 느끼는 것으로 전해짐
- 다만 감원 대상이 아니었고 급여가 유지된 점은 “silver lining”으로 제시됨

감원 예고와 토큰 사용량 압박

4월 20일 Reuters는 Meta가 한 달 뒤 직원 10%를 감원할 계획이라고 보도했고, Meta도 이를 확인함
- 직원들은 4주 동안 곧 실직할 수 있다는 사실을 안 채 기다리는 상황에 놓임
Meta의 성과 평가인 PSC(Performance Summary Cycle)는 Google이나 Apple과 비교해 매우 엄격하다고 설명됨
- 매니저들은 자기 팀원의 보상 패키지를 높이기 위해 다른 팀 엔지니어의 패키지를 낮추려는 식으로 경쟁함
- 비즈니스 impact, 코드 리뷰 수, 작성한 코드 줄 수 같은 지표가 성과 평가 과정에서 무기화될 수 있음
- 각 평가 버킷별 인원 비율이 내려가며, 더 높은 버킷을 확보하려는 내부 정치가 격해짐
감원이 확인된 뒤 엔지니어들은 매니저가 성과 평가에서 토큰 수를 살펴볼 것이라고 알게 됨
- 토큰 수가 낮으면 저성과자로 표시돼 해고될 수 있다는 우려가 생김
- Meta 내부에는 토큰 사용량 리더보드가 있었고, tokenmaxxing을 부추기는 환경으로 묘사됨
The Information 기준 Meta 직원들은 30일 동안 총 60.2조 AI 토큰을 사용함
- Anthropic API 가격으로 계산하면 9억 달러에 해당함
- Meta가 할인된 가격으로 토큰을 구매하더라도 1억 달러 이상일 수 있다고 추산됨
여러 압박이 결합하면서 실제 업무보다 performative work를 유도했다는 해석이 나옴
- 엔지니어 키보드와 마우스 클릭 추적
- 상당수 엔지니어의 풀타임 데이터 라벨링 전환
- 10% 감원 예고
- 모든 성과 지표를 최적화하는 문화
- PSC에서 토큰 사용량 측정

Instagram 계정 탈취와 보안 조직 혼란

5월 30일 Instagram에서 여러 계정이 탈취되는 사건이 발생함
- Obama White House 계정 같은 고프로필 계정도 포함됨
Siddharth Sundharam의 정리에 따르면 공격 흐름은 매우 단순했음
- 공격자는 계정 사용자명만 있으면 시작할 수 있음
- 피해자 도시 근처의 VPN이나 프록시를 사용해 Instagram 보안 시스템의 의심을 피함
- Meta 지원 AI에 계정이 해킹됐다고 말하고, 공격자가 통제하는 임의 이메일 주소로 인증 코드를 보내도록 요청함
- AI가 보낸 코드를 다시 제출하면 비밀번호 재설정 링크가 제공됨
이 사건은 “proper zero auth password reset”으로 표현됨
- 새로 입력된 이메일이 사용자가 과거에 쓴 이메일인지 확인하는 추가 검사가 없었던 것으로 설명됨
내부 Meta 인원들과의 대화에 따르면 이 장애의 중심에는 AI가 있었음
- Instagram Trust and Safety 팀은 데이터 라벨링과 감원으로 약 50% 인력을 잃음
- 가장 시니어한 인력 일부도 AI 훈련 업무로 이동함
- 최근 두 달 동안 코드베이스 전반에서 사람이 거의 관여하지 않은 AI 생성 변경과 AI 코드 리뷰가 흔했다고 설명됨
- 평소라면 Trust and Safety 팀이 보안 침해 모니터링과 알림을 담당했겠지만, 빠른 내부 재편으로 혼란 상태였다고 함
6월 1일 월요일 장애가 해결되고 SEV 프로세스의 일부로 조사가 시작됨
- 다음 날 Meta CISO Guy Rosen은 퇴사를 발표함
- 이 퇴사가 우연이 아닐 수 있다는 추측은 있지만 확정되지는 않음
이전 최악의 장애로는 2021년 DNS/BGP 구성 문제로 모든 Meta 서비스가 7시간 중단된 사건이 제시됨
- 2021년 장애 후 Meta는 사후 분석과 사과문을 공개함
- 이번 Instagram 계정 탈취 사고에 대해서는 아직 공개 사후 분석이 없다고 설명됨

내부 불만과 리더십의 인정

Wired는 Meta 내부 분위기를 보여주는 사례를 전함
- 직원 전용 라이브스트림 발표 중 한 사람이 욕설 섞인 발언으로 회사와 특정 Meta AI 임원을 비난함
- 이 사건은 3월 Meta Superintelligence Labs의 AI 연구를 지원하기 위해 만든 Applied AI 팀 내부 불만을 보여주는 사례로 제시됨
Wired가 인용한 현직 직원 3명은 약 6,500명 규모 조직이 구성된 방식과 AI 모델 개선을 위한 반복 작업에 광범위한 불만이 있다고 말함
- 한 직원은 “literally the gulag”라고 표현하며 목적 상실과 고립감을 호소함
Meta CPO Chris Cox는 Instagram 직원 전체 회의에서 최근 몇 달간의 환경을 “difficult”, “brutal”로 표현함
- 직원들이 우박 속에서 마라톤을 뛰는 상황에 비유함
- 팀원이 교체되고 기록까지 당하는 상황을 언급하며 “what the fuck”이라고 말함
Wired에 따르면 Meta CTO Andrew Bosworth는 AI 재편이 형편없었다고 인정하고, 앞으로 더 나은 커뮤니케이션을 약속함
- 직원들이 AI 코칭 도구에 접근할 수 있게 된다는 말도 덧붙임

책임 소재와 조직 피해

내부 엔지니어들은 Mark Zuckerberg와 Alexandr Wang을 현 상황의 핵심 인물로 지목함
- Zuckerberg는 엔지니어 재배치, 추적 소프트웨어 롤아웃, 기록적 매출과 이익 속 10% 감원을 결정한 책임자로 제시됨
- Wang은 Scale AI식 데이터 생성, 라벨링, RLHF 접근을 가져온 인물로 언급됨
감원을 제외한 많은 조치는 Scale AI의 방식과 닮았다는 평가가 나옴
- 키 입력과 마우스 추적을 통한 훈련 데이터 생성
- 4,500명 이상의 엔지니어를 동원한 데이터 라벨링
- Meta가 구축 중인 코딩 LLM을 위한 고품질 RLHF 생성
핵심 제품인 Instagram, Facebook, Messenger의 안정적 운영보다 코딩 AI 훈련이 더 중요하게 취급된다는 해석이 제기됨
6월 12일에는 Facebook과 Instagram에서 또 다른 SEV0 수준 전체 장애가 발생함
Meta는 연말까지 Google을 제치고 세계 1위 광고 사업자가 될 궤도에 있었다고 설명됨
- 그럼에도 리더십이 코딩 LLM 구축을 더 중요하게 본다는 비판이 이어짐
현재 상태가 계속되면 장기 재직 엔지니어들이 더 많이 떠날 것이라는 전망이 나옴
- 데이터 라벨링 배정과 직원 추적 같은 변경이 철회되면 정상으로 돌아갈 짧은 시간이 있을 수 있다고 덧붙임

“AI psychosis”가 Meta만의 문제인지에 대한 우려

Mitchell Hashimoto는 일부 회사들이 강한 “AI psychosis” 상태에 있으며, 이에 대해 합리적으로 대화하기 어렵다고 말함
그는 클라우드와 자동화 전환기 인프라에서 겪은 MTBF와 MTTR 논쟁이 소프트웨어 개발 업계 전체에서 다시 나타나고 있다고 설명함
- “버그를 내도 에이전트가 빠르고 대규모로 고칠 수 있다”는 사고가 문제로 제시됨
- MTTR은 중요하지만, 회복력 있는 시스템 전체를 포기할 수는 없다고 말함
Hashimoto의 우려는 지역 지표가 좋아 보여도 전체 시스템이 이해 불가능해질 수 있다는 점임
- 버그 리포트가 줄어도 잠재 위험은 커질 수 있음
- 테스트 커버리지가 높아져도 의미적 이해는 낮아질 수 있음
- 변경 속도가 너무 빨라 아키텍처 부식을 알아차리지 못할 수 있음
Instagram 계정 탈취 사고는 AI 생성·AI 리뷰 코드의 품질 기준을 낮춘 결과로 해석됨
- 장애 복구는 이뤄졌지만, 고프로필 계정이 탈취되고 시스템이 공개적으로 침해된 뒤였음
리더십이 AI를 이유로 급격한 조직 변경을 검토한다면 Meta 사례를 먼저 봐야 한다는 경고로 마무리됨
- Meta 엔지니어들은 AI를 일찍부터 적극적으로 써온 인재들이며, 제품과 AI 인프라 구축 경험을 갖춘 인력으로 묘사됨
- 이들이 회사와 리더십에 실망한 상태라면, 다른 스타트업과 Big Tech에는 채용 기회가 될 수 있다고 정리됨