Meta는 엔지니어링 조직을 망가뜨리고 있는가?
2 hours ago
1
- Meta는 오랫동안 빠른 실행과 엔지니어 자율성을 강점으로 삼았지만, 2026년 4월 전후 AI 중심 재편으로 내부 신뢰가 급격히 흔들림
- AI 경쟁을 따라잡기 위해 Scale AI 지분 49%를 약 148억 달러($14.8b) 에 인수하고 Alexandr Wang에게 AI 전략을 맡기면서, 데이터 수집과 라벨링 중심의 운영 방식이 엔지니어 조직에 들어옴
- 핵심 팀 엔지니어의 30~50% 가 ADO로 이동하고 약 4,000~5,000명의 소프트웨어 엔지니어가 데이터 라벨링·RLHF 업무에 투입된 것으로 추정됨
- 키 입력·마우스 클릭 추적, AI 토큰 사용량 평가, 10% 감원 예고가 겹치며 제품 품질보다 측정 가능한 AI 활용을 최적화하는 압박이 커짐
- Instagram 계정 탈취와 Facebook·Instagram 장애까지 이어지면서, Meta의 엔지니어링 조직이 profit center에서 비용 센터처럼 취급되고 있다는 비판이 핵심 takeaway임
빠른 실행과 자율성을 중시했던 Meta 문화
- Meta의 엔지니어링 문화는 크게 두 단계로 바뀌어 왔음
- 2010년대의 “move fast and break things”
- 2020년대 초반의 “move fast with stable infra”
- 2012년 Facebook이 10억 사용자에 도달했을 때, 회사는 약 70쪽 분량의 내부 문화 책자를 직원 책상에 배포함
- 속도, 두려움 없음, 오너십, 틀 밖의 사고가 핵심 메시지였음
- 캠퍼스 곳곳에는 “Move Fast and Break Things”, “Done is Better Than Perfect”, “Fail Harder” 같은 문구가 걸려 있었음
- 2022년의 Meta는 여전히 엔지니어 중심 조직에 가까웠음
- 개인의 impact가 핵심 평가 축이었음
- Big Tech 중에서도 프로세스와 표준화가 비교적 적은 편이었음
- 테스트, 문서화, 코드 주석도 다른 Big Tech보다 적다고 평가됨
- 신규 엔지니어는 6주짜리 Bootcamp를 거쳐 Meta 문화에 익숙해지고 팀을 선택하는 온보딩을 경험함
- Facebook과 Instagram은 빠른 실행을 뒷받침할 만큼 성숙한 인프라를 갖추고 있었음
- Facebook은 업계에서 정교한 자동 롤아웃 시스템을 가진 제품으로 소개됨
- Instagram은 Threads 출시 첫 주에 1억 사용자를 처리할 만큼 검증된 인프라를 갖춘 사례로 언급됨
- 당시 내부 엔지니어들은 자신들의 일이 회사 이익을 만드는 profit center에 속한다고 느꼈음
AI 플랫폼 기회를 놓치지 않으려는 투자
- Meta는 Apple, Microsoft, Amazon, Google과 달리 자체 하드웨어 플랫폼이나 운영체제가 약한 Big Tech로 정리됨
- Apple은 iPhone, iPad, Mac을 보유함
- Google은 Android, ChromeOS, Pixel을 보유함
- Microsoft는 Windows를 보유함
- Amazon은 Kindle을 보유함
- Mark Zuckerberg는 2010년대 자체 모바일 OS나 모바일 폰을 만들지 못한 뒤, 다음 플랫폼 기회를 놓치지 않으려는 방향으로 움직인 것으로 풀이됨
- VR과 AR 투자는 그 흐름의 일부였음
- Oculus와 Meta Glasses에 큰 투자가 이뤄짐
- 2021년 Facebook은 사명을 Meta로 변경함
- 팬데믹 이후 VR에 대한 대중 관심은 크게 줄었다고 평가됨
- 2022년 AI가 대형 트렌드로 부상하자 Meta는 FAIR와 GenAI 제품 조직을 중심으로 Llama 계열 모델을 출시함
- Llama 1: 2023년 2월 출시, ChatGPT 출시 3개월 뒤, FAIR가 개발
- Llama 2: 2023년 6월 출시, GenAI 제품 조직이 개발
- Llama 3: 2024년 4월 출시, Meta의 가장 경쟁력 있는 LLM으로 소개됨
- Llama 4: 2025년 4월 출시, “깊이 실망스러운” 모델로 평가됨
- 2025년 6월 Meta는 Scale AI 지분 49%를 148억 달러에 인수해 AI 노력을 재시동함
- Scale AI CEO Alexandr Wang이 Meta의 AI 전략을 맡음
- Manus AI를 20억 달러에 인수하려던 건은 중국이 막아 완료 여부가 불확실한 상태임
Scale AI식 데이터 수집과 RLHF 강화
- Scale AI가 Meta에 가져온 핵심 역량은 훈련 데이터와 사람 피드백 기반 모델 개선으로 정리됨
- Training data and labeling: 코드, 텍스트, 이미지, 비디오 등 고품질 라벨링 데이터셋 제공
- RLHF and fine-tuning: foundation model에 사람이 피드백을 주는 human-in-the-loop 데이터 엔진
- Alexandr Wang은 훈련 데이터 생성, 데이터 라벨링, RLHF를 실행할 폭넓은 권한을 가진 것으로 묘사됨
- 4월 말 Meta는 엔지니어들에게 키 입력과 마우스 클릭을 추적하는 시스템 등록을 알림
- 목적은 Meta의 새 AI를 위한 훈련 데이터 생성이었음
- 옵트아웃 방법은 없었다고 되어 있음
- 개인 은행 계정, 개인 이메일, 개인 통화 응답 같은 상황에서 추적 범위가 어디까지인지 개인정보 우려가 제기됨
- Reuters 보도에 따르면 Meta는 직원 반발 뒤 일부 수집 계획을 축소함
- 직원이 데이터 수집을 최대 30분까지 일시 중지할 수 있는 제어 기능이 추가됨
- 예외 신청도 가능해짐
- 현재 Meta 엔지니어들과의 대화 기준으로, 해당 로깅 시스템은 데이터 보호 규제로 인해 영국에는 롤아웃되지 않음
ADO로 밀려난 제품 엔지니어들
- 4월 말부터 제품 엔지니어링 팀에는 30~50%의 엔지니어를 ADO(Agent Data Optimisation) 조직으로 보내라는 지시가 내려옴
- 이 재배치가 “강제적”으로 받아들여진 이유는 Meta의 기존 문화와 정면으로 충돌했기 때문임
- 과거 엔지니어는 특정 팀이 아니라 회사에 채용되는 방식이었음
- 신규 입사자는 6주 Bootcamp 후 팀을 선택했음
- 팀 매칭은 여러 팀과 이야기하고 작은 일을 해보며 적합한 곳을 찾는 방식이었음
- 내부 이동은 쉽고, 엔지니어 주도로 이뤄지는 경우가 많았음
- Bootcamp를 통한 팀 선택은 2024년 무렵 약해지기 시작했지만, 2년 이상 재직한 Meta 엔지니어들은 자신이 무엇을 할지 선택해온 경험을 갖고 있음
- 인프라와 보안 팀은 특히 큰 타격을 받음
- 여러 인프라 조직에서 30~50%가 ADO로 이동함
- 일부 경우 가장 뛰어난 엔지니어들이 빠져나감
- ADO 조직은 약 6,500명 규모로 설명됨
- 이 중 약 4,000~5,000명이 소프트웨어 엔지니어로 추정됨
- Meta 전체 엔지니어가 약 25,000명이라는 점에서, 엔지니어 5~6명 중 1명꼴로 데이터 라벨링을 전담할 수 있는 상황임
- ADO로 이동한 엔지니어들은 직무 자체와 상명하달식 의사결정에 불만을 느끼는 것으로 전해짐
- 다만 감원 대상이 아니었고 급여가 유지된 점은 “silver lining”으로 제시됨
감원 예고와 토큰 사용량 압박
- 4월 20일 Reuters는 Meta가 한 달 뒤 직원 10%를 감원할 계획이라고 보도했고, Meta도 이를 확인함
- 직원들은 4주 동안 곧 실직할 수 있다는 사실을 안 채 기다리는 상황에 놓임
- Meta의 성과 평가인 PSC(Performance Summary Cycle)는 Google이나 Apple과 비교해 매우 엄격하다고 설명됨
- 매니저들은 자기 팀원의 보상 패키지를 높이기 위해 다른 팀 엔지니어의 패키지를 낮추려는 식으로 경쟁함
- 비즈니스 impact, 코드 리뷰 수, 작성한 코드 줄 수 같은 지표가 성과 평가 과정에서 무기화될 수 있음
- 각 평가 버킷별 인원 비율이 내려가며, 더 높은 버킷을 확보하려는 내부 정치가 격해짐
- 감원이 확인된 뒤 엔지니어들은 매니저가 성과 평가에서 토큰 수를 살펴볼 것이라고 알게 됨
- 토큰 수가 낮으면 저성과자로 표시돼 해고될 수 있다는 우려가 생김
- Meta 내부에는 토큰 사용량 리더보드가 있었고, tokenmaxxing을 부추기는 환경으로 묘사됨
- The Information 기준 Meta 직원들은 30일 동안 총 60.2조 AI 토큰을 사용함
- Anthropic API 가격으로 계산하면 9억 달러에 해당함
- Meta가 할인된 가격으로 토큰을 구매하더라도 1억 달러 이상일 수 있다고 추산됨
- 여러 압박이 결합하면서 실제 업무보다 performative work를 유도했다는 해석이 나옴
- 엔지니어 키보드와 마우스 클릭 추적
- 상당수 엔지니어의 풀타임 데이터 라벨링 전환
- 10% 감원 예고
- 모든 성과 지표를 최적화하는 문화
- PSC에서 토큰 사용량 측정
Instagram 계정 탈취와 보안 조직 혼란
- 5월 30일 Instagram에서 여러 계정이 탈취되는 사건이 발생함
- Obama White House 계정 같은 고프로필 계정도 포함됨
- Siddharth Sundharam의 정리에 따르면 공격 흐름은 매우 단순했음
- 공격자는 계정 사용자명만 있으면 시작할 수 있음
- 피해자 도시 근처의 VPN이나 프록시를 사용해 Instagram 보안 시스템의 의심을 피함
- Meta 지원 AI에 계정이 해킹됐다고 말하고, 공격자가 통제하는 임의 이메일 주소로 인증 코드를 보내도록 요청함
- AI가 보낸 코드를 다시 제출하면 비밀번호 재설정 링크가 제공됨
- 이 사건은 “proper zero auth password reset”으로 표현됨
- 새로 입력된 이메일이 사용자가 과거에 쓴 이메일인지 확인하는 추가 검사가 없었던 것으로 설명됨
- 내부 Meta 인원들과의 대화에 따르면 이 장애의 중심에는 AI가 있었음
- Instagram Trust and Safety 팀은 데이터 라벨링과 감원으로 약 50% 인력을 잃음
- 가장 시니어한 인력 일부도 AI 훈련 업무로 이동함
- 최근 두 달 동안 코드베이스 전반에서 사람이 거의 관여하지 않은 AI 생성 변경과 AI 코드 리뷰가 흔했다고 설명됨
- 평소라면 Trust and Safety 팀이 보안 침해 모니터링과 알림을 담당했겠지만, 빠른 내부 재편으로 혼란 상태였다고 함
- 6월 1일 월요일 장애가 해결되고 SEV 프로세스의 일부로 조사가 시작됨
- 다음 날 Meta CISO Guy Rosen은 퇴사를 발표함
- 이 퇴사가 우연이 아닐 수 있다는 추측은 있지만 확정되지는 않음
- 이전 최악의 장애로는 2021년 DNS/BGP 구성 문제로 모든 Meta 서비스가 7시간 중단된 사건이 제시됨
- 2021년 장애 후 Meta는 사후 분석과 사과문을 공개함
- 이번 Instagram 계정 탈취 사고에 대해서는 아직 공개 사후 분석이 없다고 설명됨
내부 불만과 리더십의 인정
- Wired는 Meta 내부 분위기를 보여주는 사례를 전함
- 직원 전용 라이브스트림 발표 중 한 사람이 욕설 섞인 발언으로 회사와 특정 Meta AI 임원을 비난함
- 이 사건은 3월 Meta Superintelligence Labs의 AI 연구를 지원하기 위해 만든 Applied AI 팀 내부 불만을 보여주는 사례로 제시됨
- Wired가 인용한 현직 직원 3명은 약 6,500명 규모 조직이 구성된 방식과 AI 모델 개선을 위한 반복 작업에 광범위한 불만이 있다고 말함
- 한 직원은 “literally the gulag”라고 표현하며 목적 상실과 고립감을 호소함
- Meta CPO Chris Cox는 Instagram 직원 전체 회의에서 최근 몇 달간의 환경을 “difficult”, “brutal”로 표현함
- 직원들이 우박 속에서 마라톤을 뛰는 상황에 비유함
- 팀원이 교체되고 기록까지 당하는 상황을 언급하며 “what the fuck”이라고 말함
- Wired에 따르면 Meta CTO Andrew Bosworth는 AI 재편이 형편없었다고 인정하고, 앞으로 더 나은 커뮤니케이션을 약속함
- 직원들이 AI 코칭 도구에 접근할 수 있게 된다는 말도 덧붙임
책임 소재와 조직 피해
- 내부 엔지니어들은 Mark Zuckerberg와 Alexandr Wang을 현 상황의 핵심 인물로 지목함
- Zuckerberg는 엔지니어 재배치, 추적 소프트웨어 롤아웃, 기록적 매출과 이익 속 10% 감원을 결정한 책임자로 제시됨
- Wang은 Scale AI식 데이터 생성, 라벨링, RLHF 접근을 가져온 인물로 언급됨
- 감원을 제외한 많은 조치는 Scale AI의 방식과 닮았다는 평가가 나옴
- 키 입력과 마우스 추적을 통한 훈련 데이터 생성
- 4,500명 이상의 엔지니어를 동원한 데이터 라벨링
- Meta가 구축 중인 코딩 LLM을 위한 고품질 RLHF 생성
- 핵심 제품인 Instagram, Facebook, Messenger의 안정적 운영보다 코딩 AI 훈련이 더 중요하게 취급된다는 해석이 제기됨
- 6월 12일에는 Facebook과 Instagram에서 또 다른 SEV0 수준 전체 장애가 발생함
- Meta는 연말까지 Google을 제치고 세계 1위 광고 사업자가 될 궤도에 있었다고 설명됨
- 그럼에도 리더십이 코딩 LLM 구축을 더 중요하게 본다는 비판이 이어짐
- 현재 상태가 계속되면 장기 재직 엔지니어들이 더 많이 떠날 것이라는 전망이 나옴
- 데이터 라벨링 배정과 직원 추적 같은 변경이 철회되면 정상으로 돌아갈 짧은 시간이 있을 수 있다고 덧붙임
“AI psychosis”가 Meta만의 문제인지에 대한 우려
- Mitchell Hashimoto는 일부 회사들이 강한 “AI psychosis” 상태에 있으며, 이에 대해 합리적으로 대화하기 어렵다고 말함
- 그는 클라우드와 자동화 전환기 인프라에서 겪은 MTBF와 MTTR 논쟁이 소프트웨어 개발 업계 전체에서 다시 나타나고 있다고 설명함
- “버그를 내도 에이전트가 빠르고 대규모로 고칠 수 있다”는 사고가 문제로 제시됨
- MTTR은 중요하지만, 회복력 있는 시스템 전체를 포기할 수는 없다고 말함
- Hashimoto의 우려는 지역 지표가 좋아 보여도 전체 시스템이 이해 불가능해질 수 있다는 점임
- 버그 리포트가 줄어도 잠재 위험은 커질 수 있음
- 테스트 커버리지가 높아져도 의미적 이해는 낮아질 수 있음
- 변경 속도가 너무 빨라 아키텍처 부식을 알아차리지 못할 수 있음
- Instagram 계정 탈취 사고는 AI 생성·AI 리뷰 코드의 품질 기준을 낮춘 결과로 해석됨
- 장애 복구는 이뤄졌지만, 고프로필 계정이 탈취되고 시스템이 공개적으로 침해된 뒤였음
- 리더십이 AI를 이유로 급격한 조직 변경을 검토한다면 Meta 사례를 먼저 봐야 한다는 경고로 마무리됨
- Meta 엔지니어들은 AI를 일찍부터 적극적으로 써온 인재들이며, 제품과 AI 인프라 구축 경험을 갖춘 인력으로 묘사됨
- 이들이 회사와 리더십에 실망한 상태라면, 다른 스타트업과 Big Tech에는 채용 기회가 될 수 있다고 정리됨
-
Homepage
-
Tech blog
- Meta는 엔지니어링 조직을 망가뜨리고 있는가?