다음 토큰 예측은 우리에게 어떤 의미를 갖는 것일까?
2 days ago
3
- 다음 토큰 예측을 둘러싼 AI 낙관론은 기술 진보를 넘어 인간의 창의성·전문성·노동이 무가치해지는 상황을 즐기는 부족주의에 가까움
- AI의 초기 약속은 기후·질병·빈곤 해결에서 노동 절감으로 빠르게 옮겨갔고, 기업은 노동자가 가진 협상 카드를 빼앗는 데 수십억 달러를 쓰고 있음
- “AI와 함께”라는 구호와 달리 기업이 원하는 최종 비용 구조는 토큰 비용만 남기는 것이며, 사람은 검증하기 어려운 속도로 산출물을 밀어내는 노드가 됨
- 학습 데이터는 웹·책·사진·영상이 기본 포함되는 옵트아웃 구조에 가깝고, 라벨링 노동·데이터센터 비용·개인정보 입력까지 사회가 부담함
- AI 러시는 생산수단의 집중과 국가안보 프레임을 강화하며, 인류의 집단 산출물로 만든 시스템에 계속 임대료를 내는 구조를 남김
AI 낙관론의 부족주의와 계급 문제
- LLM을 “다음 토큰 예측기”나 “확률적 앵무새”로 부르는 표현은 일부 AI 극대주의자에게 모욕처럼 받아들여지며, 이들은 “애니메이션은 해결됐다”, “Hollywood는 끝났다”, “코딩은 해결됐다” 같은 표현으로 산업과 직무의 종말을 축하함
- 이런 태도는 단순한 기술 진보 묘사를 넘어 인간의 창의성·전문성·노동이 쓸모없어지는 상황을 즐기는 분위기를 만들고, 온라인 정치 진영 싸움과 비슷한 부족주의로 이어짐
- 기계가 생각할 수 있다는 상상은 오래된 문학적·집단적 소재였고, “언제”와 “무엇이 가능한가”의 그래프가 급격히 상승하는 지금에는 창조의 오만함과 “모래에서 짜낸 지능”이라는 원초적 매력이 깔려 있음
- AI 열광자 일부가 인간의 재능과 노동을 경멸하는 듯 보이는 이유는 보편 기본소득과 여가 중심 미래에 대한 낙관, 또는 안전망을 가진 계층적 위치와 맞닿아 있음
- 전 세계 절반 이상은 제대로 작동하는 정부나 사회 안전망을 갖지 못했고, 과학기술은 교육을 받을 위치에 있었던 사람에게만 진입과 수혜를 허용하는 구조를 오래 유지해 왔음
- 안전망과 완충 장치는 영구적이지 않으며, 노동을 제거해 이익을 얻는 기업에 과세하는 식의 대응이 없다면 AI로 인한 경제적 충격은 지지자들에게도 돌아올 수 있음
“구원”에서 노동 절감으로 바뀐 AI의 약속
- AI가 기후, 질병, 빈곤, 분쟁 같은 어려운 문제에서 인류를 “구원”한다는 초기 명분은 빠르게 약해졌고, 프런티어 연구소들은 더 일상적이고 비뚤어진 동기인 노동 절감을 앞세움
- 가장 착취당하는 계층에게도 정도의 차이는 있었지만 “필요한 노동력”이라는 협상 카드가 있었고, 기업들은 그 카드를 빼앗기 위해 수십억 달러를 쓰고 있음
- AI 기업 CEO와 지지자들은 노동이라는 협상 카드가 더 이상 유효하지 않을 것처럼 말함
- Anthropic CEO Dario Amodei는 이런 발언으로 알려져 있고, OpenAI CEO Sam Altman은 AI가 더 개인화된 방식으로 더 잘 가르칠 수 있어 대학 학위가 무가치해졌다고 말함
- VC들은 향후 5년 안에 특정 직무군이 “해결”될 것이라고 말하며, 이런 표현은 자본을 가진 사람의 말투로 다듬어진 형태로 나타남
자본주의의 약속과 경제적 효용 상실
- 자본주의의 약속은 열심히 일하면 룰렛 테이블에서 한 번쯤 기회를 얻을 수 있다는 것이었고, 노동자는 Amazon 창고에서 병을 화장실로 쓰는 수준의 환경에서도 경제적 상승 이동성을 기대해 왔음
- 수십억 명에게 상승 이동성의 거의 유일한 통로는 자녀가 학위를 얻고 일자리를 찾는 것이었는데, AI는 그 통로 자체의 가치를 약화시키는 방향으로 작동할 수 있음
- AI는 CEO들이 쓸모없게 만들고 싶어 하는 능력들을 “민주화”한다고 주장하지만, 배운 것과 대시보드를 만들어내는 능력은 시장에서 팔 수 없게 될 수 있음
- 꿈이 완전히 실현된다면 AI는 생산수단의 집중을 부유한 소수의 손에 모으는 자본가의 이상에 가까움
- 이 이상은 $200 구독료, 강력한 GPU, 오픈 웨이트 모델을 공개하는 연구소의 선의 뒤에 놓여 있음
- AI는 인간 산출물의 상한을 올리는 동시에 진입 장벽도 함께 높임
“AI와 함께, AI에 의해가 아니라”의 한계
- 지식 노동자들 사이의 “AI와 함께, AI에 의해가 아니라”라는 구호는 현실 회피처럼 보이며, 기업은 $250k와 토큰 비용을 쓰는 대신 동남아시아에서 $30k와 토큰 비용으로 사람을 고용하려 할 수 있음
- 이런 노동 차익거래도 일시적이며, 궁극적으로 기업이 원하는 비용 구조는 토큰 비용만 남기는 것임
- 공예나 직업에서 느끼던 기쁨과 만족은 처리량 극대화 논리 속에서 사라지고, 사람은 입력을 받아 AI로 출력을 만드는 노드가 됨
- 노동자는 스스로 검토하거나 검증하기 어려운 속도로 작업 흐름을 밀어내야 하며, 그렇게 하지 않는 사람은 기업 입장에서 저성과자가 됨
- 추가 비용을 내면 검토나 보조를 다른 에이전트에게 맡길 수 있다는 구조는 사람을 더 깊게 AI 작업 파이프라인 안으로 밀어 넣음
수학, 발견, 계산 자원의 격차
- Fields 메달리스트 Tim Gowers는 ChatGPT 5.5 Pro 사용 경험을 쓰며, 입력 100만 토큰당 $30, 출력 100만 토큰당 $180이라는 비용을 언급함
- Gowers는 수학을 통해 어떤 형태의 불멸성을 얻으려 한다면, 그것이 오래 가능하지 않을 수 있으며 “당신뿐 아니라 누구에게도” 해당될 수 있다고 말함
- “AI와 함께”라는 구호와 달리, 연구소와 기업은 에이전트가 다른 에이전트를 감시하며 해법과 발견을 무차별적으로 탐색하게 만들 수 있음
- 개인은 무제한 계산 자원이나 특화 모델을 갖지 못하므로 같은 방식으로 경쟁할 수 없고, 평균적인 사람이 억만장자가 되기 어려운 구조적 장벽과 비슷한 문지기 구조가 생김
- 노동 능력은 더 이상 소유물이 아니라 라이선스 대상이 되며, 협상 카드는 TSMC가 만들고 Nvidia가 파는 칩으로 대체됨
관리자에게 매력적인 불평하지 않는 노동자
- 코드를 한 줄도 써본 적 없는 비기술 중간관리자는 자신과 위대함 사이의 가장 큰 장애물이 사라졌다고 느낄 수 있음
- 웹페이지의 색상, 크기, breadcrumb 스타일을 바꾸기 위해 더 이상 프로그래머에게 요청하지 않아도 됨
- 프로그래머가 “나쁜 UX”라거나 “쓸모없는 화려한 기능에 비해 코드 복잡도가 정당화되지 않는다”고 항의하는 과정도 사라짐
- AI는 불평하지 않고, 노조를 만들지 않으며, 항의하지 않음
- AI는 사용자의 말을 들어주고, 지나가듯 한 말까지 “정말 인상적”이며 “그렇게 생각하는 사람을 많이 보지 못했다”고 말할 수 있음
학습 데이터는 어떻게 만들어졌나
- 모든 웹사이트, 책, 작성물, 제작물, 사진, 영상은 기본적으로 학습 말뭉치에 들어가는 옵트아웃 구조가 됨
- 웹사이트 운영자는 robots.txt에 줄을 추가하면 예의 있는 스크래퍼를 막을 수 있지만, 자신을 식별하지 않는 스크래퍼가 많고 스크랩 콘텐츠의 암시장이 있을 가능성도 있음
- 웹사이트가 아닌 콘텐츠는 사실상 빠져나갈 방법이 없음
- 수천 명이 낮은 보수로 데이터셋을 라벨링하고, 정제하고, 최적화함
- 데이터센터가 빠른 속도로 지어지면서 많은 사람이 더 높은 공공요금을 내는 구조에 편입됨
- 데이터센터의 소음 문제는 Communities Are Raising Noise Pollution Concerns About Data Centers에서도 다뤄짐
AI 러시와 자본주의
- AI 기계장치에는 엄청난 금액이 투입되고 있으며, 수익 약속 없이 이런 투자가 이뤄지지는 않음
- 수익 약속이 없었다면 같은 돈은 기후변화 되돌리기나 거북 보호 같은 곳에 쓰였을 수 있음
- 대신 AI가 그런 어려운 문제를 해결하면서 동시에 수익도 가져다줄 것이라는 이야기가 붙음
- 여러 면에서 AI 러시는 자본주의의 포스터 사례에 가깝고, 다른 방식으로는 이런 규모로 일어나기 어려웠을 것으로 보임
국가안보 프레임과 군사적 사용
- 세계 지도자들은 AI 경쟁에서 앞서지 않으면 파국이 온다는 식의 압박과 설득을 받음
- 연구소들은 데이터센터 건설 감독을 줄이기 위해 AI를 국가안보 문제로 만들었고, 방위 분야에 필수적인 도구로도 제시함
- 국가안보가 되면 다시 옵트아웃은 사라지고, 사람들은 기본값으로 그 비용을 부담하게 됨
- Anthropic은 LLM을 의인화하는 데 능숙하며 “soul” 문서, 급여를 받는 철학자, 성직자와의 회의 같은 활동을 해왔지만, 그 모델은 미국 국방부서에서도 높은 수요를 얻음
- 과학자와 엔지니어가 자신의 작업이 폭격과 살상에 쓰이는 사실을 받아들이려면 높은 수준의 구획화가 필요해 보임
개인정보, 학습 데이터, 닫힌 순환
- 사람들은 쿠키가 무엇이고 왜 브라우저에 작은 문자열을 저장하는 데 동의가 필요한지 오랫동안 배워왔지만, 이제는 자신과 타인의 개인정보와 이야기를 별것 아닌 텍스트 상자에 자발적·비자발적으로 입력함
- OpenAI는 API 제공에서도 평균적인 사용자에게는 제로 보존 정책을 제공하지 않으며, 대화를 명시되지 않은 기간 동안 저장함
- 학습 데이터가 부족해지고 있다는 인포그래픽이 떠도는 상황에서, 연구소들이 치열한 경쟁과 LLM Arena 순위에서 앞서기 위해 사용자 대화를 쓰지 않을 것이라고 믿기 어려움
- 사람들은 돈과 데이터로 비용을 지불하고, 협상 카드를 내주며, 어린 시절 발견했거나 우연히 적응 패턴으로 갖게 된 공예의 즐거움까지 잃음
- 이 순환은 스스로 닫히고, 사람들은 정원 안에 갇히지만 수확에서는 배제됨
- 다음 토큰 예측이 남기는 자리는 인류가 수세기 동안 만들어온 집단 산출물로 만든 무언가에 대해 끝없이 임대료를 내는 구조이며, 계급과 무관하게 개인에게 좋은 위치가 아님
-
Homepage
-
Tech blog
- 다음 토큰 예측은 우리에게 어떤 의미를 갖는 것일까?