다음 토큰 예측은 우리에게 어떤 의미를 갖는 것일까?

2 days ago 3

다음 토큰 예측을 둘러싼 AI 낙관론은 기술 진보를 넘어 인간의 창의성·전문성·노동이 무가치해지는 상황을 즐기는 부족주의에 가까움
AI의 초기 약속은 기후·질병·빈곤 해결에서 노동 절감으로 빠르게 옮겨갔고, 기업은 노동자가 가진 협상 카드를 빼앗는 데 수십억 달러를 쓰고 있음
“AI와 함께”라는 구호와 달리 기업이 원하는 최종 비용 구조는 토큰 비용만 남기는 것이며, 사람은 검증하기 어려운 속도로 산출물을 밀어내는 노드가 됨
학습 데이터는 웹·책·사진·영상이 기본 포함되는 옵트아웃 구조에 가깝고, 라벨링 노동·데이터센터 비용·개인정보 입력까지 사회가 부담함
AI 러시는 생산수단의 집중과 국가안보 프레임을 강화하며, 인류의 집단 산출물로 만든 시스템에 계속 임대료를 내는 구조를 남김

AI 낙관론의 부족주의와 계급 문제

LLM을 “다음 토큰 예측기”나 “확률적 앵무새”로 부르는 표현은 일부 AI 극대주의자에게 모욕처럼 받아들여지며, 이들은 “애니메이션은 해결됐다”, “Hollywood는 끝났다”, “코딩은 해결됐다” 같은 표현으로 산업과 직무의 종말을 축하함
이런 태도는 단순한 기술 진보 묘사를 넘어 인간의 창의성·전문성·노동이 쓸모없어지는 상황을 즐기는 분위기를 만들고, 온라인 정치 진영 싸움과 비슷한 부족주의로 이어짐
기계가 생각할 수 있다는 상상은 오래된 문학적·집단적 소재였고, “언제”와 “무엇이 가능한가”의 그래프가 급격히 상승하는 지금에는 창조의 오만함과 “모래에서 짜낸 지능”이라는 원초적 매력이 깔려 있음
AI 열광자 일부가 인간의 재능과 노동을 경멸하는 듯 보이는 이유는 보편 기본소득과 여가 중심 미래에 대한 낙관, 또는 안전망을 가진 계층적 위치와 맞닿아 있음
전 세계 절반 이상은 제대로 작동하는 정부나 사회 안전망을 갖지 못했고, 과학기술은 교육을 받을 위치에 있었던 사람에게만 진입과 수혜를 허용하는 구조를 오래 유지해 왔음
안전망과 완충 장치는 영구적이지 않으며, 노동을 제거해 이익을 얻는 기업에 과세하는 식의 대응이 없다면 AI로 인한 경제적 충격은 지지자들에게도 돌아올 수 있음

“구원”에서 노동 절감으로 바뀐 AI의 약속

AI가 기후, 질병, 빈곤, 분쟁 같은 어려운 문제에서 인류를 “구원”한다는 초기 명분은 빠르게 약해졌고, 프런티어 연구소들은 더 일상적이고 비뚤어진 동기인 노동 절감을 앞세움
가장 착취당하는 계층에게도 정도의 차이는 있었지만 “필요한 노동력”이라는 협상 카드가 있었고, 기업들은 그 카드를 빼앗기 위해 수십억 달러를 쓰고 있음
AI 기업 CEO와 지지자들은 노동이라는 협상 카드가 더 이상 유효하지 않을 것처럼 말함
Anthropic CEO Dario Amodei는 이런 발언으로 알려져 있고, OpenAI CEO Sam Altman은 AI가 더 개인화된 방식으로 더 잘 가르칠 수 있어 대학 학위가 무가치해졌다고 말함
VC들은 향후 5년 안에 특정 직무군이 “해결”될 것이라고 말하며, 이런 표현은 자본을 가진 사람의 말투로 다듬어진 형태로 나타남

자본주의의 약속과 경제적 효용 상실

자본주의의 약속은 열심히 일하면 룰렛 테이블에서 한 번쯤 기회를 얻을 수 있다는 것이었고, 노동자는 Amazon 창고에서 병을 화장실로 쓰는 수준의 환경에서도 경제적 상승 이동성을 기대해 왔음
수십억 명에게 상승 이동성의 거의 유일한 통로는 자녀가 학위를 얻고 일자리를 찾는 것이었는데, AI는 그 통로 자체의 가치를 약화시키는 방향으로 작동할 수 있음
AI는 CEO들이 쓸모없게 만들고 싶어 하는 능력들을 “민주화”한다고 주장하지만, 배운 것과 대시보드를 만들어내는 능력은 시장에서 팔 수 없게 될 수 있음
꿈이 완전히 실현된다면 AI는 생산수단의 집중을 부유한 소수의 손에 모으는 자본가의 이상에 가까움
이 이상은 $200 구독료, 강력한 GPU, 오픈 웨이트 모델을 공개하는 연구소의 선의 뒤에 놓여 있음
AI는 인간 산출물의 상한을 올리는 동시에 진입 장벽도 함께 높임

“AI와 함께, AI에 의해가 아니라”의 한계

지식 노동자들 사이의 “AI와 함께, AI에 의해가 아니라”라는 구호는 현실 회피처럼 보이며, 기업은 $250k와 토큰 비용을 쓰는 대신 동남아시아에서 $30k와 토큰 비용으로 사람을 고용하려 할 수 있음
이런 노동 차익거래도 일시적이며, 궁극적으로 기업이 원하는 비용 구조는 토큰 비용만 남기는 것임
공예나 직업에서 느끼던 기쁨과 만족은 처리량 극대화 논리 속에서 사라지고, 사람은 입력을 받아 AI로 출력을 만드는 노드가 됨
노동자는 스스로 검토하거나 검증하기 어려운 속도로 작업 흐름을 밀어내야 하며, 그렇게 하지 않는 사람은 기업 입장에서 저성과자가 됨
추가 비용을 내면 검토나 보조를 다른 에이전트에게 맡길 수 있다는 구조는 사람을 더 깊게 AI 작업 파이프라인 안으로 밀어 넣음

수학, 발견, 계산 자원의 격차

Fields 메달리스트 Tim Gowers는 ChatGPT 5.5 Pro 사용 경험을 쓰며, 입력 100만 토큰당 $30, 출력 100만 토큰당 $180이라는 비용을 언급함
Gowers는 수학을 통해 어떤 형태의 불멸성을 얻으려 한다면, 그것이 오래 가능하지 않을 수 있으며 “당신뿐 아니라 누구에게도” 해당될 수 있다고 말함
“AI와 함께”라는 구호와 달리, 연구소와 기업은 에이전트가 다른 에이전트를 감시하며 해법과 발견을 무차별적으로 탐색하게 만들 수 있음
개인은 무제한 계산 자원이나 특화 모델을 갖지 못하므로 같은 방식으로 경쟁할 수 없고, 평균적인 사람이 억만장자가 되기 어려운 구조적 장벽과 비슷한 문지기 구조가 생김
노동 능력은 더 이상 소유물이 아니라 라이선스 대상이 되며, 협상 카드는 TSMC가 만들고 Nvidia가 파는 칩으로 대체됨

관리자에게 매력적인 불평하지 않는 노동자

코드를 한 줄도 써본 적 없는 비기술 중간관리자는 자신과 위대함 사이의 가장 큰 장애물이 사라졌다고 느낄 수 있음
웹페이지의 색상, 크기, breadcrumb 스타일을 바꾸기 위해 더 이상 프로그래머에게 요청하지 않아도 됨
프로그래머가 “나쁜 UX”라거나 “쓸모없는 화려한 기능에 비해 코드 복잡도가 정당화되지 않는다”고 항의하는 과정도 사라짐
AI는 불평하지 않고, 노조를 만들지 않으며, 항의하지 않음
AI는 사용자의 말을 들어주고, 지나가듯 한 말까지 “정말 인상적”이며 “그렇게 생각하는 사람을 많이 보지 못했다”고 말할 수 있음

학습 데이터는 어떻게 만들어졌나

모든 웹사이트, 책, 작성물, 제작물, 사진, 영상은 기본적으로 학습 말뭉치에 들어가는 옵트아웃 구조가 됨
웹사이트 운영자는 robots.txt에 줄을 추가하면 예의 있는 스크래퍼를 막을 수 있지만, 자신을 식별하지 않는 스크래퍼가 많고 스크랩 콘텐츠의 암시장이 있을 가능성도 있음
웹사이트가 아닌 콘텐츠는 사실상 빠져나갈 방법이 없음
수천 명이 낮은 보수로 데이터셋을 라벨링하고, 정제하고, 최적화함
데이터센터가 빠른 속도로 지어지면서 많은 사람이 더 높은 공공요금을 내는 구조에 편입됨
데이터센터의 소음 문제는 Communities Are Raising Noise Pollution Concerns About Data Centers에서도 다뤄짐

AI 러시와 자본주의

AI 기계장치에는 엄청난 금액이 투입되고 있으며, 수익 약속 없이 이런 투자가 이뤄지지는 않음
수익 약속이 없었다면 같은 돈은 기후변화 되돌리기나 거북 보호 같은 곳에 쓰였을 수 있음
대신 AI가 그런 어려운 문제를 해결하면서 동시에 수익도 가져다줄 것이라는 이야기가 붙음
여러 면에서 AI 러시는 자본주의의 포스터 사례에 가깝고, 다른 방식으로는 이런 규모로 일어나기 어려웠을 것으로 보임

국가안보 프레임과 군사적 사용

세계 지도자들은 AI 경쟁에서 앞서지 않으면 파국이 온다는 식의 압박과 설득을 받음
연구소들은 데이터센터 건설 감독을 줄이기 위해 AI를 국가안보 문제로 만들었고, 방위 분야에 필수적인 도구로도 제시함
국가안보가 되면 다시 옵트아웃은 사라지고, 사람들은 기본값으로 그 비용을 부담하게 됨
Anthropic은 LLM을 의인화하는 데 능숙하며 “soul” 문서, 급여를 받는 철학자, 성직자와의 회의 같은 활동을 해왔지만, 그 모델은 미국 국방부서에서도 높은 수요를 얻음
과학자와 엔지니어가 자신의 작업이 폭격과 살상에 쓰이는 사실을 받아들이려면 높은 수준의 구획화가 필요해 보임

개인정보, 학습 데이터, 닫힌 순환

사람들은 쿠키가 무엇이고 왜 브라우저에 작은 문자열을 저장하는 데 동의가 필요한지 오랫동안 배워왔지만, 이제는 자신과 타인의 개인정보와 이야기를 별것 아닌 텍스트 상자에 자발적·비자발적으로 입력함
OpenAI는 API 제공에서도 평균적인 사용자에게는 제로 보존 정책을 제공하지 않으며, 대화를 명시되지 않은 기간 동안 저장함
학습 데이터가 부족해지고 있다는 인포그래픽이 떠도는 상황에서, 연구소들이 치열한 경쟁과 LLM Arena 순위에서 앞서기 위해 사용자 대화를 쓰지 않을 것이라고 믿기 어려움
사람들은 돈과 데이터로 비용을 지불하고, 협상 카드를 내주며, 어린 시절 발견했거나 우연히 적응 패턴으로 갖게 된 공예의 즐거움까지 잃음
이 순환은 스스로 닫히고, 사람들은 정원 안에 갇히지만 수확에서는 배제됨
다음 토큰 예측이 남기는 자리는 인류가 수세기 동안 만들어온 집단 산출물로 만든 무언가에 대해 끝없이 임대료를 내는 구조이며, 계급과 무관하게 개인에게 좋은 위치가 아님

Read Entire Article