- 기술 업계에서는 몇 년마다 새로운 AI 기술이 등장할 때마다 “이번에는 자연어 인터페이스가 모든 것을 바꿀 것”이라는 환상이 반복됨
- Siri, Alexa, 챗봇, AirPods 플랫폼, 그리고 최근에는 대형 언어 모델(LLM)까지 이런 흐름을 타고 있음
- 그러나 실제로 우리의 컴퓨터 사용 방식은 거의 변하지 않음
- 사람들은 자연어를 "자연스러우니 당연히 최종 형태일 것"이라고 믿는 경향이 있음
- 이 글의 주장은, 자연어 인터페이스가 이상향이 아니며 실제로는 효율적인 방법이 아니라는 점임
자연어는 느리고 손실이 많은 데이터 전송 방식임
- 자연어는 아이디어와 지식을 인간끼리 주고받기 위한 데이터 전송 메커니즘임
- 데이터 전송에서 중요한 두 요소는 속도와 손실률(lossiness) 임
- 우리는 생각을 분당 1,000~3,000단어 수준으로 빠르게 하지만, 말하거나 글로 표현하는 속도는 훨씬 느림
- 예를 들어 읽기/듣기(수신)는 빠르지만 쓰기/말하기(발신)는 느림 → 자연어는 병목임
- 대신 사람들은 제스처(엄지척, 고개 끄덕임 등)를 사용해 더 빠르고 간결하게 의사 전달함
- 이런 방식은 데이터 압축과 같음 → 손실이 있지만 속도와 편의성 측면에서는 뛰어남
- 가장 효율적인 예는 오래된 부부가 말을 하지 않아도 서로의 요구를 알아차리는 순간처럼 보임
인간과 컴퓨터의 상호작용 진화
- 초기 컴퓨터는 명령어 기반 텍스트 인터페이스를 사용했지만, GUI의 도입으로 시각적 요소를 통해 작업을 더 쉽게 수행 가능해짐
- 현재는 GUI와 키보드 단축키를 조합한 생산성 균형 상태에 있음
- ⌘b, ⌘t, ⌘c/v 같은 단축키는 자연어가 아니라 데이터 압축 방식으로, 훨씬 빠르고 효율적임
- Linear, Raycast, Superhuman 등의 툴은 이러한 압축 입력을 극대화함 → 익숙해지면 거의 생각과 동시에 작업 수행 가능
- 터치 인터페이스는 보완적 기능으로 자리잡았지만, 본격적인 생산성 작업은 여전히 데스크탑에서 이뤄짐
- 모바일은 텍스트 입력이 느리고 불편함 (평균 36WPM) → 모바일에 맞는 단축키 대안이 없음
- 이로 인해 모바일 생산성 툴은 데스크탑만큼 발전하지 못함
대화형 인터페이스는 입력 속도에서 불리함
- 음성은 타이핑보다 빠른 입력 수단(150WPM vs 60WPM)이지만, 실제 사용에는 비효율적임
- 예: “Hey Google, 날씨 알려줘”는 앱 아이콘 누르기보다 10배 느림
- Siri, Alexa가 실패한 이유는 AI 출력 품질이 아니라 입력 방식의 번거로움 때문임
- LLM 역시 입력 방식의 비효율성을 해결하지 못함
- 버튼 하나로 할 수 있는 일을 문장으로 설명하는 건 오히려 퇴보임
대화형 UI는 보완 수단으로 활용되어야 함
- LLM은 기존 인터페이스를 대체하는 것이 아니라, 보완하는 형태로 매우 유용함
- 필자는 실제로 산책 중 ChatGPT와 음성 대화를 통해 이 글을 초안함 → LLM을 사고의 파트너로 사용함
- 이는 속도 중심이 아닌 사고 중심의 작업이며, 기존 워크플로우를 대체하지 않고 완전히 새로운 사용 사례임
- 가장 이상적인 예시는 StarCraft II에서 Alexa를 보조 입력 수단으로 활용한 해커톤 사례임
- 마우스/키보드를 대체하지 않고 음성을 추가 입력 방식으로 활용하여 데이터 전송 대역폭을 확장함
- Figma, Notion, Excel 같은 툴이 챗 UI로 대체되는 일은 없을 것임
- 대신 LLM은 툴 간을 연결하는 항상 실행되는 메타 레이어로 자리 잡아야 함
- 예: 사용자가 마우스나 키보드 작업 중에도 음성으로 간단히 명령 실행 가능해야 함
- 이를 위해 AI는 단일 앱이 아니라 운영체제 수준에서 작동해야 함
- 동시에, 음성 입력을 더 빠르게 만들 수 있는 방식(예: 휘파람, 감정 인식 등)도 필요함
- 대화형 인터페이스라도 결국은 속도와 편의성이 핵심임
결론: 대체가 아닌 보완의 관점에서 바라봐야 함
- 이 글의 제목은 클릭 유도용 과장임
- 진짜 주장은 "대화형 인터페이스 반대"가 아니라, 제로섬 사고에 대한 반대임
- AI는 기존 인터페이스를 대체하는 것이 아니라 새로운 가능성을 열어주는 보완 요소임
- 이상적인 미래는, 사람과 컴퓨터가 자연스럽고 무의식적인 상호작용을 하는 것임
- 마치 아침 식탁에서 말하지 않아도 버터가 자동으로 건네지는 것처럼