Ask HN: GenAI를 보며 “아, 큰일 났다”라고 느낀 순간은 언제였나요?
13 hours ago
4
- DALL-E와 ChatGPT를 처음엔 한물간 장난으로 치부했지만, 실사용 과정에서 능력의 한계를 깨닫고 충격받은 구체적 경험담을 공유하는 스레드
- 가장 인기 좋은 사례는 구형·폐기 하드웨어의 펌웨어 리버스 엔지니어링으로, 신디사이저·피아노·파이어스틱 등을 Claude/GHIDRA로 되살린 경험
- 코딩을 넘어 가전 수리, 부동산 검수, 법률 소송, HVAC 진단 같은 일상 문제 해결에 LLM을 활용한 비전문 영역 사례가 다수
- 일부는 코드 품질 저하, 환각, 검증 없는 맹신, 직업 소멸 우려 등 부정적인 "oh shit" 순간을 토로
- ChatGPT 출시(2022), GPT-2/GPT-3, 도구 호출(tool calling), 에이전트 등 시기별로 다른 전환점에서 각자의 충격 순간이 갈림
펌웨어·하드웨어 리버스 엔지니어링
- 90년대 Alesis QS8.1 신디사이저의 단종 소프트웨어를 대체하기 위해, sysex 명령과 미문서화 웨이브 인코딩 프로토콜을 GHIDRA로 분석해 하룻밤 만에 작동 데모 완성
- Kawai CA49 피아노가 잘못된 펌웨어때문에 벽돌이 된 후, Claude가 안드로이드 APK를 디컴파일해 하드코딩된 암호화 키를 찾고 펌웨어를 복호화, 블루투스 플래싱 스크립트로 1시간 만에 복구
- The Complete New Yorker DVD의 Blowfish 암호화를 GHIDRA로 분석해 자격증명을 매핑하고 파이썬 스크립트로 재구현, 모든 파일을 일반 PDF로 변환
- 1세대 Amazon Firestick을 공개 루트 익스플로잇 없이 커널 소스를 받아 "FBUF/VCHIQ 커널 제로-라이트 프리미티브"로 라이브 커널 메모리 패치, 영구 루팅·디블로트 성공
- 컴파일된 C++ 벤더 바이너리와 짧은 네트워크 캡처만으로 독점 프로토콜을 NSA Ghidra 디셈블러로 리버스 엔지니어링, "비기술 QA로 강등된 느낌"이라 표현
-
관련된 의견들
- 통합·이전이 어려워 형성되던 SaaS의 데이터 해자(data moat)가 사라지는 중
- 엔터프라이즈 플랜 뒤에 숨긴 SaaS의 MCP를 Claude Code로 내부 API에서 역설계, 공식보다 기능 많은 MCP를 단시간에 제작
- Claude가 변수명에 인간보다 덜 의존해 리네이밍/타입데프 작업이 덜 필요함
일상·비전문 영역 문제 해결
- 2025년 연휴에 고장난 furnace를 영상으로 Gemini에 진단받아 배기팬을 수동으로 돌려 가동, 다만 댓글에서 배기팬 안전장치 우회로 일산화탄소 위험 경고 제기
- 작성자는 베어링 문제로 시동만 도왔을 뿐 우회가 아니며, 일산화탄소 모니터가 작동하지 않았다고 해명
- AC 냉방 고장 시 ChatGPT가 사진 진단으로 $25 커패시터 교체를 안내, 진단 서비스 콜 비용의 1/4로 직접 수리
- 가스 건조기 미가열 문제를 Gemini가 사진 속 열퓨즈(thermal fuse) 위치를 지목하고 부품 링크까지 제공, $5 퓨즈와 환기구 청소로 해결
- 부동산 매입 시 Zillow 사진과 가전 일련번호를 주고 홈인스펙터 보고서를 작성시키자, 유료 $750 검사관이 놓친 저지대 침수·혼합 receptacle 회로·뒤틀린 사이딩 등을 식별
- 다만 사진만으로 같은 회로 여부를 판단할 수 있는지에 대한 회의론도 제기
- koi pond 펌프 모델명이 지워진 상태에서 사진과 길이 측정(11인치=4500, 9인치=2500) 으로 모델 특정, $700 견적 대신 $109로 직접 교체
- 은행 사기 소송에서 ChatGPT·Grok·Claude·Gemini를 교차 검증하며 반소(counter-suit)를 100% AI로 진행, 다만 변호사 상담 권유와 채팅 기록의 비특권성(subpoena 가능) 경고 제기
코딩·개발 워크플로 전환
- Brother 프린터 펌웨어 업데이트로 CSV 페이지가 HTML로 바뀌자, 정적 HTML 한 개와 Go "hello world"만 든 디렉터리에서 /init 한 번으로 Prometheus exporter를 Go로 자동 작성, 기본 IP·메트릭 파싱까지 추론
- Oracle Apex 웹앱의 PL/SQL 7만 줄을 15~20분 만에 700줄 마크다운 비즈니스 요구사항으로 압축
- 작은 NGO에서 NextJS·React·마이크로서비스로 과설계된 앱을 Claude가 자는 동안 80% Django 서버사이드 렌더링으로 재작성, 서버 비용·복잡도 절감
- ChatGPT Code Interpreter(2023.3)가 CSV를 Pandas로 로드·차트·SQLite 내보내기까지 수행, "코딩 에이전트라는 카테고리가 명명되기 전 첫 경험"으로 회고
-
부정적·회의적 코딩 경험
- AI 자동 PR 리뷰가 삭제만 한 PR에 "새 RPC를 추가했다"고 존재하지 않는 내용을 단언한 환각 사례
- 테스트 통과를 위해 assert status == 200을 == 500으로 바꿔 통과시키는 등 수천 줄의 슬롭(slop) 을 양산해 프로젝트에서 배제된 동료 사례
- 명세가 모호하면 코드가 장황하거나 설계가 부실해져, 실제 프로젝트의 품질·확장성 관점에서 생산성 향상이 크지 않다는 회의론
- Opus 4.6→4.7→4.8로 갈수록 소규모 능력은 늘어도 "무엇을 해야 하는지 아는 능력"은 오히려 나빠졌다는 관찰
비코딩·창작·인지 영역
- 식물 사진을 Claude에 보여주자 종을 인식하고 진단·삽목 방법까지 안내, "컴퓨터가 컴퓨터를 말하는 게 아닌 식물을 진단한" 점에 충격
- 가족 강아지에 대한 곡을 Suno가 K-pop 스타일 후렴의 곡으로 작곡, "창작은 인간과 기계를 구분하는 것이라 여겼다"는 소회
- 본인 그림(해부학 스케치)을 업로드하자 "둥근 어깨·잘못된 원근·삼각근 미표현" 등을 지적하고 파이썬 스크립트로 좌표를 찍어 라벨링
- 자녀 과학실험(전자기학)에서 Gemini 화상통화가 배터리 연결부의 미제거된 절연 피복을 육안보다 정확히 포착해 문제 해결
- 미국 대통령별 풍자 이모지 작업에서 Zachary Taylor에 체리(과식으로 사망했다는 일화) 이모지를 제안, "함께 워크숍하는 느낌"의 협업성에 주목
부정적·우려 중심의 전환점
- 동료가 리뷰 불필요라며 보낸 대량 PR이 슬롭이고, 인간 엔지니어를 불신하며 Claude 채팅 로그를 붙여넣는 행태에 "AI 정신증과 일하는 것이 남은 커리어"라 우려
- LLM이 능력(긍정·부정 모두)을 증폭시켜 반사회적 행동을 늘릴 것이라는 관점
- HTTP 프록시 구현이 그럴듯한 합리화로 자기 판단을 강화하지만 RFC를 이해하지 못한 채 완전히 비보안적이었던 코드에 "우리는 망했다"고 반응
- 회사 해커톤에서 검증 없이 LLM 출력을 사실로 취급하고 제품화하려는 팀을 보며 "이 텍스트 생성기가 추론한다고 믿는구나"라고 충격
- CEO들의 "12~18개월 내 화이트칼라 대체" 과장이 기대를 과도하게 높여, 환각·부실 안내로 신뢰 불가한 현실과 괴리되며 흥미가 식었다는 비판
- 인근 마을 주민 반대에도 데이터센터 건설을 소송으로 강행하는 행태에 대한 불쾌감
- LLM의 비결정성으로 "요일 중 d가 들어간 개수" 같은 질문에 Firefox 6개, Chrome 7개로 자기 일관성조차 없다는 재현 사례 제시
시기별 전환점의 다양성
- 2016년 Google Translate의 신경망 전환으로 일·영 번역이 처음 실용적이 됐으나, 의미(meaning) 번역은 여전히 못 한다고 보다가 2022년 ChatGPT에서 대명사 선행사·다의어 문맥 파악에 충격
- GPT-3 발표를 "질적 도약"으로 꼽으며, 이후 채팅·도구 호출은 과학적 돌파라기보다 엔지니어링적 진화로 평가
- 2019년 GPT-2와 GAN을 "obviously fake에서 sometimes real로" 넘어간 지점으로 보며, 이후는 대부분 점진적 개선이라는 관점
- ChatGPT 출시(2022.11.30)를 기점으로 "전통적 프로그래머 시대의 종말"을 직감하고 다음 날 첫 에이전틱 코딩 루프를 실험한 사례
- 2025년 IMO 금메달, 신규 문장 생성 능력, 도구 호출 등 각기 다른 "지능이 실제로 모델링됐다"는 깨달음의 순간들
-
Homepage
-
Tech blog
- Ask HN: GenAI를 보며 “아, 큰일 났다”라고 느낀 순간은 언제였나요?