탈중앙화 데이터 인프라 기업 케이젠(KGeN)이 5300만명 이상의 사용자 네트워크를 활용한 자체 인공지능(AI) 학습 데이터 수집 구조를 공개했다.
2일 블루밍비트에 따르면 케이젠은 인도, 동남아시아, 브라질, 중동 등 글로벌 전역에 분산된 사용자 층을 통해 실제 환경에서 생성되는 데이터를 확보하고 있다. 단순 클릭 데이터가 아닌, 사용자의 실제 의도와 행동이 반영된 데이터를 수집하는 것이 핵심이다.
데이터 검증에는 자체 개발한 'POGE(Proof of Gamified Engagement·게이미피케이션 참여 증명)' 구조를 적용했다. 이를 통해 사용자의 신원과 활동 내역을 확인하고, 허수 데이터를 제외한 고도화된 데이터셋을 구축한다는 설명이다.
구체적인 데이터 구축 사례도 제시됐다. 케이젠은 가정 내 일상 활동을 담은 1인칭 시점 기반 영상 데이터를 약 2만 시간 규모로 확보했다고 소개했다.
케이젠 측은 "해당 데이터는 연출 없이 실제 생활 속에서 수집됐기 때문에 환경과 행동의 다양성이 그대로 반영됐다"며 "수집 과정에서 개인정보 및 민감 정보는 철저히 제외하는 방식으로 운영 중"이라고 밝혔다.
오정민 한경닷컴 기자 blooming@hankyung.com

3 weeks ago
3
![[속보] 코스피, 사흘 연속 사상 최고치 경신…6470선 돌파](https://pimg.mk.co.kr/news/cms/202604/23/news-p.v1.20260423.690d8ea76c2347b4ad14c5aae5e4b91b_R.png)


![[단독] KRX금시장 참여 해외기업, ‘골목상권’ 침해 않기로 약속…금 시장가격 왜곡 해결 눈앞](https://pimg.mk.co.kr/news/cms/202604/23/rcv.YNA.20260331.PYH2026033111070001300_R.jpg)
![[단독] 국회 예정처 "ESG 공시, 주요국 대비 지체…제조 기업 사각지대"](https://img.hankyung.com/photo/202604/ZN.43991780.1.jpg)


!["엔비디아 잡는다"…'상위 1%' 서학개미 쓸어담은 종목 [마켓PRO]](https://img.hankyung.com/photo/202604/ZA.44039358.1.jpg)







English (US) ·