엔비디아에서 공개한 Nemotron-Personas-Korea 데이터셋을 활용한 한국인 페르소나 탐색기입니다.
이 데이터셋은 한국인 100만 명 규모의 합성 데이터셋으로, 나이, 직업, 지역, 가족 관계 등이 포함되어 있습니다. 데이터셋 제작 방식이나 통계 정보는 https://news.hada.io/topic?id=28919에 자세히 설명되어 있습니다.
페르소나 탐색기의 주요 기능은 다음과 같습니다.
-
페르소나를 검색하거나 비슷한 페르소나를 찾을 수 있습니다. Qwen s임베딩 모델을 사용하여 유사도를 비교합니다.
-
지도에서 페르소나의 인구 분포를 확인할 수 있습니다. 데이터셋에 있는 위치 정보를 사용합니다.
-
페르소나와 대화할 수 있습니다. 아주 간단한 질문 정도에 답할 수 있습니다.
Qwen 0.6 임베딩 모델로 데이터셋 전체에 대해 1024차원의 임베딩을 추출하여 허깅페이스 데이터셋으로 만들었습니다. *_persona 칼럼에 이름이 반복적으로 들어가는 특징이 있어, 이름에 편향된 임베딩 값을 가질 수 있습니다.

5 hours ago
1


![전처 살해 후 시신 유기 시도한 60대 구속…法 "도망 염려" [종합]](https://img.hankyung.com/photo/202604/ZN.43811686.1.jpg)




English (US) ·