노을은 혈액 분석 솔루션 ‘마이랩 BCM’으로 생성한 백혈구 이미지 분류 데이터셋에 대한 인공지능(AI) 논문이 네이처의 자매지인 사이언티픽 데이터(Scientific Data)에 게재됐다고 21일 밝혔다.
이 논문을 통해 공개된 ‘백혈구의 분류를 위한 대규모 멀티포커스 데이터셋’은 현재 사용 가능한 여러 오픈 데이터셋과 비교해 최초로 초점별 영상(focus stack)을 포함했다. 또 다양한 18개 세포 타입과 방대한 양의 데이터를 제공한 것이 특징이다. 노을만의 고체 염색(NGSI) 기술과 완전히 자동화된 이미지 취득으로 구축해 공개한 최초의 대규모 고품질 백혈구 이미지 데이터셋이라고 회사 측은 설명했다.
임찬양 노을 대표는 “마이랩 BCM은 세계 최초 완전자동화 AI 기반 혈액검사 솔루션으로, 혈액검사를 시행하는 모든 의료기관뿐만 아니라 채혈실에서 전문가 없이 사용할 수 있도록 소형화, 경량화한 대체 불가능한 제품”이라며 “이를 활용해 혈액암 등 다양한 암종의 조기 진단 영역까지 확장할 수 있는 AI 이미징 바이오마커 연구 개발에 힘쓸 것”이라고 전했다.
연구를 공동으로 진행한 정규환 성균관대학교 삼성융합의과학원 정규환 교수는 “이 연구에서 마이랩 BCM을 이용해 대규모의 고품질 백혈구 이미지 데이터셋을 생성하고 검증할 수 있다는 점을 입증했다”며 “이는 기존의 자동화 분석 시스템이 가지는 한계를 극복한 것으로 기술적인 우월성과 혁신성이 확인된 것”이라고 설명했다. 이어 “각 이미지가 10개의 다중 초점 영상으로 구성돼 기존 데이터셋과 차별화된 가치를 제공할 것으로 기대한다”며 “데이터셋은 약지도 학습(Weakly-supervised learning) 등 다양하고 새로운 의료 AI 모델 개발에 활용될 수 있어 백혈구 감별검사 자동화 연구에 새로운 지평을 열 것”으로 기대했다.
데이터는 서울아산병원에서 확보한 혈액 표본 72개를 마이랩으로 촬영해 총 2만5773개 이미지 스택을 제공하고 있다. 이미지 라벨은 18종류의 정상·비정상 혈액 세포를 포함한다. 각 라벨은 판독 전문가 두 명이 검수했다. 각 이미지는 50배율 현미경으로 400nm 간격, 10개의 z-스택을 통해 촬영됐다. 더불어 마이랩에 탑재된 딥러닝 모델을 활용해 라벨 정확성에 대한 검증을 수행했다.
한편 노을은 이번 논문을 통해 전체 데이터셋을 오픈소스로 완전히 공개한다. 의료 AI 연구자를 위한 질 높은 데이터셋 제공을 통해 디지털 헬스케어 분야의 연구와 개발을 촉진할 것으로 회사 측은 기대하고 있다.
김예나 기자 yena@hankyung.com