플리토와 협력 나선 퓨리오사AI, AI 반도체는 왜 언어 데이터가 필요할까?

17 hours ago 2
지난 7월 1일, 인공지능(AI) 언어 전문 기업 플리토(Flitto)와 인공지능(AI) 반도체 기업 퓨리오사AI가 AI 기술 공동 연구를 위한 양해각서를 체결했다.

플리토는 AI 기반의 실시간 통역 설루션을 바탕으로 일반 번역 및 교정, 기업용 번역 서비스를 제공한다. 또한 전 세계 1400만 명 이상이 참여하는 번역 플랫폼을 바탕으로 언어데이터 및 자연어처리를 위한 정제 데이터 등도 구축 중이다. 퓨리오사AI는 AI 연산 처리에 최적화된 신경망처리장치(NPU)를 설계하는 기업이며, 지난해 8월 2세대 칩인 레니게이드(RNGD)를 공개한 이후 올해 본격적으로 시장 확장에 전념하고 있다.

백준호 퓨리오사AI 대표(좌)와 이정수 플리토 대표(우)가 AI 기술 공동 연구를 위한 양해각서를 체결했다 / 출처=플리토

백준호 퓨리오사AI 대표(좌)와 이정수 플리토 대표(우)가 AI 기술 공동 연구를 위한 양해각서를 체결했다 / 출처=플리토

양해각서는 ▲ 고품질 AI 언어 데이터셋 구축 및 핵심 모델 알고리즘 공동 개발 ▲ NPU 기반 실시간 동시통역 및 이미지 자동 번역 기술 연구 ▲ NPU 연동 고속 통번역 응용 서비스 개발 ▲양사 연구개발 역량 공유 및 인재 교류 프로그램 운영 등의 내용을 담고 있다. 정리하자면 현재 클라우드 인스턴스 및 GPU로 구동되는 플리토의 AI 서비스 일부를 퓨리오사AI의 RNGD로 대체하겠다는 의미다.

퓨리오사AI와 손잡는 플리토, 어떤 기업?

플리토 서비스 메인화면 / 출처=플리토

플리토 서비스 메인화면 / 출처=플리토

플리토는 구글 번역, 딥엘 등과 마찬가지로 소비자 대상 번역 서비스를 제공한다. 플리토 홈페이지를 방문하면 별도 회원가입없이 번역 서비스를 이용할 수 있다. 플리토는 내부에 전문 번역가 그룹이 있어 번역 작업은 물론 언어 교정, 언어 데이터 생성 등에 밀접하게 관여하며 고품질 데이터 셋을 구축하는 것으로 유명하다.지난해 서울 주요 관광안내소에 AI 번역 서비스를 개시한 것을 시작으로 전국 지자체 및 기관, 리테일, 금융업계 등에 다국어 AI 메뉴 번역 서비스 등을 제공 중이다. 최근에는 AWS의 생성형 AI 베드록을 결합한 ‘라이브 트랜스레이션’ 서비스를 AWS, 메타 서비스 등에 제공해 국내는 물론 해외 시장에서도 관심을 받고 있다.

지난 5월 개최된 AWS 서밋 서울 당시 플리토의 라이브 트랜스레이션 서비스가 연사의 발표 내용을 실시간으로 번역했다. 사진에서 무대 위의 한국어 스크립트가 플리토 서비스다 / 출처=IT동아

지난 5월 개최된 AWS 서밋 서울 당시 플리토의 라이브 트랜스레이션 서비스가 연사의 발표 내용을 실시간으로 번역했다. 사진에서 무대 위의 한국어 스크립트가 플리토 서비스다 / 출처=IT동아

번역뿐만 아니라 언어 빅데이터 공급 측면에서도 성과를 올리는 중이다. 플리토는 올해 3월 글로벌 빅테크 기업과 62만 달러(약 8억 4000만 원대) 규모의 언어 빅데이터 공급 계약을 성사시켰고, 3분기 연속 흑자를 기록하며 주목을 받고 있다. 올해 상반기에는 일본 도쿄에 위치한 플리토 재팬의 사업 성장과 아랍에미리트(UAE)에서 열린 세계 유틸리티 회의에 2년 연속으로 설루션을 제공하는 등의 성과도 올렸다.

퓨리오사AI와의 기술 협력, 언어 데이터는 어떻게 사용될까

퓨리오사AI의 2세대 NPU RNGD는 대형언어모델(LLM) 처리에 최적화된 AI 반도체다. 현재 AI 데이터 처리에 널리 쓰이는 GPU는 엔비디아가 사실상 독점하며 이로 인한 수급 경쟁 등으로 꾸준히 가격이 오르는 추세다. 하지만 GPU는 AI 처리가 아닌 그래픽 처리 용도의 물건이라 AI 처리 전용으로 설계된 NPU와 비교해 상대적으로 전력 효율이 떨어진다. 그럼에도 불구하고 GPU가 대세인 이유는 십수 년에 걸쳐 AI 개발에 맞춰 생태계를 만들고 최적화한 덕분이다.

퓨리오사AI의 2세대 NPU 레니게이드(RNGD) / 출처=퓨리오사AI

퓨리오사AI의 2세대 NPU 레니게이드(RNGD) / 출처=퓨리오사AI

RNGD를 비롯한 NPU는 AI 처리 자체에는 효율적이나 기업이 사용하는 각각의 AI 모델의 연산을 처리하기 위해 조율하는 과정이 필요하다. 플리토가 구축한 언어 빅데이터는 전 세계에서 사용 중인 광활한 언어로 구성되며, 개체별 데이터를 분류하고 주제나 의도에 맞춰 구분하도록 라벨링이 돼있다. 또한 음성과 영상, 이미지의 언어 데이터를 컴퓨터가 활용할 수 있는 전환 과정도 돼있다.따라서 RNGD를 활용해 음성을 실시간 문자로 변환하거나, 사진 상의 문자를 텍스트로 전환하거나, 실시간 대화를 다른 언어로 변환하기 위한 연산 작업 등을 진행하게 된다. 향후 플리토가 퓨리오사AI NPU를 도입하게 되면 고가의 GPU를 대체하는 효과를 거둘 수 있고, 퓨리오사AI는 NPU 최적화에 필요한 데이터를 안정적으로 수급하고 AI 반도체의 언어 서비스 효율을 높일 수 있다.이외에도 플리토는 인터넷 연결 없이 AI 번역 서비스를 구동하는 ‘온디바이스 AI’ 구현도 나선다. 온디바이스AI는 연산 처리에 필요한 데이터와 처리 장치를 모두 갖춰 인터넷이 없는 환경에서도 AI를 구동한다. 완제품 형태로 만들 경우 키오스크나 안내 데스크 등에서 인터넷 없이도 플리토의 AI 번역 서비스를 쓸 수 있는 제품이 된다.

언어 빅데이터 기업과 하드웨어 기업과의 만남은 글로벌 대세

언어 빅데이터 및 번역 서비스 기업이 하드웨어 인프라를 설계하는 회사와 손을 잡는 것은 큰 시너지를 낸다. 독일의 번역 및 언어 빅데이터 기업 딥엘(DeepL)은 AI 인프라의 핵심 기업인 엔비디아와 협력 중이며, 지난달에는 유럽 최초로 엔비디아 GB200 기반의 DGX 슈퍼팟 시스템을 도입해 슈퍼컴퓨터 역량을 강화했다.

번역 및 언어 데이터 기업 딥엘 역시 엔비디아와 협력 관계다 / 출처=엔비디아

번역 및 언어 데이터 기업 딥엘 역시 엔비디아와 협력 관계다 / 출처=엔비디아

이를 통해 딥엘은 LLM에 필요한 학습 및 추론 기능을 강화하고, 딥엘 클래리파이와 같은 고성능 AI 기능을 실현한다. 클래리파이는 딥엘 번역기에 문자가 입력되면 AI가 문맥을 파악하고 다의어, 성별 지칭, 고유명사, 문화적 차이, 약어 및 전문용어 등을 질문한 뒤 사용자 응답을 바탕으로 최적의 문법을 적용하는 기능이다. 딥엘은 새로운 가속컴퓨팅 기능을 활용해 다국어 뿐만 아니라 음성 및 이미지로의 번역하는 방안도 구상 중이다.

엔비디아는 DGX 슈퍼팟 도입을 통해 기존 딥엘 데이터센터에서 194일이 소요되던 지구상 웹 페이지 전체 번역을 약 18일 만에 할 수 있는 것으로 성능을 입증했다. 또 해당 데이터센터는 순수 재생 에너지로 구동되므로 성능 대비 전력효율성과 지속가능성이 높은 하드웨어라는 점도 보여줬다.

국산 NPU와 국산 언어 데이터의 조합, 소버린 AI와도 맞닿아

퓨리오사AI와 플리토는 엔비디아, 딥엘과의 협력 사례를 지향하려 한다. 이번 협력에 직접적인 서비스 운용이나 GPU 대체 계약 등이 오간 건 아니나 기술 개발을 통해 기반을 마련하려 한다. 퓨리오사AI RNGD의 추론 성능이 충분하다고 확인되는 이후에는 엔비디아 GPU의 추론 기능을 대체하기 위해 투입될 것이다

한편 이번 협력은 이재명 정부가 추구하는 주권AI, 소버린 AI와도 궤를 같이한다. 한국어는 영어와 문법구조, 어순, 표현 방식 등이 다른 독자적인 언어다. 이를 기반으로 서비스를 만들기 위해서는 한국어에 특화된 AI를 개발해야 한다. RNGD가 플리토의 AI 기반 서비스에 최적화하면 RNGD나 플리토 AI를 기반으로 하는 다른 한국어 AI 서비스에도 긍정적인 영향을 미친다. 결과적으로는 산업 경쟁력 향상과 AI 주권 및 보안까지 모두 충족시킬 수 있는 만큼 성공적인 협업 사례가 되길 바란다.

IT동아 남시현 기자 (sh@itdonga.com)

  • 좋아요 0
  • 슬퍼요 0
  • 화나요 0

지금 뜨는 뉴스

Read Entire Article