생성형 AI 시대가 도래하면서 최근 많은 기업이 AI 모델 확보와 데이터 인프라 정비에 대해 고민하고 있다. 레거시 시스템의 현대화는 물론 AI와 빅데이터 분석 같은 새로운 기술 도입이 동시에 요구되는 상황인 것이다. 이런 시장 변화에 맞춰 데이터 기술 기업들도 신속하게 대응하고 있다. 기업용 포스트그레SQL 전문기업 EDB 역시 데이터베이스 기술에 AI 역량을 결합한 ‘포스트그레스 AI’라는 플랫폼을 선보이며 새로운 도전에 나섰다. 지난 23일 CIO코리아와 IT월드가 공동 주최한 ‘퓨처 오브 데이터 & AI 리서치 서밋’에서 EDB 코리아 김범규 이사가 이 플랫폼의 주요 특징과 기술적 방향성을 소개했다.
AI 시대에 필요한 데이터 현대화 과제
기업은 전통적으로 데이터 분석을 통한 인사이트 도출을 하기 위한 노력을 수행했다. 최근에는 한걸음 더 나아가 데이터와 AI 시스템의 유기적 결합을 통한 혁신을 추구하고 있다. 하지만 막상 새로운 시스템을 구축하는 것은 쉽지 않다. 김범규 이사에 따르면, AI 시대에 필요한 데이터 환경을 구축하기 위해선 몇 가지 현실적 제약을 극복해야 한다.
일단 사일로화라는 제약을 해결해야 한다. 온프레미스부터 퍼블릭 클라우드까지, 여러 환경에 흩어진 기업 데이터는 통합 관리와 분석에 어려움이 있다. 게다가 데이터베이스별로 관리 방식과 보안 정책이 달라 운영 효율성도 떨어질 수 있다.
PoC(Proof of Concept) 단계의 AI 시스템을 실제 서비스로 전환하는 것도 큰 제약으로 작용한다. AI 운영 경험 부족으로 기존 데이터 플랫폼과의 효과적인 연동 방안을 찾기 어려운 것이다.
김범규 이사는 “필요한 기술은 모두 있지만, 기존 데이터와 플랫폼을 효과적으로 연동하는데 어려움을 겪는 기업이 많다”라며 “이런 문제를 근본적으로 해결하려면 AI에 최적화된 데이터 플랫폼이 필요하다”라고 설명했다.
김범규 이사는 이런 제약의 해법으로 트랜잭션, 분석, AI 워크로드를 통합적으로 관리할 수 있는 새로운 형태의 데이터 플랫폼을 제시했다. 통합 데이터플랫폼으로 특히 현대화 과정에서 발생하는 기존 시스템과 새로운 기술 사이의 간극을 효과적으로 해소할 수 있기 때문이다.
포스트그레스 AI 플랫폼의 핵심 기능
EDB는 올해 5월 AI 특화 DB 관리 플랫폼 ‘포스트그레스 AI’를 출시했다. EDB의 주력 서비스로 제공했던 기업용 포스트그레SQL이 주로 트랜잭션 처리를 위한 OLTP 작업에 중점을 둔 관계형 데이터베이스 관리 시스템이었다면, 포스트그레스 AI는 OLTP뿐 아니라 OLAP 및 AI 워크로드까지 지원한다. 여기에 포스트그레SQL 데이터베이스의 운영, 모니터링, 성능 최적화를 자동화하기 위한 각종 도구를 제공하는 것이 특징이다.
EDB는 포스트그레스 AI로 앞서 언급한 현대화 제약을 해결하고자 했다. 일단 포스트그레스 AI는 단일 엔진을 활용해 트랜잭션, 분석, AI 워크로드를 모두 처리한다. 기존에는 각각의 워크로드별로 별도의 데이터베이스를 운영해야 했지만, 이제는 하나의 포스트그레스 엔진으로 통합 운영을 할 수 있다.
포스트그레스 AI는 하이브리드 및 멀티클라우드 환경에 대한 통합 관리 기능도 제공한다. 온프레미스, AWS, 애저, GCP 등 데이터가 어디에 위치하든 마치 하나의 시스템처럼 관리할 수 있는 통합 뷰를 지원하는 식이다. 덕분에 기업은 각 워크로드의 특성에 맞게 최적의 환경을 선택할 수 있다. 예를 들어, 분석 워크로드는 AWS에, 데이터 레이크는 애저에, AI 워크로드는 GCP에 배치하는 등 유연한 운영이 가능하다.
김범규 이사는 “고객은 원하는 모든 곳에 데이터를 배포하고, CSP와 플랫폼에 상관없이 동일한 서비스를 받을 수 있다”라며 “이런 기능을 통해 기업은 데이터 관리 부담을 줄이면서도 AI 프로젝트의 상용화에 필요한 데이터 환경을 구축할 수 있다”라고 설명했다.
김범규 이사가 강조한 포스트그레스 AI의 핵심 기능 중 하나는 오라클 마이그레이션을 위한 도구다. 현재 EDB의 포스트그레스 AI는 95% 이상의 오라클 호환성을 제공하며, 마이그레이션 툴킷과 포털을 통해 기존 데이터베이스의 전환 가능성을 사전에 확인할 수 있다. 이때 자체적으로 지원하는 AI 코딩 도구를 이용하면 수동 변환이 필요했던 5%의 코드까지 자동으로 처리할 수 있다. 덕분에 타사 시스템을 일반 포스트그레스로 전환할 때는 많은 코드 수정이 필요하지만, 포스트그레스 AI를 활용하면 수정해야 할 코드의 양이 최대 80%까지 줄어든다.
레이크하우스로 달성한 데이터 효율화
김범규 이사에 따르면, EDB는 기업 환경에 필수적인 성능과 보안에 중점을 두고 포스트그레스 AI 플랫폼을 개발했다. 특히 분석 성능이 크게 향상됐다. DB 성능 측정 표준인 TPC-H 벤치마크 테스트 결과, 기존 포스트그레스SQL 16 버전 대비 포스트그레스 AI 플랫폼 내 쿼리 대부분이 2~40배 빨라졌으며, 일부 쿼리는 300배 이상 성능이 개선됐다.
이렇게 성능을 높일 수 있었던 배경에는 레이크하우스 아키텍처의 도입이 있다. 새로운 테이블 구조를 통해 데이터 크기를 5배 이상 줄였으며, 이는 자연스럽게 I/O 처리량 감소로 이어져 전반적인 성능 향상을 가져온 것이다. 또한 비용 효율적인 오브젝트 스토리지를 활용하면서도 고성능을 유지했다.
보안 측면에서는 데이터 암호화(TDE), 감사 로그 분석, 사용자 권한 관리, 방화벽 등 핵심 보안 기능을 기본 제공한다. 여기에 국제 보안 인증인 SOC2, 유럽의 GDPR, 글로벌 결제 보안 표준인 PCI DSS 등 주요 규제도 준수한다. 특히 데이터베이스를 여러 지역에 분산 배치하여 동시 운영하는 방식으로, 99.999%의 가용성을 보장한다.
김범규 이사는 포스트그레스 AI가 비용 면에서도 장점이 있다고 설명했다. 그는 “기존 상용 데이터베이스와 비교해 총소유비용(TCO)을 80%까지 줄일 수 있다”라며 “비용이 합리적임에도 불구하고 포스트그레스 AI는 더 뛰어난 성능과 보안을 제공한다”라고 설명했다.
jihyun.lee@foundryco.com