네이버, 엔비디아 B200 4천장 클러스터 구축 완료 국내 최대 AI 컴퓨팅 인프라 확보 최수연 대표 "AI 자립·주권 뒷받침하는 핵심 자산"
팀네이버는 엔비디아 차세대 GPU 'B200'(블랙웰) 4천장 기반의 AI 컴퓨팅 클러스터 구축을 완료했다고 8일 밝혔다. 국내 최대 규모의 AI 컴퓨팅 인프라 구축으로 팀네이버는 글로벌 수준의 컴퓨팅 파워를 확보하는 동시에 독자 파운데이션 모델 고도화는 물론 AI 기술을 서비스와 산업 전반에 적용하기 위한 핵심 기반을 마련했다고 설명했다. 이번에 구축된 'B200 4K 클러스터'에는 냉각과 전력, 네트워크 최적화 기술이 집약됐다. 또한 대규모 병렬 연산과 고속 통신을 전제로 설계돼 글로벌 상위 500위권 슈퍼컴퓨터들과도 성능을 비교할 수 있는 수준이다. 이와 함께 네이버팀은 대폭 개선된 인프라 성능으로 AI 모델 개발 속도를 12배가량 향상할 것으로 내다봤다. 실제 네이버팀이 내부 시뮬레이션을 한 결과 720억개(72B) 파라미터 규모 모델 학습 시 기존 인프라 대비 학습 기간이 대폭 줄어든 것으로 나타났다. 기존 A100 기반 주력 인프라(2천48장)로 약 18개월 걸리던 학습 기간이 B200 4K 클러스터에서는 약 1.5개월 수준으로 단축된 것이다. 다만, 해당 수치는 내부 시뮬레이션 결과인 만큼 실제 학습 과제와 설정에 따라 소요 기간은 달라질 수 있다고 팀 네이버는 전했다. 팀네이버는 이러한 인프라를 바탕으로 현재 진행 중인 독자 파운데이션 모델 고도화에도 속도를 낼 계획이다. 텍스트를 넘어 이미지·비디오·음성을 동시에 처리하는 옴니(Omni) 모델 학습을 대규모로 확장해 글로벌 수준으로 성능을 끌어올리고, 이를 다양한 서비스와 산업 현장에 단계적으로 적용한다는 구상이다. 최수연 네이버 대표는 "이번 AI 인프라 구축은 국가 차원의 AI 경쟁력 기반과 AI 자립·주권을 뒷받침하는 핵심 자산을 확보했다는 데 의미가 있다"며 "팀네이버는 빠른 학습과 반복 실험이 가능한 인프라를 바탕으로 AI 기술을 서비스와 산업 현장에 보다 유연하게 적용해 실질적인 가치를 만들어 나갈 것"이라고 말했다. 앞서 팀네이버는 2019년 엔비디아의 슈퍼컴퓨팅 인프라인 '슈퍼팟(SuperPod)'을 세계에서 가장 빠르게 상용화한 데 이어 초고성능 GPU 클러스터를 직접 설계·운영하는 등 실증 경험을 쌓아왔다.
<저작권자 ⓒ 코인리더스 무단전재 및 재배포 금지>
|
많이 본 기사
|