[태그:] 퓨리오사AI

  • 퓨리오사AI(FuriosaAI) 국산 AI 반도체, 실무자 시각으로 뜯어보기

    국산 AI 반도체 이야기가 나올 때마다 빠지지 않는 이름이 있어요. 퓨리오사AI(FuriosaAI)입니다. 2017년 설립된 이 팹리스 스타트업은 지금 국내에서 가장 진지하게 AI 추론 가속기를 만들고 있는 곳이고, 실제로 양산 칩까지 내놓은 몇 안 되는 사례예요. 저도 AI 인프라 관련 프로젝트를 기획할 때 한 번은 꼭 검토 선상에 올리게 되더라고요.

    이 글에서는 마케팅 자료나 보도자료 수준이 아니라, 실무에서 AI 추론 인프라를 고민하는 분들이 알아야 할 포인트를 중심으로 퓨리오사AI를 정리해봤습니다.

    WARBOY에서 RNGD로, 칩 세대가 의미하는 것

    퓨리오사AI의 첫 번째 양산 칩은 WARBOY입니다. TSMC 14nm 공정으로 제작됐고, 주된 설계 타깃은 CNN 기반의 비전 추론 워크로드였어요. 이미지 분류, 객체 탐지, OCR처럼 엣지-서버 경계에 있는 작업에서 전력 대비 성능이 괜찮다는 평가를 받았고, 실제로 SKT, KT 같은 국내 통신사와 일부 클라우드 사업자들이 파일럿 형태로 도입한 바 있습니다.

    그런데 WARBOY가 나온 시점과 대형 언어모델(LLM) 열풍이 겹치면서 상황이 달라졌어요. CNN 중심의 설계로는 트랜스포머 기반 모델을 효율적으로 돌리는 데 한계가 있거든요. 어텐션 연산의 특성상 메모리 대역폭과 유연한 텐서 처리 구조가 중요한데, WARBOY는 그 지점에서 제약이 있었어요.

    그래서 나온 게 두 번째 세대 칩인 RNGD(Rebellions Next Generation Device가 아니라 퓨리오사 내부 코드명 기반 제품명)입니다. TSMC 5nm 공정을 채택했고, 멀티-다이 구조와 대용량 HBM을 결합해 LLM 추론을 포함한 훨씬 넓은 워크로드 스펙트럼을 커버할 수 있도록 설계했어요. 공개된 벤치마크에 따르면 특정 추론 시나리오에서 NVIDIA A100에 준하거나 일부 작업에선 경쟁력 있는 수치를 보여주고 있습니다. 물론 엔비디아의 H100/H200과 비교하면 아직 간극이 있고, CUDA 생태계만큼의 소프트웨어 성숙도는 솔직히 따라잡기 쉽지 않은 게 사실이에요.

    실무에서 퓨리오사AI 칩을 쓸 수 있는 현실적인 시나리오

    AI 반도체를 도입할 때 기술 스펙보다 더 중요한 게 에코시스템이에요. 얼마나 많은 모델 프레임워크를 지원하는지, 컴파일러가 얼마나 안정적인지, 문제가 생겼을 때 디버깅 환경이 갖춰져 있는지가 실제 운영 비용을 좌우하거든요.

    퓨리오사AI는 Furiosa SDK를 자체 제공하고 있어요. PyTorch, ONNX 모델을 변환해서 칩에 올리는 파이프라인이 있고, 양자화(Quantization) 지원도 포함돼 있습니다. 다만 엔비디아의 TensorRT나 구글 TPU의 XLA 컴파일러처럼 수년간 수만 명이 쓰면서 갈고닦인 툴체인과 같은 수준을 기대하기는 어렵고, 아직 엣지 케이스가 제법 남아 있는 단계라고 보는 게 현실적이에요.

    그렇다면 어떤 상황에서 퓨리오사AI 칩이 현실적인 선택지가 될 수 있을까요? 제가 보기엔 세 가지 시나리오가 있어요.

    • 데이터 주권과 온프레미스 요건이 강한 환경: 금융, 공공, 의료처럼 데이터를 외부 클라우드로 보내기 어려운 곳에서, 국산 칩 기반의 온프레미스 추론 서버를 구성하는 방향입니다. 조달 경로, 보안 인증, 기술 지원 측면에서 국내 벤더 생태계와 연결이 더 수월해요.
    • 특정 추론 워크로드에 최적화된 커스텀 배포: LLM 전체 파인튜닝보다 특정 비전·언어 추론 파이프라인에 집중하는 서비스라면, RNGD의 전력 효율과 단가 경쟁력을 활용한 비용 구조 최적화가 가능할 수 있어요.
    • 기술 주권 차원의 파일럿 도입: 대기업이나 공공기관에서 엔비디아 의존도를 분산하는 벤더 다변화 전략의 일환으로, 실 운영 트래픽 일부를 퓨리오사 칩으로 서빙해보는 식이에요. 생태계 성숙도를 직접 확인하면서 향후 스케일업을 판단할 수 있죠.

    리벨리온 합병 시도와 그 이후, 업계 맥락 읽기

    2024년에 퓨리오사AI와 또 다른 국산 AI 반도체 팹리스인 리벨리온(Rebellions) 사이의 합병 논의가 공론화되면서 업계가 한바탕 술렁였어요. 정부 주도의 반도체 경쟁력 집중 전략과 맞물려 있었는데, 결국 합병은 성사되지 않았습니다. 양측의 기술 방향성과 투자자 구조, 그리고 각각의 고객 파이프라인이 충분히 달랐던 게 주요 이유로 알려져 있어요.

    이 사건이 실무자 입장에서 시사하는 건 뭘까요? 국내 AI 반도체 생태계가 아직 파편화돼 있고, 한 벤더에 전사적으로 베팅하기에는 트랙 레코드가 충분히 쌓이지 않았다는 거예요. 퓨리오사AI 자체의 기술력은 분명히 인정받고 있지만, 긴 납기나 소프트웨어 지원 연속성 같은 공급망 리스크는 의사결정 과정에서 꼭 체크해야 할 항목입니다.

    한편으로는 이 경쟁 구도가 결과적으로 두 회사 모두를 더 빠르게 발전시키는 동력이 되고 있기도 해요. 리벨리온이 ATOM, ATOM+를 고도화하는 동안 퓨리오사AI는 RNGD 기반의 서버 플랫폼 완성도를 높이고 있고, 국내 시장에서 실제 레퍼런스를 쌓아가는 중입니다.

    지금 시점에서 퓨리오사AI를 바라보는 현실적인 시선

    저는 퓨리오사AI를 보면서 늘 두 가지 감정이 교차해요. 하나는 ‘이 팀이 진짜 칩을 양산까지 가져왔다’는 진심 어린 존중이고, 다른 하나는 ‘소프트웨어 생태계와 공급 안정성 측면에서 아직 갈 길이 멀다’는 냉정한 판단이에요.

    엔비디아 GPU 대비 단순 성능 숫자 비교보다, 어떤 워크로드에 얼마나 안정적으로 쓸 수 있는가를 기준으로 보는 게 맞아요. RNGD가 클라우드 기업과 통신사의 실 서비스에서 일정 트래픽을 안정적으로 소화하는 레퍼런스를 몇 개 더 쌓는다면, 평가는 빠르게 달라질 수 있습니다.

    AI 인프라를 기획하거나 조달하는 분이라면, 지금 단계에서 퓨리오사AI는 ‘메인 스택 교체’ 대상이 아니라 ‘병행 검토 및 파일럿’ 대상으로 두는 게 현실적이에요. 하지만 2~3년 후를 내다보면서 포트폴리오를 다변화하는 관점에서는, 지금부터 SDK를 직접 만져보고 기술팀과 관계를 쌓아두는 게 분명히 의미 있는 투자라고 생각합니다.