스마트폰에서도 실행 가능한 AI 모델 Multiverse Computing, 클라우드 의존을 탈피하다

핵심 요약: 스페인의 스타트업 Multiverse Computing이 대형 AI 모델을 압축하여 스마트폰 등 개인 기기에서 직접 실행 가능하게 만들고, 이를 통해 클라우드 인프라 의존도를 낮출 수 있도록 API 포털을 출시하며, AI 산업의 '계산 능력 부족' 문제에 대한 새로운 해결책을 제시하고 있다.

[도입부 - 2-3문장으로 강렬하게!] AI 기업들은 최근 VC사 Lux Capital이 AI 인프라 공급망의 재정 불안정성 때문에 '9.2% 이상의 사기율'을 보고, 클라우드 계약만으로는 부족하다고 경고했는데요. 이를 해결하기 위해 Multiverse Computing은 대형 AI 모델을 압축해 개인 기기에서 직접 실행 가능하게 만들어 '클라우드 의존 없는 AI' 시장에 도전하고 있습니다.

무슨 일이 일어났나

[본문 - 깊이 있는 스토리텔링!] 스페인의 스타트업 Multiverse Computing은 최근 대형 AI 연구소(OpenAI, Meta, DeepSeek 등)의 모델을 압축하여 개인 기기에서 실행 가능하게 만들어 '클라우드 인프라 없는 AI'를 시장에 선보였습니다. 이 회사는 그동안 비교적 낮은 프로파일로 활동했지만, AI 효율성 수요가 증가하면서 주목받고 있습니다.

Multiverse의 핵심 기술인 'Quantum-inspired compression technology'를 사용해 OpenAI, Meta, DeepSeek, Mistral AI 등 대형 AI 연구소의 모델을 압축한 결과물로, Gilda라는 모델이 탄생했습니다. Gilda는 스마트폰 RAM과 저장 공간에 맞게 작은 크기로 압축되어 오프라인에서도 실행 가능하며, 사용자의 데이터가 클라우드로 전송되지 않아 프라이버시를 보호합니다.

Multiverse는 이 기술을 바탕으로 CompactifAI라는 AI 채팅 앱을 출시했습니다. ChatGPT나 Le Chat과 유사하게 질문에 답변하는 기능을 제공하지만, Gilda 모델이 내장되어 사용자의 스마트폰에서 직접 실행됩니다. 하지만 한계점도 존재합니다: 앱은 사용자의 기기가 충분한 RAM과 저장 공간을 가지고 있지 않으면(예: 많은 이전 버전의 iPhone), 자동으로 클라우드 모델(gpt-oss-120b)에 요청을 전달하여 처리합니다. 이때 프라이버시 보호 기능이 사라지는 점입니다.

Multiverse는 이 앱을 통해 사용자에게 '개인기기에서 실행되는 AI'의 가능성을 보여주고 있으며, 실제 대상은 비즈니스입니다. 오늘 Multiverse는 개발자와 기업들이 직접 접근할 수 있는 API 포털을 출시했습니다. 이 API는 AWS Marketplace를 통해 모델에 접근하지 않아도 바로 압축된 AI 모델을 사용할 수 있게 해주며, 실시간 사용량 모니터링 기능까지 제공합니다.

이 API 포털은 특히 비즈니스가 대형 언어 모델(LLM) 대신 작은 모델을 활용하는 이유를 설명합니다: 클라우드 인프라 비용 절감과 함께, 작은 모델이 더 적합한 사용 사례에 맞춰 조정할 수 있다는 장점입니다. Mistral AI가 최근 'Mistral Small 4'를 출시해 작은 모델의 다양한 활용성을 강조했듯, Multiverse도 작은 모델이 LLM과의 차이를 좁히고 있습니다.

Multiverse의 가장 최신 압축 모델인 HyperNova 60B 2602는 OpenAI의 gpt-oss-120b 모델을 기반으로 만들어졌으며, 원본 모델보다 더 빠른 응답 속도와 낮은 비용을 제공합니다. 이는 특히 'agentic coding' 작업(자동화된 복잡한 프로그래밍 작업)에서 중요한 장점입니다.

Apple Intelligence처럼 온-디바이스 모델과 클라우드 모델을 결합했지만, Multiverse는 'Gilda'와 같은 내장 모델의 주된 장점을 강조합니다: 비즈니스 사용 사례에서 더 큰 가치를 창출할 수 있습니다. 예를 들어 연결 불가능한 환경(드론, 위성 등)에서도 AI를 활용할 수 있게 해주는 점입니다.

현재 Multiverse는 캐나다 은행, 보슈(Bosch), 이베르디로라(Iberdrola) 등 전 세계 100개 이상의 고객을 가지고 있습니다. 지난해 Series B 투자로 $215만 달러를 유치했으며, 최근 €500만 유로 규모의 신규 투자 라운드에 대한 소문이 돌고 있으며, 평가액은 1.5억 유로 이상으로 전망됩니다.

왜 중요한가

[영향 분석 - 구체적으로!] 이 기술의 가장 큰 영향은 사용자와 비즈니스에게 있습니다. 개인 사용자는 클라우드 인프라 비용을 절감하고, 데이터 유출 우려 없는 프라이버시 보호를 받습니다. 비즈니스에서는 작은 모델을 활용해 연결 불가능한 환경(드론, 위성 등)에서도 AI를 적용할 수 있게 되며, 대형 언어 모델(LLM)에 대한 의존도를 낮출 수 있습니다.

Mistral의 'Small 4' 업데이트와 같이 작은 모델의 다양한 활용성을 강조하는 추세 속에서 Multiverse는 작은 모델과 클라우드 모델 간의 차이를 좁히고 있습니다. 이는 AI 시장에서 '클라우드-먼저'에서 '개인기기-먼저'로의 전환을 가속화할 것으로 예상됩니다.

내가 보기엔

[분석 - YOUR unique take!] Multiverse의 기술은 매우 흥미롭습니다. AI 시장에서 '개인기기에서 실행되는 AI'라는 새로운 패러다임을 제시하고 있으며, 클라우드 인프라 의존도를 낮추고 프라이버시를 보호하는 데 큰 가치를 갖습니다. 하지만 한계점도 존재합니다: 앱의 호환성 문제(예: 많은 이전 버전의 iPhone)와 API 포털의 시장 점유율 확보 속도가 주목할 만한 점입니다.

다만, Multiverse는 이미 100개 이상의 고객을 가지고 있으며, 신규 투자 라운드에 대한 소문이 돌고 있다는 점에서 성장 가능성은 충분히 보장됩니다. 앞으로 더 많은 개발자와 기업들이 이 모델에 접근하며 AI 시장의 변화를 가속화할 것으로 예상합니다.

자주 묻는 질문

Q: Multiverse Computing이 무엇인가? A: 스페인의 AI 모델 압축 기술을 개발하는 스타트업입니다. 대형 AI 연구소(OpenAI, Meta 등)의 모델을 압축하여 개인 기기에서 직접 실행 가능하게 만들어 '클라우드 의존 없는 AI'를 제공합니다.

Q: 이 기술이 개발자나 비즈니스에게 어떤 영향을 미칠까? A: 클라우드 인프라 비용을 절감하고, 데이터 유출 우려 없는 프라이버시 보호를 제공하며, 연결 불가능한 환경(드론, 위성 등)에서도 AI를 활용할 수 있게 해준다. 작은 모델의 다양한 사용 사례에 맞춰 조정할 수 있는 장점도 있습니다.

Q: CompactifAI API 출시 후 다음에는 무엇을 기대할까? A: 더 많은 개발자와 기업이 이 모델에 접근하며, AI 시장의 '클라우드-먼저'에서 '개인기기-먼저'로의 전환을 가속화할 것으로 예상된다. 작은 모델과 클라우드 모델 간의 차이를 좁히는 추세가 계속될 가능성도 높습니다.

이 글은 TechCrunch: Multiverse Computing pushes its compressed AI models into the mainstream의 보도를 바탕으로 작성되었습니다.