Microsoft, 오픈아이와 파트너십 유지하며 세 가지 새 AI 모델 한꺼번에 공개

4분 읽기
공유
Microsoft, 오픈아이와 파트너십 유지하며 세 가지 새 AI 모델 한꺼번에 공개

핵심 요약: Microsoft은 2026년 4월 2일 세 가지 새로운 기반 AI 모델(MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2)을 공개하며 구글과 오픈아이의 경쟁에 맞서기 위해 다각적인 AI 스택을 강화하고 있다. 특히 MAI-Transcribe-1은 25개 언어의 음성을 텍스트로 변환하는데 Azure Fast보다 2.5배 빠르고, MAI-Voice-1은 한 초에 60초의 오디오를 생성할 수 있으며, 모든 모델의 가격은 구글/오픈아이 모델보다 저렴하다는 점에서 주목받는다.

[도입부 - 2-3문장으로 강렬하게!] Microsoft가 오픈아이와 파트너십을 유지하면서도, 세 가지 새로운 기반 AI 모델을 한꺼번에 공개하는 이유는 무엇일까? 구글의 다양한 AI 모델과 오픈아이의 GPT-6보다 더 빠르고 저렴하게 제공되는 것은 아니었을까? 실제로 MAI-Transcribe-1은 25개 언어의 음성을 텍스트로 변환하는데 Azure Fast보다 2.5배 빠르고, MAI-Voice-1은 한 초에 60초의 오디오를 생성할 수 있으며, 모든 모델의 가격은 구글/오픈아이 모델보다 저렴하다는 점에서 이번 발표는 Microsoft가 AI 시장에서 독자적인 위치를 차지하기 위한 중요한 단계임을 보여준다.

무슨 일이 일어났나

Microsoft의 AI 연구소 MAI(Microsoft AI)는 2026년 4월 2일 세 가지 새로운 기반 AI 모델을 공개했다. MAI-Transcribe-1은 25개 언어의 음성을 텍스트로 변환하는 모델로, Azure Fast보다 2.5배 빠르다고 밝혔다. MAI-Voice-1은 오디오 생성 모델로, 사용자가 한 초에 60초의 오디오를 생성하고 커스텀 음성을 만들 수 있다. MAI-Image-2는 비디오 생성 모델로, 이전에 MAI Playground에서 발표된 후 Microsoft Foundry와 함께 공개됐다. 모든 모델은 MAI Superintelligence 팀(마스타파 Suleyman이 총괄하는 AI 연구팀)이 개발했으며, "인간을 중심으로 하는 인류주의 AI"를 목표로 한다. 특히 이번 모델들은 구글과 오픈아이 모델보다 저렴한 가격(예: MAI-Transcribe-1은 1시간당 $0.36, MAI-Voice-1은 100만 문자당 $22)을 제공하며 비용 절감에 기여할 것으로 예상된다.

왜 중요한가

이번 발표는 사용자와 개발자에게 직접적인 영향을 미칠 수 있다. 특히 MAI-Transcribe-1의 빠른 속도와 저렴한 가격은 기업이 대규모 음성 데이터 처리에 더 많이 투자할 가능성을 높일 수 있으며, MAI-Voice-1은 개인이 커스텀 음성을 만들어 소프트웨어나 앱에서 사용하는 데 도움이 될 것이다. 또한 Microsoft가 오픈아이와의 파트너십을 유지하면서도 독자적인 AI 모델을 출시함으로써, 구글과 경쟁에서 더 강력하게 나설 수 있을 것이라는 시장 전망에 기여한다.

내가 보기엔

Microsoft의 이번 발표는 "오픈아이와 파트너십을 유지하면서도 독자적인 AI 모델을 출시"라는 점에서 흥미롭다. 특히 MAI Superintelligence 팀의 "인간 중심" 전략은 다른 기업과 비교해 새로운 접근 방식이며, 저렴한 가격은 AI를 더 많은 사람들이 사용할 수 있도록 만들 것이다. 하지만 오픈아이와의 파트너십을 유지하면서 독자적인 모델을 출시하는 것은 어떤 의미인지에 대한 질문이 생긴다. Microsoft가 오픈아이의 기술을 활용한 후, 다시 독자적인 AI 연구를 진행할 수 있도록 파트너십 조건이 변경된 것일까? 이는 향후 AI 시장에서 Microsoft의 역할에 대한 중요한 징표가 될 것이다.

자주 묻는 질문

Q: MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2는 무엇인지 간단히 설명해줘. A: Microsoft이 새로 출시한 세 가지 기반 AI 모델이다. MAI-Transcribe-1은 25개 언어의 음성을 텍스트로 변환하는데, Azure Fast보다 2.5배 빠르고 저렴하다. MAI-Voice-1은 한 초에 60초의 오디오를 생성하고 커스텀 음성 만들기도 가능하며, MAI-Image-2는 비디오 생성 모델로 이미지 입력으로 비디오를 만들 수 있다.

Q: 이번 발표가 사용자에게 어떤 영향을 미칠까? A: 특히 MAI-Transcribe-1의 빠른 속도와 저렴한 가격(1시간당 $0.36)은 기업이 대규모 음성 데이터 처리에 더 많이 투자할 수 있게 해주며, MAI-Voice-1은 개인이 커스텀 음성을 만들어 소프트웨어나 앱에서 사용하는 데 도움이 된다. 또한 모든 모델의 가격이 구글/오픈아이보다 저렴하므로, AI를 더 많은 사람들이 접근할 수 있게 될 것이다.

Q: Microsoft가 오픈아이와 파트너십을 유지하면서도 독자적인 모델을 출시하는 것의 의미는 무엇인가? A: 이는 Microsoft가 오픈아이의 기술을 활용한 후, 다시 독자적인 AI 연구를 진행할 수 있도록 파트너십 조건이 변경된 것일 가능성이 높다. 특히 MAI Superintelligence 팀의 "인간 중심" 전략은 다른 기업과 비교해 새로운 접근 방식이며, 향후 AI 시장에서 Microsoft의 역할에 대한 중요한 징표가 될 것이다.


이 글은 TechCrunch의 보도를 바탕으로 작성되었습니다.