Google Cloud이 NVIDIA와 맞서기 위해 두 개의 신규 TPU 칩을 공격적으로 선보인다

핵심 요약: Google Cloud가 NVIDIA와 맞서기 위해 8세대 TPU를 분할 발표했습니다. 훈련용 TPU 8t와 추론용 TPU 8i로 구분되어 모델 훈련 속도를 최대 3배 향상하고 비용 대비 성능을 80% 개선하며 클러스터 내 100만개 이상의 칩을 동시에 사용할 수 있게 되었습니다. NVIDIA와는 현재 완전히 대결하는 것이 아니라, 기존 NVIDIA 기반 시스템과 함께 제공될 것입니다.

[도입부 - 2-3문장으로 강렬하게!] NVIDIA가 AI 칩 시장의 독점적인 지위를 유지하고 있었는데, 이제 Google Cloud이 그에 맞서기 위해 두 개의 신규 TPU 칩을 공격적으로 선보였습니다. 예상 못했어요? 기존의 TPU가 NVIDIA의 GPU와 경쟁하기에는 부족했다고 생각했던 사람들을 위협하는 새로운 강자가 나타났습니다.

무슨 일이 일어났나

[본문 - 깊이 있는 스토리텔링!] Google Cloud는 22일(수)에 자사의 8세대 고유 AI 칩인 텐서 처리 장치(TPU)를 두 개로 분할 발표했습니다. 하나는 모델 훈련을 위한 TPU 8t, 다른 하나는 추론을 위한 TPU 8i입니다. 추론은 사용자가 프롬프트를 제출한 후의 모델의 지속적인 사용을 의미합니다. 회사는 이전 세대와 비교했을 때 놀라운 성능 spec을 자랑하고 있습니다: 최대 3배 빠른 AI 모델 훈련, 1달러당 80% 더 높은 성능, 그리고 단일 클러스터 내에서 100만 개 이상의 TPU를 동시에 사용할 수 있도록 하는 기능입니다. 결과적으로 고객에게는 더 많은 계산 능력을 더 적은 에너지와 비용으로 제공될 것입니다. Google은 칩 이름이 '텐서'로 처음 명명되었기 때문에 TPU라고 부르지만, 이러한 칩들은 NVIDIA의 GPU와는 다릅니다.

Google의 칩은 현재까지 NVIDIA의 미래를 직접적으로 공격하는 전면적인 공세가 아니며, Microsoft나 Amazon과 같은 다른 거대 클라우드 제공자들처럼 NVIDIA 기반 시스템을 자사 인프라에서 보충할 것입니다. 완전히 NVIDIA를 대체하지는 않습니다. 실제로 Google은 올해 후반에 NVIDIA의 최신 칩인 Vera Rubin이 사용 가능하다고 약속합니다. 하지만 hyperscalers(아마존, Microsoft, Google 포함)가 자사 칩을 구축하는 일일 경우, 기업들이 자사 클라우드로 AI 요구를 이전하고 애플리케이션을 이러한 칩으로 이식하면 NVIDIA에 대한 의존도가 점점 줄어들 것입니다. 여전히 현재 상황에서는 NVIDIA를 배당하지 않기 어려운 것이 현실입니다.

Google은 또한 NVIDIA와 컴퓨터 네트워킹을 공동 개발하기로 합의했습니다. 특히 Google이 2023년에 오픈 소스 데이터 센터 하드웨어 조직인 Open Compute Project 아래에서 생성하고 오픈소스화한 Falcon이라는 소프트웨어 기반 네트워킹 기술을 강화할 것입니다.

왜 중요한가

[영향 분석 - 구체적으로!] 사용자나 개발자, 그리고 비즈니스에게는 더 많은 계산 능력과 낮은 비용으로 AI 작업을 처리할 수 있다는 점이 가장 큰 영향입니다. 80%의 비용 대비 성능 향상은 기업들이 더 많은 컴퓨팅 자원을 사용하지 않아도 모델 훈련과 추론 작업에 대한 비용을 줄일 수 있게 합니다. NVIDIA와 경쟁하는 것은 아니지만, hyperscalers가 자사 칩을 개발하면서 시장에서 NVIDIA의 독점적인 지위를 위협할 수 있는 긴급한 신호입니다.

내가 보기엔

[분석 - YOUR unique take!] 이번 발표는 Google이 AI 클라우드 제공자로서의 역량을 강화하는 데 있어 중요한 단계입니다. 3배 빠른 훈련 속도와 낮은 비용 대비 성능은 큰 장점이지만, NVIDIA가 여전히 시장에서 독보적인 지위를 유지하고 있다는 점을 고려하면, 완전한 대결이 아닌 보충 전략이라는 것을 명확하게 알 수 있습니다. Google과 NVIDIA의 협력은 긍정적이지만, 장기적으로는 hyperscalers가 자사 칩을 통해 NVIDIA에 대한 의존도를 줄여나갈 가능성이 높습니다.

자주 묻는 질문

Q: Google Cloud의 신규 TPU 칩은 무엇인가요? A: Google Cloud의 8세대 텐서 처리 장치(TPU)로, 모델 훈련을 위한 TPU 8t와 추론을 위한 TPU 8i로 분할되어 있습니다. TPU 8t는 이전 세대보다 최대 3배 빠른 모델 훈련 속도를 제공합니다. Q: 이 발표가 사용자나 개발자에게 어떤 영향을 미칠까요? A: Google Cloud의 AI 서비스를 사용하는 경우, 모델 훈련과 추론 작업에 대한 성능이 향상되고 비용이 줄어들 것입니다. 1달러당 80% 더 높은 성능 개선으로 기업들은 더 많은 컴퓨팅 자원을 사용하지 않아도 비용을 절감할 수 있습니다. Q: NVIDIA가 대체될까요? 앞으로 어떤 일이 일어날까요? A: 현재까지는 아닙니다. Google은 기존의 NVIDIA 기반 시스템과 함께 제공될 것이며, 장기적으로 hyperscalers가 자사 칩을 통해 NVIDIA에 대한 의존도를 줄여나갈 가능성이 높습니다.

이 글은 TechCrunch의 보도를 바탕으로 작성되었습니다.