<잇(IT)터뷰 전체 영상 보기>
잇(IT)터뷰 전체 내용은 ▼아래 영상▼에서 확인해 주세요!
◼ 게스트 : 김홍필 이사 / AMD
◼ 진행자 : 고우성 PD / 토크아이티 (wsko@talkit.tv, https://talkit.tv/)
영상 목차
◼ 아래 각 목차를 클릭하시면 해당 내용을 영상으로 바로 보실 수 있습니다.
✔ 대형 AI서비스 기업에 집중
✔ 샘 알트만의 AMD 평가
✔ 고성장 AI 인퍼런스 시장에 집중
✔ AI 트레이닝을 위한 시스템 레퍼런스
✔ 오픈소스 기반 차세대 네트워킹 기술
✔ 오픈소스 생태계기반 개발환경 조성
<잇(IT)터뷰 – 핵심 내용 파악하기>
‘잇(IT)터뷰 – 핵심 내용 파악하기’는 영상의 핵심 내용을 정리한 글입니다.
|
이번 잇(IT)터뷰는 AMD가 서버 CPU 시장에서 인텔을 추격한 것처럼 GPU 시장에서도 엔비디아를 위협할 수 있을지 분석합니다. AMD의 AI 시장 전략과 핵심 기술력을 통해 향후 5년 내 GPU 경쟁 구도 변화 가능성을 예측합니다.
올가을 출시 예정인 MI350 GPU는 현존 최대 메모리 288GB를 제공하여 OpenAI 같은 대형 AI 서비스 기업에게 가성비 좋은 솔루션을 제공합니다. 이를 통해 AI 서비스의 원가 절감과 더 많은 토큰 처리가 가능해집니다. 오픈소스 기반 네트워킹 기술과 개발 환경 조성을 통해 엔비디아의 독점적 생태계에 대응하는 AMD의 차별화된 접근법을 살펴봅니다.
1. 대형 AI서비스 기업에 집중
AMD는 서버 CPU 시장에서 인텔을 추격한 전략을 GPU 시장에서도 반복하고 있다. AWS, Microsoft 같은 클라우드 서비스 제공업체에게 더 적은 전력으로 더 많은 VM을 생성할 수 있는 가성비를 제공했듯이, AI 시장에서도 OpenAI 같은 대형 AI 서비스 기업을 주요 타겟으로 한다.
올가을 출시 예정인 MI350은 현존 최대 메모리인 288GB를 제공하여 엔비디아 H100 대비 1.5배 이상의 메모리 용량을 자랑한다. 이를 통해 AI 서비스 기업들이 동일한 비용으로 훨씬 더 많은 토큰을 처리할 수 있게 되어 AI 서비스의 원가 절감 효과를 가져온다.
2. 샘 알트만의 AMD 평가와 전략적 파트너십
AMD의 전략적 접근이 얼마나 효과적인지는 OpenAI 샘 알트만 CEO의 공개적 지지에서 확인할 수 있다. 몇 주 전 AMD Advancing AI 2025 컨퍼런스에서 알트만은 몇 년 전부터 AMD에게 제품 피드백을 제공해왔다고 밝혔다.
특히 차세대 추론 모델들의 긴 롤아웃 특성상 막대한 컴퓨팅 파워와 메모리가 필요한 상황에서 MI350 시리즈의 메모리 아키텍처가 인퍼런스에 매우 적합하며 트레이닝에도 훌륭한 옵션이 될 것이라고 평가했다. 초기 스펙 제안을 받았을 때 “불가능할 것”이라고 생각했을 정도로 혁신적인 사양이었다고 언급하며 AMD 제품에 대한 기대감을 표현했다.
3. 고성장 AI 인퍼런스 시장에 집중
AMD는 전략적으로 AI 인퍼런스 시장에 집중하고 있다. 현재 AI 시장에서 트레이닝과 인퍼런스가 합쳐서 60%를 차지하지만, 향후에는 인퍼런스 시장이 더 급격히 성장할 것으로 예상된다.
베이스 모델들이 이미 충분히 훌륭하게 구축되었고, 앞으로는 파인튜닝이나 추가 학습 정도로 유지되면서 실제 유료 서비스 제공을 위한 인퍼런스 자원이 더 많이 필요할 것으로 전망된다. 개인 사용자들이 AI 서비스에 돈을 지불하기 시작한 현재 상황에서 인퍼런스 시장의 폭발적 성장이 예상되며, AMD는 이 시장에서의 기회를 선점하기 위해 전략을 집중하고 있다.
4. AI 트레이닝을 위한 시스템 레퍼런스
엔비디아가 DGX 서버로 시스템 레벨 접근을 통해 기업 시장에서 크게 성장한 것처럼, AMD도 유사한 접근법을 시작했다. 개별 GPU 판매가 아닌 최적화된 시스템 레퍼런스를 제공하여 최대 96개 또는 128개 GPU까지 확장 가능한 설계를 제안한다.
이는 각 서버 제조사별로 개별적인 최적화 지원을 해야 하는 부담을 줄이고, 표준 아키텍처를 통해 시장 접근성을 높이려는 전략이다. MI350 시리즈 출시와 함께 레퍼런스 아키텍처를 처음으로 제안하며, 향후 새로운 대형 클러스터 시장 진입을 위한 발판을 마련하고 있다.
5. 오픈소스 기반 차세대 네트워킹 기술
AMD는 엔비디아의 독점적 네트워킹 기술에 대응하기 위해 오픈소스 기반의 스마트한 전략을 구사하고 있다. Ultra Accelerator Link(UAL)라는 오픈 규격을 통해 여러 GPU를 하나의 GPU처럼 연결하는 스케일업 네트워킹 기술을 개발하고 있으며, 이는 내년 MI450과 함께 출시될 예정이다.
또한 기존의 독점적인 InfiniBand를 대체하는 Ultra Ethernet 기술을 통해 오픈 컨소시엄 기반의 고대역폭 연결 기술을 제공한다. RDMA over Converged Ethernet v2 프로토콜로 400Gbps까지 AI 서버들을 연결할 수 있는 네트워크 카드를 이미 출시했으며, AMD 솔루션에 최적화를 진행하고 있다.
6. 오픈소스 생태계기반 개발환경 조성
소프트웨어 측면에서 AMD는 ROCm이라는 오픈소스 기반 통합 소프트웨어 스택을 제공한다. 이는 AMD GPU 구동을 위해 필요한 모든 소프트웨어 구성요소들을 포함하고 있으며, PyTorch 같은 주요 AI 프레임워크들이 CUDA와 동등한 수준으로 ROCm을 지원한다.
또한 Triton 오픈소스 AI 컴파일러를 통해 하드웨어 독립적인 다양한 플랫폼 호환성을 확보하고 있으며, Hugging Face에 올라온 180만 개의 AI 모델이 당장 AMD에서 구동 가능하다. 또한 vLLM, SGLang 등 LLM 서빙 프레임워크들을 적극 최적화하여 인퍼런스 시장의 확산을 가속화하고 있다.
이러한 광범위한 오픈소스 생태계 지원을 통해 개발자들의 진입 장벽을 낮추고 AMD GPU의 활용도를 높이려는 전략을 구사하고 있다.
◼ 전체 잇(IT)터뷰 내용은 ▶영상으로 바로 가기(클릭)◀에서 확인하실 수 있습니다.
|
◼ 콘텐츠 & 웨비나 문의 : marketing@talkit.tv, 02-565-0012
Copyright ⓒ 토크아이티 All rights reserved. 무단 전재 및 재배포 금지.