Notice
Recent Posts
Recent Comments
Link
관리 메뉴

Asia-Pacific Region Intelligence Center

GPU(Graphic Processing Unit, 그래픽처리장치) 본문

Guide Ear&Bird's Eye6/산업의 쌀 반도체(5G. 인공지능, 자율주행. 태양광 재생에너지 등 )

GPU(Graphic Processing Unit, 그래픽처리장치)

CIA bear 허관(許灌) 2023. 9. 10. 05:46

GPU(그래픽처리장치)는 그래픽 처리를 위한 그래픽 카드의 핵심부품이다. GPU는 CPU를 보조하기 위한 부품으로 등장했으나 4차 산업혁명과 더불어 중요성이 증대됐다. 2010년 AI 분야 석학인 앤드루 응 스탠퍼드대 교수는 12개의 GPU가 무려 2000개의 CPU에 맞먹는 딥 러닝(deep learning) 성능을 발휘한다는 사실을 발견했다. 딥 러닝을 구현하려면 방대한 양의 정보를 한꺼번에 처리할 수 있어야 한다. CPU는 명령어가 입력된 순서대로 순차적으로 데이터를 처리한다. 반면 GPU는 수백에서 수천 개의 코어가 들어가 있어 대량의 데이터를 빠르게 처리할 수 있다.

챗gpt시대, GPU가 왜 중요한가?

H100 GPU [사진출처=엔비디아]

챗gpt, 생성형 AI와 관련하여 항상 화두가 되고 있는 것이 있다. GPU가 바로 그것이다. 이 칩은 생성 AI의 핵심이라 할 수 있는 대형언어모델(LLM)의 학습과 운영을 담당하고 있기 때문이다. 오래전부터 그래픽카드용 칩 제조회사의 선두주자인 엔비디아(NVIDIA)가 생성 AI용 GPU H100을 내 놓으면서 이 회사의 주식에 전 세계 투자자의 관심이 몰리게 된 것은 당연지사라 할 수 있다.

더구나 글로벌 LLM 업체인 MS, 구글, 메타, 테슬라, 아마존을 포함한 전 세계 LLM 업체들이 경쟁적으로 대규모 컴퓨팅 시스템을 구축하면서 GPU 칩은 심각한 부족한 현상을 일으키고 있는 실정이다. 이번 칼럼에서는 CPU와 GPU의 차이, GPU의 개발 역사와 활용부문 그리고 미래전망 등에 대해 살펴보고자 한다,

우선 CPU(중앙 처리 장치)와 GPU(그래픽 처리 장치)의 기능과 차이점에 대해 살펴보자.

첫 번째, 기능과 아키텍처 부분에서 CPU는 순차적인 실행이 필요한 범용 처리 및 처리 작업을 위해 설계되었다. 일반적으로 복잡한 계산 및 의사 결정에 최적화된 몇 개의 코어가 있다. GPU는 병렬 처리를 처리하는 데 특화되어 그래픽 렌더링과 동시에 수행할 수 있는 연산에 적합하다. 동시 실행을 위해 설계된 수백 또는 수천 개의 더 작은 코어가 포함되어 있다.

두 번째, 성능 및 효율성 측면에서는 높은 수준의 논리와 복잡한 명령이 필요한 작업에 탁월한 CPU는 대부분의 소프트웨어 응용 프로그램을 정확하게 처리할 수 있지만 대규모 병렬 계산에 어려움을 겪을 수 있다. 반면에 GPU는 이미지의 픽셀을 렌더링하거나 기계 학습에서 신경망을 훈련하는 것과 같이 많은 더 작은 병렬 작업으로 분해될 수 있는 작업에 이상적이다. GPU의 아키텍처는 CPU에 비해 이러한 작업을 더 효율적으로 수행할 수 있도록 한다.

세 번째, 사용 및 응용분야에서는 CPU는 범용 적이고 운영 체제, 사용자 인터페이스 및 다양한 애플리케이션을 실행할 수 있다. 복잡한 알고리즘과 제어 구조가 필요한 작업에 적합하다. GPU는 주로 이미지를 렌더링하고 비디오를 처리하는 데 활용된다. 그러나 병렬 처리 기능은 딥 러닝 및 과학 시뮬레이션과 같은 분야에서 차별화된 가치가 발휘되고 있다.

요약하면, CPU는 범용의 순차적 작업을 처리하는 데 강점이 있는 반면, GPU의 아키텍처는 그래픽스 및 데이터 집약적 계산 같은 병렬 처리에 더 적합하다.

이번에는 GPU가 발전해 온 과정에 대해서 알아보자.

1980년대 초는 그래픽 가속기가 탄생 되는 시기였다. 1981년 IBM은 모노크롬 디스플레이 어댑터(MDA)와 컬러 그래픽 어댑터(CGA)를 도입하여 그래픽 하드웨어의 길을 열었다. 1982년에 최초의 3D 그래픽 가속기인 지오메트리 엔진이 스탠포드 대학에서 개발되었다.

1980년대 후반에는 3D 그래픽이 등장했다. 1986년 프린스턴 대학교에서 그래픽 인터페이스 프로세서(GRIP)가 설계되었으며, 이후 3D 그래픽 기술 발전에 매우 중요한 전환점이 되었다. SGI(Silicon Graphics Inc.)는 이 기간 동안 고급 3D 그래픽 워크스테이션을 시장에 내놓았다.

1990년대에 드디어 GPU가 세상에 나오게 되었는데 1995년 엔비디아가 설립되었으며, 1997년 RIVA 128을 처음 선보였다. "GPU"라는 용어는 1999년 지포스 256의 출시와 함께 엔비디아에 의해 대중화되었다. 이는 변환과 가벼운 계산을 모두 처리할 수 있는 세계 최초의 GPU로서 시판되었다.

2000년대 들어서는 확장성 및 프로그래밍 가능성이 돋보이는 시기였다. 2000년대 초반, DirectX와 OpenGL 표준은 그래픽 프로그래밍 발전을 도왔다. 2002년 엔비디아가 CG 프로그래밍 언어를 도입하고 ATI(현재 AMD의 일부)가 라데온 R300을 출시하면서 GPU는 더욱 강력하게 프로그래밍이 가능하게 되었다. 2006년 엔비디아에 의해 CUDA(Compute Unified Device Architecture)가 도입되었는데 이는 개발자들이 범용 컴퓨팅을 위해 GPU를 사용할 수 있게 해주었다.

2010년대는 통합과 광선 추적, 딥 러닝의 시기인데 2011년 AMD의 퓨전 APU에서 보듯이 CPU와 GPU를 하나의 칩으로 통합하는 것이 일반화 되었었다. 2018년 엔비디아의 튜링 아키텍처를 통해 포토리얼리즘 그래픽을 구현하는 기술인 실시간 광선 추적이 가능해졌다. 딥러닝과 인공지능(AI)에서 GPU는 필수가 되었으며, 구글의 TPU(Tensor Processing Unit), 엔비디아의 볼타(Volta) 등 다양한 아키텍처가 AI 워크로드를 위해 설계되었다.

2020년대 들어서서는 지속적으로 혁신과 전문화가 이루어져 전용 광선 추적 코어의 개발, AI 가속화 및 에너지 효율성 등과 같이 GPU 한계 능력을 계속해서 넘어섰다. 특정 산업분야, 애플리케이션, 심지어 클라우드 기반 GPU 서비스에 맞춘 특화된 GPU도 크게 확산 보급되었다. 특히 엔비디아가 2022년 10월, 생성 AI시장에서 메인 칩으로 각광받고 있는 H100 GPU 모듈을 출시했는데 이는 호퍼 아키텍처 기반의 최신 GPU 시스템이었다.

이 GPU는 최대 256개까지 연결해 엑사 스케일 작업을 가속화할 수 있는 것이 특징적이다. 전용 트랜스포머 엔진으로 조 단위 매개변수를 가진 대형언어모델(LLM)을 처리하는 주요 역할을 한다. 참고로 오픈AI의 챗gpt에 개발에 활용된 슈퍼컴퓨터에는 H100보다 성능이 다소 떨어지는 암페어 아키텍처 기반의 A100 모듈 1만개를 적용하였다.

이와 더불어 엔비디아는 지난 8월초 ‘GH200’이라는 획기적인 AI용 슈퍼 칩의 세부사양을 공개하고 2024년 2분기부터 양산에 들어간다고 예고한 바 있다. GH200은 256개의 NVIDIA Grace Hopper 슈퍼 칩에 걸쳐 144TB의 대용량 공유 메모리 공간을 제공하는 AI용 슈퍼 칩이라고 한다. 동일한 회로 기판에서 NVIDIA Grace CPU와 NVIDIA Hopper GPU를 결합하여 대역폭을 7배 증가시키고 상호 연결 전력 소비를 5배 이상 줄일 수 있다고 한다.

GPU 시장에서는 엔비디아가 대항마 없이 독점적 위치를 확고히 다지고 있는 상황인데 그나마 AMD가 엔비디아를 추적하려고 안간힘을 쏟고 있는 중이다. 특히 엔비디아가 수출하지 못하고 있는 중국 시장을 겨냥한 GPU 개발에 입맛을 다시고 있다는 소식도 들려온다. 한편 GPU와는 별도로 AI용 필수 메모리인 '고대역폭메모리(HBM)‘ 부분에서 우리나라의 SK하이닉스와 삼성전자는 미국의 마이크론과 함께 치열한 경쟁을 하고 있는 실정이다.

GPU는 인공지능 시장뿐만 아니라 데이터 센터, 자율주행차 등 다양한 분야에서 활용되고 있다. 또한 GPU의 발전으로 레이 트레이싱, 메타버스, 심층 신경망, 자연어 처리 등의 기술 구현이 쉽게 이루어지게 되었다. 특히 레이 트레이싱 기술은 광선을 역추적하여 장면과 객체의 조명 환경을 사실적으로 시뮬레이션 하는 그래픽 렌더링 기술인데 이는 연산 집약적인 기술이기 때문에 고성능 GPU가 필수적이다. 이 기술로 반사, 굴절, 그림자, 간접 조명 등의 효과를 실시간으로 렌더링할 수 있어 게임, 애니메이션, 영화 등의 분야에서 현실감 있는 그래픽을 만드는데 사용되고 있다.

GPU 시장은 2021년 42조 원 대비 2030년까지 약 596조 원으로 성장할 것으로 예측되며, GPU 기술은 미래 산업에 혁신적인 영향을 미칠 것이 분명하다. 다만 한 개의 독점적인 회사에만 의존하는 시장 형태에서 탈피하여 경쟁적인 구도로 신속히 자리 잡아야 할 것이다, 그래야 지금처럼 GPU 칩 가격이 30% 가까이 상승해도 구하기 어려운 비정상적인 시장형태가 사라질 것이기 때문이다.

챗gpt시대, GPU가 왜 중요한가? < 칼럼 < 기사본문 - 한국강사신문 (lecturernews.com)

 

챗gpt시대, GPU가 왜 중요한가? - 한국강사신문

[한국강사신문 이용호 칼럼니스트] 챗gpt, 생성형 AI와 관련하여 항상 화두가 되고 있는 것이 있다. GPU가 바로 그것이다. 이 칩은 생성 AI의 핵심이라 할 수 있는 대형언어모델(LLM)의 학습과 운영을

www.lecturernews.com

CPU와 GPU 비교: 차이점 알아보기

CPUGPU: 두 가지 모두를 활용

중앙 처리 장치(CPU)와 그래픽 처리 장치(GPU)는 기본적인 컴퓨팅 엔진입니다. 그러나 컴퓨팅 요구가 변화하면서 CPUGPU의 차이점과 각각에 가장 적합한 워크로드가 무엇인지를 항상 명확하게 구분 지을 수 없게 되었습니다.

 

현대의 시스템은 딥 러닝 응용 프로그램, 대규모 병렬 처리, 고사양 3D 게이밍, 기타 까다로운 워크로드 등을 비롯하여 그 어느 때보다도 많은 작업을 수행해야 합니다. 중앙 처리 장치(CPU)와 그래픽 처리 장치(GPU)의 역할은 매우 다릅니다. CPU는 어느 용도로 사용됩니까? GPU는 어느 용도로 사용됩니까? 새로운 컴퓨터를 구매하고 사양을 비교할 때 각 장치의 역할을 아는 것이 중요합니다.

 

CPU란 무엇입니까?

수백만 개의 트랜지스터로 구축된 CPU는 여러 개의 프로세싱 코어를 갖추고 있으며 보통 컴퓨터의 뇌로 간주됩니다. CPU는 컴퓨터 및 운영 체제에 필요한 명령과 처리를 실행하므로 모든 현대 컴퓨팅 시스템에 필수적인 요소입니다. 또한, CPU는 웹 서핑에서 스프레드시트 제작에 이르는 프로그램의 실행 속도를 결정하는 데도 중요하게 작용합니다.

 

GPU란 무엇입니까?

GPU는 더 작고 보다 전문화된 코어로 구성된 프로세서입니다. 여러 개의 코어가 함께 작동하므로, 여러 코어로 나누어 처리할 수 있는 작업의 경우 GPU가 엄청난 성능 이점을 제공합니다.

 

CPU와 GPU의 차이점은 무엇입니까?

CPU와 GPU는 서로 공통점이 많습니다. 둘 다 아주 중요한 컴퓨팅 엔진입니다. 둘 다 실리콘 기반 마이크로프로세서입니다. 그리고 둘 다 데이터를 처리합니다. 하지만 CPU와 GPU는 아키텍처가 다르며 만들어진 용도가 다릅니다.

CPU는 다양한 워크로드, 특히 대기 시간이나 코어당 성능이 중요한 워크로드에 적합합니다. CPU는 강력한 실행 엔진으로서 코어 수가 적으며 개별적인 작업과 신속한 작업 처리에 이러한 코어를 집중합니다. 이 때문에 연속적인 컴퓨팅이나 데이터베이스 실행과 같은 작업에 적합합니다.

GPU는 특정 3D 렌더링 작업 속도를 단축하기 위해 개발된 전문 ASIC로 시작했습니다. 시간이 지나면서 이러한 고정된 기능의 엔진의 프로그래밍이 더욱더 수월해졌으며 융통성도 높아졌습니다. GPU의 주요 기능은 여전히 최신 인기 게임의 그래픽과 점점 생생해지는 비주얼이긴 하지만, 최근에는 범용적인 병렬 프로세서로도 발전하여 점점 더 다양한 응용 프로그램을 처리하고 있습니다.

 

통합 그래픽이란 무엇입니까?

통합 또는 공유 그래픽은 CPU와 동일한 칩에 탑재됩니다. 특정 CPU는 전용 또는 별도 그래픽에 의존하는 대신 내장 GPU를 제공할 수 있습니다.

통합 그래픽 프로세서는 여러 이점을 제공합니다. CPU와 통합으로 전용 그래픽 프로세서를 사용할 때보다 공간, 비용 및 에너지 효율이 높아집니다. 통합 그래픽 프로세서는 그래픽 관련 데이터 처리와 웹 탐색, 4K 영화 스트리밍, 캐주얼 게이밍과 같은 일반적인 작업 수행에 필요한 강력한 성능을 제공합니다.

이러한 접근 방식은 노트북, 태블릿, 스마트폰 및 일부 데스크탑과 같이 작은 크기와 에너지 효율이 중요한 장치에 가장 많이 채택됩니다.

 

딥 러닝 및 AI 가속화

현대에는 딥 러닝 및 인공 지능(AI)와 같이 점점 더 많은 워크로드가 GPU에서 실행됩니다. GPU 또는 기타 가속기는 신경망 계층 또는 2D 이미지와 같은 대규모의 특정 데이터 세트에 대한 딥 러닝 훈련에 적합합니다.

딥 러닝 알고리즘은 GPU 가속화 접근 방식을 채택하도록 발전했습니다. 가속화를 통해 이 알고리즘을 성능이 크게 향상되고 여러 가지 실제 문제에 대한 훈련을 최초로 실용적이고 실행 가능한 범위로 맞출 수 있게 되었습니다.

CPU와 CPU에서 실행되는 소프트웨어 라이브러리는 시간의 흐름에 따라 딥 러닝 작업을 더욱 원활하게 수행할 수 있도록 발전했습니다. 예를 들어 광범위한 소프트웨어 최적화와 최신 인텔® 제온® 스케일러블 프로세서의 Intel® Deep Learning Boost(Intel® DL Boost)와 같은 전용 AI 하드웨어의 추가를 통해 CPU 기반 시스템은 딥 러닝 성능의 개선을 누렸습니다.

언어, 문자 및 시계열 데이터에 대한 고해상도, 3D 및 비이미지 기반 딥 러닝과 같은 다양한 응용 프로그램의 경우 CPU가 우수한 성능을 제공합니다. CPU는 현대의 그 어떤 GPU와도 비교할 수 없는 많은 메모리 용량을 지원하여 복잡한 모델 또는 딥 러닝 응용 프로그램(예: 2D 이미지 감지)에 필요한 성능을 제공합니다.

CPU와 GPU의 조합, 거기에 충분한 RAM을 더하면 딥 러닝 및 AI에 알맞은 테스트베드를 구축할 수 있습니다.

 

수십 년간 CPU 개발 분야를 선두해온 리더십

인텔은 1971년 단일 칩에 완전히 통합된 최초의 상용 마이크로프로세서인 4004를 도입한 이래로 CPU 혁신을 위한 오랜 역사를 쌓아왔습니다.

오늘날에는 인텔® CPU을 통해 잘 알려진 x86 아키텍처에서 사용자가 원하는 AI를 원하는 위치에 구축할 수 있습니다. 데이터 센터 및 클라우드에서의 고성능 인텔® 제온® 스케일러블 프로세서에서 에지에서의 전력 효율적인 인텔® 코어™에 이르기까지, 인텔은 모든 요구 사항에 맞는 CPU를 제공합니다.

 

13세대 인텔® 코어™ 프로세서의 지능적인 성능

13세대 인텔® 코어™ 프로세서는 업계 최고의 도구로 더 빠른 Performance-core(P-core)와 더 많은 Efficient-core(E-core)의 성능 하이브리드 아키텍처를 활용하여 성능 및 멀티태스킹 기능을 극대화합니다.

인텔 Xe 아키텍처 기반 최초의 별도 GPU인 인텔® Iris® Xe 그래픽 또는 인텔® Iris® Xe MAX 전용 그래픽을 포함한 13세대 인텔 코어 프로세서 기반 노트북을 선택하십시오. 인텔® Iris® Xe MAX 전용 그래픽을 통해 얇고 가벼운 노트북에서 콘텐츠 제작 및 게이밍 향상을 위해 더욱 개선된 성능과 새로운 기능을 비롯한 혁신적인 발전을 경험할 수 있습니다.

인텔® Iris® Xe 그래픽에는 Intel® Deep Learning Boost 기반 AI가 탑재되어 사진 및 비디오 편집과 같은 콘텐츠 제작이 향상되며, 저전력 아키텍처로 배터리 수명이 늘어납니다.

 

인텔 개별 GPU

인텔은 세 가지 별도 GPU 옵션을 제공합니다.

인텔® Iris® Xe MAX 전용 그래픽은 노트북과 데스크탑을 위한 그래픽 카드 옵션을 갖춘 별도 GPU입니다. Xe 아키텍처를 기반으로, 향상된 콘텐츠 제작 및 게이밍을 위한 인텔® Arc™ 제어 센터와 같은 훨씬 더 많은 성능과 새로운 기능을 이용할 수 있습니다.

Intel® Data Center GPU는 AI, 렌더링, 분석 및 시뮬레이션과 같은 최신 기술을 지원하는 GPU입니다. 또한 데이터 센터 CPU에 강력한 병렬 처리 기능을 추가합니다.

최신 고성능 그래픽 솔루션 인텔® Arc™ 그래픽으로 눈을 뗄 수 없는 콘텐츠를 제작하고, 시청자의 마음을 사로잡고, 게임 환경을 강화하십시오. Xe HPG 마이크로 아키텍처로 구축된 인텔 Arc 그래픽은 노트북, 데스크탑 및 전문 워크스테이션을 위한 내장 머신 러닝, 그래픽 가속 및 광선 추적 하드웨어를 활성화합니다.

현대에는 CPU와 GPU의 성능을 비교하는 것은 무의미합니다. 다양한 컴퓨팅 요구 사항을 충족하기 위해서는 두 처리 장치를 조합하는 것이 그 어느 때보다도 중요합니다. 최적의 결과는 해당 작업에 적합한 도구를 사용할 때 비로소 얻을 수 있습니다.

엔비디아, 인텔과 CPU 경쟁 가세…GPU와 CPU를 하나로 만든다

엔비디아, 인텔 등 반도체 업체들이 GPU와 CPU를 동시에 만들면서 성능을 극대화하고 있다. 사진=닛케이

AI반도체 붐을 타고 GPU(그래픽처리장치)와 CPU(중앙연산처리장치)의 경계가 사라지고 있다. 그동안 인텔은 CPU, 엔비디아는 GPU에 강점을 가지며 거의 시장을 독식하디시피 했다.

그런데 인공지능(AI) 열풍으로 데이터센터용 고성능 반도체 수요가 급증하면서 CPU 최대 업체인 미국 인텔과 GPU 최대 업체인 미국 엔비디아가 성능 향상을 위해 서로의 강점을 잠식하기 시작했다고 닛케이가 28일(현지 시간) 보도했다. 반도체 2강이 시장을 양분하는 독점 시대가 끝을 향해 가고 있는 것이다.

젠슨 황 엔비디아 최고경영자(CEO)는 지난 8월 초 미국 로스앤젤레스에서 열린 CG(컴퓨터그래픽스) 분야 국제 컨퍼런스 '씨그래프(SIGGRAPH)' 기조연설에서 "생성 AI시대의 완전히 새로운 프로세서를 만들었다"며 데이터센터용 AI 반도체의 최신 모델을 선보였다.

미 해군의 전설적인 여성 프로그래머의 이름을 따서 '그레이스 호퍼(Grace Hopper)'라고 이름 붙인 이 AI 반도체에는 엔비디아가 처음으로 데이터센터용으로 자체 개발한 CPU를 탑재했다. 자사의 주력 GPU인 'H100'과 결합하면 AI 학습 속도를 기존 대비 약 4배 높일 수 있다고 설명했다.

고성능 GPU는 납품 1년 대기


AI의 학습에는 대량의 정보 병렬 처리에 특화된 GPU가 사용되지만, 이를 제어하는 것은 CPU다. 기존에는 둘 사이의 정보 교환에 병목현상이 발생해 GPU의 성능을 충분히 끌어내지 못하는 경우가 있었다. 그레이스 호퍼는 통신 방식을 개선해 CPU와 GPU 간 통신 속도의 상한선을 기존보다 7배 높인 것으로 알려졌다.

CPU 분야에서는 1년 6개월에서 2년 만에 소자 수가 2배로 늘어나는 '무어의 법칙'이 멈춰 있다. 엔비디아는 GPU 개선을 주도하며 생성AI의 빠른 진화를 인프라 측면에서 뒷받침해 왔다. 세계 슈퍼컴퓨터 상위 100대 중 GPU를 채택한 기종의 비율은 2018년 상반기 16%에서 2023년에는 58%로 높아졌다.

생성AI 개발 기업들 사이에서는 고성능 GPU 쟁탈전이 계속되고 있다. 엔비디아의 H100은 공급이 수요를 따라가지 못해 1년을 기다려야 하는 것으로 알려졌다. 기존 GPU를 포함해 데이터센터의 성능을 최대로 끌어올리기 위해서는 "CPU에도 궁히가 필요했다"고 엔비디아 일본 법인의 사와이 리키 씨는 말한다.

데이터센터에서는 서로 다른 개발사의 반도체를 병용하는 경우가 많아, 각사는 타사 제품과의 연결성을 중시해 왔다. 엔비디어는 이러한 관례를 깨고 그레이스 호퍼의 설계에서 자사 제품과의 연계에 중점을 두었는데, AI 반도체 수요를 석권하려는 의도가 엿보인다.

 

영국 시장조사업체 옴디아에 따르면, 엔비디아의 2022년 데이터센터용 GPU 등 세계 시장점유율은 90%에 육박한다. 또 다른 조사에서 인텔의 데이터센터용 CPU 세계 점유율은 70%였다. 이제 막 그레이스 호퍼의 양산이 시작됐지만, 엔비디아가 CPU 시장에서도 인텔의 점유율을 깎아먹을 가능성이 있다

 

인텔, 자급자족주의 포

수세에 몰린 인텔도 바로 반격에 나섰다. 지난 6월 고성능 GPU를 탑재한 데이터센터용 AI 반도체 'GPU 맥스 시리즈'를 출하하기 시작한 것. AI를 활용한 이미지 분석 등 특정 용도에서 엔비디아의 H100보다 더 높은 처리 능력을 발휘할 수 있는 것으로 알려졌다.

맥스 시리즈를 구성하는 반도체는 인텔의 7나노(나노는 10억분의 1) 미터 제품과 대만 TSMC가 제조하는 5나노미터 제품을 결합했다. 21년 만에 친정으로 돌아와 명문기업의 재건을 맡게 된 팻 겔싱어 CEO는 자급자족주의를 포기하고 엔비디아를 맹렬히 추격하고 있다.

캐나다 조사업체 프레지던트 리서치에 따르면 2023년 AI 반도체 시장 규모는 전년 대비 30% 증가한 218억 달러가 될 것으로 예상된다. 전체 반도체 시장에서 차지하는 비중은 3% 정도지만, 수급 불균형을 배경으로 고가 거래가 이어지고 있다. 스마트폰 판매 부진 등으로 반도체 시황이 악화되는 가운데 AI용은 몇 안 되는 '효자 시장'이 되고 있다.

실제로 엔비디아가 지난 23일 발표한 2023년 5~7월 결산에서 매출액 순이익률은 46%에 달했다. 현재 시가총액은 1조1000억 달러(약 1455조 원)를 웃돌아 인텔과 약 8배의 차이가 난다.

최근에는 음성이나 동영상 등 데이터 양이 많은 자료를 생성AI에 학습시키는 사례가 늘고 있다. 최첨단 AI 개발에 필요한 계산량이 지난 수십 년 동안 100억 배로 늘어난 반면, 같은 기간 슈퍼컴퓨터의 연산능력 증가는 수백 배 정도에 그칠 것이라는 추정도 있다. 기반이 되는 AI 반도체는 여전히 기술 혁신의 여지가 크다.

양강에 도전하는 신세력도 전력 효율 개선이 관건


생성AI 붐을 기회로 삼아 양강 체제가 이어지던 데이터센터용 반도체 시장에 뛰어들려는 기업의 움직임도 있다. 선두주자는 CPU에서 약 20%의 점유율을 가진 미국 어드밴스드마이크로디바이스(AMD)가 대표적이다.

지난 6월 공개한 AMD의 최신 데이터센터용 AI 반도체 'MI300'은 여러 개의 반도체를 블록처럼 조합해 일체형으로 동작하는 '칩렛(chiplet)' 기술을 채택했다. 기존 제품보다 8배의 연산 성능을 갖췄다. 리사 수 AMD CEO는 "(생성 AI를 구동하는) 대규모 언어 모델 개발에 유리하다"고 강조했다.

2016년 설립된 캐나다 스타트업 텐스트렌트는 CPU 등과 결합해 AI의 성능과 전력 효율을 높이는 자체 반도체 개발에 주력하고 있다.

짐 켈러 텐스트렌트 CEO는 AMD, 미국 애플 등을 거쳐 미국 테슬라에서 자율주행용 AI 시스템 개발을 지휘한 전설적인 엔지니어다. 그는 개발 중인 자체 반도체와 CPU가 보다 일체적으로 작동할 수 있다면 "모든 AI 개발 및 운용에서 높은 성능을 발휘할 수 있을 것"이라고 말했다.

반도체 업체들의 대형 고객인 구글, 아마존닷컴 등도 자사 클라우드 서비스에 최적화된 AI 반도체 개발에 힘을 쏟고 있다. 자금력을 앞세운 IT(정보기술) 대기업들의 움직임은 업계 세력 판도에 커다란 영향을 미칠 것으로 보인다.

[초점] 엔비디아, 인텔과 CPU 경쟁 가세…GPU와 CPU를 하나로 만든다 (g-enews.com)

 

[초점] 엔비디아, 인텔과 CPU 경쟁 가세…GPU와 CPU를 하나로 만든다

AI반도체 붐을 타고 GPU(그래픽처리장치)와 CPU(중앙연산처리장치)의 경계가 사라지고 있다. 그동안 인텔은 CPU, 엔비디아는 GPU에 강점을 가지며 거의 시장을 독식하디시피 했다. 그런데 인공지능(A

www.g-enews.com