HBM3E와 HBM4는 뭐가 다른가 — 세대별 차이 한눈에

엔비디아 AI 가속기 한 장의 원가에서 가장 비싼 부품을 꼽으라면 많은 사람이 GPU 칩 자체를 떠올린다. 하지만 실제로는 그 옆에 붙은 **HBM(고대역폭 메모리)**이 원가의 큰 몫을 차지한다. AI 시대 메모리 경쟁이 곧 HBM 세대 경쟁인 이유다. HBM2E부터 HBM4까지, 세대마다 정확히 무엇이 달라졌는지 짚어 본다.

HBM은 왜 '쌓는' 메모리인가

일반 D램은 기판 위에 평평하게 늘어선다. HBM은 D램 칩을 수직으로 여러 장 쌓고(stack), 칩을 관통하는 미세 구멍 배선인 **TSV(Through-Silicon Via)**로 위아래를 곧장 연결한다. 덕분에 데이터가 오가는 길(I/O)이 1024비트 이상으로 넓어진다. 일반 D램이 좁은 골목이라면 HBM은 수십 차선 고속도로인 셈이다.

쌓은 D램 더미는 맨 아래 베이스 다이(로직 다이) 위에 올라가고, 이 묶음 전체가 GPU 바로 옆 인터포저 위에서 연결된다. 이 패키징 기술이 바로 CoWoS다.

세대별로 무엇이 늘었나

세대가 오를수록 ①핀당 속도, ②쌓는 단수, ③한 스택 용량, ④총 대역폭이 함께 커졌다.

세대	핀당 속도(대략)	주요 단수	스택당 대역폭(대략)	대표 적용 시기
HBM2E	약 3.2~3.6Gbps	8단	약 460GB/s	2020년 전후
HBM3	약 6.4Gbps	8~12단	약 819GB/s	2022~2023년
HBM3E	약 9.2~9.6Gbps	8~12단	1TB/s 이상	2024년~
HBM4	약 8Gbps 안팎(핀 2배)	12~16단	1.5TB/s 이상(목표)	2026년 전후(양산 준비)

속도·대역폭은 제조사·제품마다 다른 추정치이며 표준·로드맵에 따라 바뀔 수 있다.

HBM3E의 핵심: 속도와 단수

HBM3E는 HBM3의 개선판이다. 핀당 속도를 9Gbps대로 끌어올리고, 12단(12-Hi) 적층을 본격화해 한 스택 용량을 24GB, 36GB까지 키웠다. 같은 면적에 더 많이·더 빠르게 담는 방향이다. 단수를 높이면 스택 전체 두께를 유지하면서 칩을 더 얇게 갈아야 해(웨이퍼 박막화), 휘어짐·발열·수율 관리가 까다로워진다.

HBM4의 진짜 변화: I/O 폭 2배

HBM4는 단순한 속도 향상을 넘어 구조가 바뀐다. 핵심은 인터페이스 폭이 1024비트에서 2048비트로 2배가 된다는 점이다. 핀당 속도를 무리하게 올리지 않고도 통로 자체를 두 배로 넓혀 대역폭을 확보한다.

또 하나의 변화는 베이스 다이의 고도화다. 단순 연결용이던 맨 아래 로직 다이를 파운드리 선단 공정으로 만들어 더 똑똑하게 바꾸려는 흐름이다. 메모리 회사와 파운드리의 협업이 깊어지는 대목이다.

누가 만드나

HBM은 SK하이닉스·삼성전자·마이크론 세 회사가 만든다. AI 붐과 함께 HBM은 '없어서 못 파는' 품목이 됐고, 메모리 업황을 좌우하는 핵심 변수로 떠올랐다. 일반 D램이 경기에 출렁이는 범용품이라면, HBM은 고객 맞춤·선주문 성격이 강한 고부가 제품이다.

한 줄 정리

HBM은 세대가 오를수록 핀 속도·적층 단수·대역폭이 커졌고, HBM4부터는 I/O 폭이 2배(2048비트)로 넓어지며 베이스 다이까지 고도화되는 것이 핵심 차이다.

HBM3E와 HBM4는 뭐가 다른가 — 세대별 차이 한눈에

HBM은 왜 '쌓는' 메모리인가

세대별로 무엇이 늘었나

HBM3E의 핵심: 속도와 단수

HBM4의 진짜 변화: I/O 폭 2배

누가 만드나

한 줄 정리

함께 보면 좋은 글

HBM이 뭐길래: AI 시대 메모리 전쟁과 HBM3E 대역폭의 비밀

SSD 고르는 법 완전정리: TLC·QLC·TBW·PCIe Gen5 한 번에

낸드플래시 적층 경쟁: 2D에서 300단+까지, 어떻게 쌓을까