HBM3E와 HBM4는 뭐가 다른가 — 세대별 차이 한눈에
엔비디아 AI 가속기 한 장의 원가에서 가장 비싼 부품을 꼽으라면 많은 사람이 GPU 칩 자체를 떠올린다. 하지만 실제로는 그 옆에 붙은 **HBM(고대역폭 메모리)**이 원가의 큰 몫을 차지한다. AI 시대 메모리 경쟁이 곧 HBM 세대 경쟁인 이유다. HBM2E부터 HBM4까지, 세대마다 정확히 무엇이 달라졌는지 짚어 본다.
HBM은 왜 '쌓는' 메모리인가
일반 D램은 기판 위에 평평하게 늘어선다. HBM은 D램 칩을 수직으로 여러 장 쌓고(stack), 칩을 관통하는 미세 구멍 배선인 **TSV(Through-Silicon Via)**로 위아래를 곧장 연결한다. 덕분에 데이터가 오가는 길(I/O)이 1024비트 이상으로 넓어진다. 일반 D램이 좁은 골목이라면 HBM은 수십 차선 고속도로인 셈이다.
쌓은 D램 더미는 맨 아래 베이스 다이(로직 다이) 위에 올라가고, 이 묶음 전체가 GPU 바로 옆 인터포저 위에서 연결된다. 이 패키징 기술이 바로 CoWoS다.
세대별로 무엇이 늘었나
세대가 오를수록 ①핀당 속도, ②쌓는 단수, ③한 스택 용량, ④총 대역폭이 함께 커졌다.
| 세대 | 핀당 속도(대략) | 주요 단수 | 스택당 대역폭(대략) | 대표 적용 시기 |
|---|---|---|---|---|
| HBM2E | 약 3.2~3.6Gbps | 8단 | 약 460GB/s | 2020년 전후 |
| HBM3 | 약 6.4Gbps | 8~12단 | 약 819GB/s | 2022~2023년 |
| HBM3E | 약 9.2~9.6Gbps | 8~12단 | 1TB/s 이상 | 2024년~ |
| HBM4 | 약 8Gbps 안팎(핀 2배) | 12~16단 | 1.5TB/s 이상(목표) | 2026년 전후(양산 준비) |
속도·대역폭은 제조사·제품마다 다른 추정치이며 표준·로드맵에 따라 바뀔 수 있다.
HBM3E의 핵심: 속도와 단수
HBM3E는 HBM3의 개선판이다. 핀당 속도를 9Gbps대로 끌어올리고, 12단(12-Hi) 적층을 본격화해 한 스택 용량을 24GB, 36GB까지 키웠다. 같은 면적에 더 많이·더 빠르게 담는 방향이다. 단수를 높이면 스택 전체 두께를 유지하면서 칩을 더 얇게 갈아야 해(웨이퍼 박막화), 휘어짐·발열·수율 관리가 까다로워진다.
HBM4의 진짜 변화: I/O 폭 2배
HBM4는 단순한 속도 향상을 넘어 구조가 바뀐다. 핵심은 인터페이스 폭이 1024비트에서 2048비트로 2배가 된다는 점이다. 핀당 속도를 무리하게 올리지 않고도 통로 자체를 두 배로 넓혀 대역폭을 확보한다.
또 하나의 변화는 베이스 다이의 고도화다. 단순 연결용이던 맨 아래 로직 다이를 파운드리 선단 공정으로 만들어 더 똑똑하게 바꾸려는 흐름이다. 메모리 회사와 파운드리의 협업이 깊어지는 대목이다.
누가 만드나
HBM은 SK하이닉스·삼성전자·마이크론 세 회사가 만든다. AI 붐과 함께 HBM은 '없어서 못 파는' 품목이 됐고, 메모리 업황을 좌우하는 핵심 변수로 떠올랐다. 일반 D램이 경기에 출렁이는 범용품이라면, HBM은 고객 맞춤·선주문 성격이 강한 고부가 제품이다.
한 줄 정리
HBM은 세대가 오를수록 핀 속도·적층 단수·대역폭이 커졌고, HBM4부터는 I/O 폭이 2배(2048비트)로 넓어지며 베이스 다이까지 고도화되는 것이 핵심 차이다.
함께 보면 좋은 글
HBM이 뭐길래: AI 시대 메모리 전쟁과 HBM3E 대역폭의 비밀
엔비디아 GPU 가격의 상당 부분이 HBM이라는 메모리다. 일반 D램과 뭐가 다르길래 AI 시대의 병목이자 황금알이 됐을까? HBM의 적층 구조, 세대별 대역폭, GPU와의 연결 방식을 쉽게 풀었다.
SSD 고르는 법 완전정리: TLC·QLC·TBW·PCIe Gen5 한 번에
용량과 가격만 보고 SSD를 골랐다가 후회한 적 있다면 꼭 읽어야 할 글. 셀 방식(TLC/QLC), TBW와 DWPD, PCIe Gen4 vs Gen5, DRAM 캐시 유무까지 실전 체크리스트로 정리했다.
낸드플래시 적층 경쟁: 2D에서 300단+까지, 어떻게 쌓을까
SSD 용량이 매년 커지는 비결은 미세화가 아니라 '층을 쌓는 것'이다. 2D 한계에 부딪힌 낸드가 어떻게 빌딩처럼 수직으로 변신했는지, 176단·232단·300단+ 적층의 원리와 한계를 풀어본다.