Atachment
첨부 '27'
Extra Form
링크 http://추천을 하고 댓글을 작성...됩니다.

1.jpg

 

ISSCC 2020에서 AMD가 시연한 젠 2 프로세서의 액체 질소 쿨링 벤치마크.

 

AMD는 차세대 마이크로 프로세서인 젠2 CPU 코어 기술과 칩렛 기술을 반도체 회로 기술의 국제학회인 ISSCC 2020에서 발표했습니다. 2020년 2월 17일의 발표는 2개의 강연으로 구성됐는데, 우선 CPU 코어 기술을 설명하고 그 다음에 칩렛 기술을 설명했습니다. 

 

2.jpg

 

CPU 코어 기술 강연의 내용부터 보지요. 2세대 젠 마이크로 아키텍처인 젠2는 모바일, 데스크탑, 서버까지를 모두 포함합니다. 구체적으로는 노트북용 마이크로 프로세서인 라이젠 4000 시리즈, 데스크탑용 프로세서인 3세대 라이젠, HEDT용 프로세서인 3세대 라이젠 프로세서, 서버용 프로세서인 2세대 에픽이 젠2 아키텍처를 사용합니다.

 

 

7nm 세대의 FinFET 기술을 이용해 복잡한 대규모 회로를 탑재

 

3.jpg


젠2 프로세서는 7nm 공정을 처음으로 도입했습니다. TSMC의 7nm FinFET 공정으로 제조하면서 트랜지스터 밀도가 늘었습니다. 덕분에 복잡하면서도 강력한 분기 예측 장치인 TAGE를 탑재하고, 캐시 용량을 늘리고, 부동소수점 데이터 경로 폭을 2배로 확장했습니다. 모두 연산 성능 향상에 기여하는 특징입니다. SPECint_base2006로 측정한 싱글 스레드의 IPC는 젠과 비교해서 15% 정도 올랐다고 합니다.  

 

또 마이크로 프로세서를 여러 다이로 나누는 칩렛 기술을 사용했습니다. CPU 코어 다이와 I/O 다이를 여럿 사용해 1개의 마이크로 프로세서를 만듭니다. 칩렛 기술에 대해선 아래에서 다시 설명합니다. 

 

4.jpg

 

 

CPU 코어 이야기로 돌아갑시다. CPU 코어는 32KB의 명령어 캐시와 32KB의 데이터 캐시, 512KB의 L2 캐시, 마이크로 코드 저장용 ROM, 클럭/테스트 회로(CPL : Chip Pervasive Logic), 디코딩 회로, 분기 예측 회로, ALU 로드/스토어 회로 등으로 구성됩니다.

 

5.jpg


온 칩 캐시는 16MB L3 캐시를 4개의 CPU 코어가 공유합니다. 용량은 젠의 2배입니다. L3 캐시 SRAM 매크로 셀 어레이 주변에 LDO(Low Drop Out) 전압 레귤레이터를 넣어, L2와 L3 캐시 모두에 안정적으로 전원을 공급합니다.

재하고 있으며, 2 차 캐시와 L3 캐시 모두에 안정적인 전원을 공급한다.


6.jpg


1개의 CPU 코어 클러스터는 4개의 CPU 코어와 L3 캐시로 구성됩니다. 이것을 AMD는 CCX(Core Complex)라고 부릅니다.

 

7.jpg

 

이 CPU 클러스터는 1가지로 정해진 게 아니라 용도에 따라 구성을 바꿉니다. 2개의 CPU 코어로 구성된 버전과 L3 캐시를 4MB로 줄인 버전, 2개의 CCX를 하나의 실리콘 다이에 집적한 버전이 있습니다.

 

 

8.jpg


정리해 봅시다. 젠이 14nm FinFET 공정으로 제조한 반면, 젠2는 7nm FinFET로 제조 기술을 미세화했습니다. CPU 코어 클러스터 CCX가 4코어에 더블 슬레딩인건 같습니다. CCX의 실리콘 면적은 젠이 44제곱mm에 젠2는 31.3제곱mm로 0.71배로 줄었습니다. 

 

9.jpg

 

L2 캐시 용량은 512KB를 유지합니다. L3 캐시 용량은 젠의 8MB에서 젠2의 16MB로 두배가 됐습니다. 로직의 표준 셀 라이브러리는 젠이 10.5트랙이었는데 젠2는 6트랙으로 절반 수준이 됐습니다. 이건 매우 큰 변화입니다. 

 

 

낮은 표준 셀로 매크로 레이아웃 설계를 더 쉽게

 

이제 CCX의 레이아웃 설계를 봅시다. CCX 같은 고밀도/대규모 논리 회로 레이아웃은 결코 간단하지 않습니다. 가장 문제가 되는 건 여러 줄에 걸쳐있는 큰 매크로 레이아웃입니다. 규모가 큰 매크로는 전력 효율과 밀도가 우수한 레이아웃을 배치하기 어렵습니다. 

 

그래서 CCX는 로직을 설계할 때 작은 매크로를 다수 배치하는 식으로 로직을 구성했습니다. 이렇게 하면 대규모 매크로에 비해 전력 효율과 밀도는 떨어지지만 레이아웃 디자인은 매우 쉽습니다. 레이아웃 설계 부담과 시간을 줄일 수 있습니다. 표준 셀 높이를 10.5트랙에서 6트랙으로 낮추고, 제조 기술을 14nm에서 7nm로 미세화했는데도 CCX 면적이 0.71배 줄어든데 그친 것도 매크로 소형화에 들어간 부분이 적지 않아 보입니다. 

 

10.jpg

 

왼쪽이 기존 레이아웃으로 빈 공간을 쓰기 어렵습니다. 오른쪽은 이번의 레이아웃인데 매크로 규모가 작아 가득 채울 수 있었습니다. 

 


사다리 모양의 VIA로 배선 저항을 줄이고 신뢰성을 향상

 

11.jpg

 

배선 경로가 휘어지지 않도록 설게했습니다. 배선층은 무조건 평행, 인접 배선과의 연결은 수직 방향의 점퍼를 통해 이루어집니다. 

 

 

12.jpg

 

하부 층의 배선 저항을 낮추고 일렉트로 마이그레이션 수명을 확보하기 위해 상하 배선층을 연결하는 VIA를 사다리 모양으로 배치했습니다. 아래에 MX-1, MX, MX+1이 있다고 가정하면 MX-1과 MX+1은 같은 방향을 향한 평행 배선입니다. MX-1/MX+1과 MX는 다수의 Via로 연결됩니다. 이 때 MX-1은 위의 2개층과 Via 저항을 낮추고 전자 이동 수명을 늘리는데 사용합니다. 

 

 

 

소비 전력을 좌우하는 클럭 당 스위칭 용량

 

13.jpg


MOS FET의 로직 회로에 걸리는 부하는 기본적으로 정전 용량(캐패시턴스)입니다. MOS FET 스위칭에 의한 충/방전 부하 용량의 크기가 동적 전력을 결정합니다. AMD는 이를 CAC(Capacitance per Cycle)라고 부르며, CAC를 줄이는 연구도 진행 중입니다. 14nm에서 7nm로 미세화하면서 표준 셀을 10.5트랙에서 6트랙으로 낮춘 게 CAC를 줄이는 데 효과를 봤습니다. 일부 애플리케이션에서 CAC를 비교한 결과, 젠에서 젠2로 오면서 CAC가 60~70%로 줄었습니다.

 

 

클럭이 같을 때 소비 전력은 젠의 절반으로 감소

 

14.jpg

 

그리고 젠2는 클럭을 유지하면서 소비 전력을 젠의 절반으로 줄일 수 있었습니다. 클럭 구동에 필요한 전원 전압도 줄었다고 합니다. 구체적으로 얼마나 줄었는지는 말하지 않았습니다. 

 

15.jpg

 

4코어 8스레드의 클럭/전력

 

16.jpg

 

싱글코어 듀얼스레드에서 클럭과 전압

 

17.jpg

 

15W의 노트북 프로세서부터 280W의 서버 프로세서까지 커버하는 젠2 아키텍처

 

 


제조 비용 증가를 막기 위한 칩렛 기술

 

다음은 칩렛 기술의 강연입니다. 칩렛 기술은 원래 싱글 다이로 만들 수 있는 프로세서나 SoC를 여러개의 다이(칩렛)으로 나눠 서로 연결하는 기술입니다. 젠2 아키텍처의 프로세서는 서버용 에픽, HEDT 라이젠 스레드리퍼, 데스크탑용 라이젠에서 칩렛 기술을 썼습니다. CCD(CPU Compute Die 혹은 Core Complex Die)라 부르는 CPU 코어 다이와 IOD(IO Die)라는 입출력 회로 다이의 결합입니다.

 

18.jpg

 

 

CCD는 용도에 따라 다이의 수가 달라집니다. IOD는 기본적인 구성의 서버용 IOD와, 거기서 구성을 줄인 클라이언트 IOD가 있습니다. 용도별로 실리콘 다이를 설계하고 제조하는 게 아니라, 칩렛의 조합으로 다양한 용도에 맞춥니다. 이렇게 해서 실리콘 설계의 부담을 줄여줍니다. 

 

19.jpg

 

CPU 코어가 탑재된 CCD는 7nm FinFET, IOD는 14nm FinFET로 제조합니다. 둘 다 7nm를 쓰지 않은 이유는 가격 때문입니다. 250제곱mm의 다이를 45nm 공정으로 제조하는 비용이 1이라고 가정하면 14/16nm에서는 2, 즉 두 배가 됩니다. 7nm는 4, 5nm에서는 5로 증가합니다. 제조 비용의 상승을 막기 위해선 다이의 면적을 줄이거나 웨이퍼 크기를 키우는 방법밖에 없습니다. 현재 웨이퍼는 300mm며, 450mm로 늘리는 방안을 검토 중이나 실용화는 아직입니다. 그럼 남는 건 실리콘 다이 면적의 축소 뿐입니다. 

 

20.jpg

 

젠 아키텍처 기반의 라이젠 프로세서는 14nm FinFET 공정으로 만들었습니다. 실리콘 면적은 212.97제곱mm입니다. 8개의 CPU 코어와 L3 캐시가 실리콘 면적의 56%를 차지하며, 이걸 7nm로 줄이면 실리콘 면적이 대폭 줄어듭니다. 하지만 나머지 44%는 7nm로 미세화해도 회로 밀도/성능이 크게 향상되지 않습니다. 공정 미세화의 의미가 별로 없습니다.

 

21.jpg

 

그래서 8개의 CPU 코어와 L3 캐시로 구성된 CCD 칩렛으로 분할해 7nm 공정으로 제조했습니다. 위에서 설명한 CCX를 2개 탑재하고 칩렛 사이의 연결 인터페이스(SerDes 회로)와 테스트 회로를 추가한 게 CCD입니다. 그 면적은 74제곱mm로 매우 작습니다. CPU 코어와 L3 캐시가 실리콘 면적의 86%를 차지합니다. 

 


칩렛 기술에서 해결해야 할 문제: 다이 사이의 연결

 

22.jpg


칩렛 기술의 큰 문제는 다이 사이의 연결입니다. 연결 배선의 수가 엄청나며, 초고속 신호를 전송해야 합니다. 이런 문제를 잘 해결할 수 있는 방법은 실리콘 인터포저입니다. 고밀도 배선을 형성하고, 다이 사이의 거리를 줄여 빠르게 전송이 가능합니다.

 

23.jpg

 

하지만 실리콘 인터포저는 비쌉니다. AMD는 CCD를 최대 8개 쓴다고 가정하며 실리콘 인터포저를 도입하지 않았습니다. 대신 칩렛을 패키지 기판에 올리고, 다이 사이를 SerDes 링크(IFOP (Infinity Fabric On-Package)로 연결하는 방법을 썼습니다.

 

24.jpg

 

8개의 CCD와 1개의 서버 IOD를 패키징한 배선 레이아웃과 내부 블록

 

25.jpg

 

서버용 프로세서인 2세대 에픽(왼쪽)과 데스크탑 프로세서인 3세대 라이젠(오른쪽)의 패키지 레이아웃. 오른쪽은 칩렛과 기판을 연결하는 범프를 썼습니다. 14nm에서는 150μm 피치, 7nm에서는 130μm 피치의 범프를 사용합니다. 또 7nm에서는 범프에 구리 필러를 넣어 일렉트로 마이그레이션을 억제했습니다.

 

 

칩렛 기술의 제조 비용은 거대 다이의 절반 수준

 

26.jpg

 

마지막으로 칩렛 기술을 사용한 7nm 공정의 제조 비용입니다. 8개의 CCD를 탑재한 64코어의 2세대 에픽 프로세서를 제조하는데 들어가는 비용이 1이라고 가정합시다. 칩렛으로 32코어 프로세서를 만든다면 0.9가 필요하나, 단일 실리콘이라면 1.9로 2배 이상 늘어납니다. 16코어에서도 가격 차이가 2배 이하입니다. 

 

27.jpg

 

데스크탑 프로세서의 비교입니다. 2개의 CCD를 탑재한 16코어 3세대 라이젠 프로세서가 1이라면, 7nm의 거대 다이는 2배 이상 비쌉니다. 8코어 프로세서는 0.6이 되는데 거대 다이는 0.9밖에 안됩니다. 칩렛이 훨씬 쌉니다. 


하드웨어 갤러리

포인트 지급 글 작성(5점) / 댓글(2점) 권한 조회(Lv.0 이상) / 작성(Lv.1 이상)

List of Articles
번호 분류 제목 글쓴이 조회 수
Hot글 일반/잡담 써멀구리스 추천받고 싶습니다. 1 ㅇㅇ 1492
Hot글 롤 프레임 질문있습니다 2 file ㅇㅇ 1500
Hot글 3500x 기본쿨러로 버티기 힘든가요?? 1 ㅇㅇ 1508
4851 하드웨어팁 cpu와 쿨러방열판이 합체되었을 때 분리하는 법 file ㅇㅇ 11
4850 정보 추가) 뉴 월드의 베타 버전을 플레이하면 그래픽카드가 죽는다? file ㅇㅇ 21
4849 정보 Neo Forza, DDR4-5000와 DDR4-4600 메모리 키트 발표 file ㅇㅇ 13
4848 정보 2021.07.22 02:12 크루셜 P5 플러스. PCIe 4.0 SSD file ㅇㅇ 13
4847 정보 코어 i9-12900K QS, 시네벤치 R20에서 5950X보다 높음 ㅇㅇ 16
4846 정보 라이젠 3 5300G, FCLK 2.4GHz로 오버클럭 file ㅇㅇ 13
4845 정보 라데온 RX 6600 XT의 사진 유출 file ㅇㅇ 13
4844 일반/잡담 중국 최초의 12인치 웨이퍼 재생시설이 양산에 성공 ㅇㅇ 18
4843 일반/잡담 v file ㅇㅇ 11
4842 일반/잡담 인텔 Xe DG1 그래픽의 벤치마크 file ㅇㅇ 11
4841 일반/잡담 14코어 알더레이크-P의 긱벤치 결과 ㅇㅇ 13
4840 일반/잡담 지포스 RTX 40, 에이다 러브레이스가 TSMC 5nm로 제조 ㅇㅇ 17
4839 일반/잡담 Loongson 3A5000 프로세서 정식 발표 file ㅇㅇ 16
4838 일반/잡담 메테오레이크의 후속작, 루나레이크 ㅇㅇ 14
4837 일반/잡담 인텔 2021년 2분기 실적 발표 file ㅇㅇ 14
4836 파워컬러, 24개의 라데온 RX 6600 XT/6600을 등록 file ㅇㅇ 14
4835 일반/잡담 씨게이트, 앞으로 몇 달 안에 20TB PMR 하드를 대량 출시 file ㅇㅇ 15
4834 정보 Puget 시스템, 인텔보다 AMD 프로세서를 더 많이 판매함 file ㅇㅇ 13
4833 일반/잡담 2700x vs 8700K 성능차이 비교하기 file ㅇㅇ 13
4832 정보 ASRock Industrial, NUC 6000 BOX, iBOX 6000 및 NUC 6000 마더 보드 공개 file ㅇㅇ 979
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 243 Next
/ 243
위로