본문 바로가기
Extra Form

캐시라는 용어는 누구나 들어봤을 것입니다. 사실 캐시의 의미는 매우 광범위합니다. 컴퓨터에서 가장 큰 캐시는 메모리 스틱으로 구현할 수 있고 그래픽 카드의 비디오 메모리는 그래픽 칩에 필요한 캐시입니다. 하드 디스크에는 해당 캐시가 있으며 CPU는 가장 빠른 캐시 (L1, L2, L3 캐시 등)를 가지고 있으며 캐시는 데이터 교환을위한 버퍼 (캐시라고 함)입니다. 캐시는 종종 RAM (전원이 꺼지면 삭제되는 비 영구 스토리지)이며, 그 역할은 하드웨어가 더 빠르게 응답하도록 돕는 것입니다. 오늘 우리는 가장 빠른 캐시 -CPU 캐시에 대해 이야기 할 것입니다.

CPU 캐시 란 무엇입니까?

CPU 캐시는 CPU와 메모리 사이의 일시적인 데이터 교환으로 정의되며, CPU 처리 속도와 메모리 읽기 및 쓰기 속도의 모순을 해결하기위한 것입니다. 캐시 속도는 CPU 속도보다 훨씬 빠릅니다. 기억. CPU 캐시는 일반적으로 CPU 칩과 직접 통합되거나 마더 보드 버스로 상호 연결된 독립 칩에 있습니다. (이 단계에서 CPU 캐시는 일반적으로 CPU에 직접 통합됩니다.) CPU는 종종 동일한 데이터를 반복적으로 처리하고 동일한 명령을 반복적으로 실행해야합니다. 데이터 및 명령의이 부분이 CPU 캐시에서 발견되면 CPU를 메모리 나 하드 디스크에서 검색 할 필요가 없으며 데이터와 명령을 중간에 다시 읽어 전체 시스템의 응답 시간을 단축합니다.


CPU- 캐시-주 메모리 아이콘, 그림의 출처 : CPU 캐시

 

CPU 캐시 속도와 메모리 속도의 차이점은 무엇입니까?

간단한 비유를 해보겠습니다. CPU가 L1 레벨 1 캐시에서 필요한 데이터를 찾는 데 약 3주기가 걸리면 L2 레벨 2 캐시에서 데이터를 찾는 데 약 10주기가 걸리고 L3은 3주기입니다. 레벨 캐시에 필요한 것은 약 50 사이클입니다. 메모리에서 찾으려면 훨씬 느리고 수백 사이클이 걸릴 수 있습니다.


I3-8300 프로세서 기술 사양

CPU 캐시에 대해 어느 정도 이해하고 있습니까? 좀 더 자세히 살펴 보겠습니다. 인텔 공식 웹 사이트의 제품 프로세서 인터페이스에서 캐시의 정의는 다음과 같습니다. "CPU 캐시는 프로세서의 빠른 메모리 영역입니다. 인텔 스마트 캐시 (SmartCache)는 모든 코어가 마지막 The 다음은 CPU 캐시의 L3 (레벨 3 캐시) 인 마지막 레벨 캐시의 개념입니다. 그런 다음 계속해서 세 번째 레벨 캐시라고하는 것이 무엇인지 설명하겠습니다. 3 단계 캐시.


CPU- 캐시-주 메모리 아이콘, 그림의 출처 : CPU 캐시

3 단계 캐시 (L1, L2, L3) 란 무엇입니까?

최신 CPU의 관점에서 보면 3 단계 캐시 (L1 1 단계 캐시, L2 2 단계 캐시 및 L3 3 단계 캐시 포함)는 모두 CPU에 통합 된 캐시이며 그 역할은 CPU와 CPU 사이에 있습니다. 고속 데이터 버퍼의 경우 L1이 CPU 코어에 가장 가깝고 L2가 다음, L3이 다시 있습니다. 작동 속도 측면에서 L1이 가장 빠르고 L2가 가장 빠르고 L3이 가장 느립니다. 용량 측면에서 L1이 가장 작고 L2가 더 크고 L3이 가장 큽니다. CPU는 먼저 가장 빠른 L1에서 필요한 데이터를 찾은 다음 찾을 수없는 경우 다음으로 빠른 L2를 찾은 다음 찾을 수없는 경우 L3를 찾습니다. L3가 없으면 그것을 찾기 위해 기억으로 만 갈 수 있습니다. L1, L2, L3는 각각의 특성이 있다고 할 수 있으니 따로 따로 이야기 해 봅시다.

레벨 1 캐시 (L1 캐시)

레벨 1 캐시라는 용어는 인텔의 펜티엄 프로세서가 캐시를 분류하기 시작했을 때 나타났습니다. 그 당시 CPU에 통합 된 CPU 캐시는 더 이상 전체 시스템의 성능 요구 사항을 충족 할 수 없었고 제조 프로세스를 CPU 내에서 크게 제한 할 수 없었습니다. . 캐시의 수가 증가함에 따라 마더 보드에 통합 된 캐시가 등장했습니다. 당시 사람들은 CPU 내부에 통합 된 CPU 캐시를 1 단계 캐시라고했으며 CPU 외부의 메인 보드에있는 캐시를 호출했습니다. 두 번째 수준 캐시.


인텔 펜티엄 4

1 단계 캐시는 실제로 1 단계 데이터 캐시 (Data Cache, D-Cache, L1d)와 1 단계 명령 캐시 (Instruction Cache, I-Cache, L1i)로 나뉘며, 이는 데이터를 저장하는 데 사용됩니다. 데이터 명령 디코딩을 실행합니다. 둘 다 CPU에서 동시에 액세스 할 수 있으므로 CPU 멀티 코어 및 멀티 스레드 캐시 경합으로 인한 충돌을 줄이고 프로세서의 효율성을 향상시킵니다. 일반적으로 CPU의 L1i와 L1d는 동일한 용량을 가지며, 예를 들어 I7-8700K의 L1은 32KB + 32KB입니다.

레벨 2 캐시 (L2 캐시)

CPU 제조 공정의 발달로 원래 CPU 밖에 있던 2 차 캐시도 쉽게 CPU에 통합 할 수 있습니다. 이때 캐시가 CPU 내부에 있는지 여부를 판단하여 1 차와 2 차 레벨 캐시는 더 이상 정확하지 않습니다. CPU에 통합 된 L2 보조 캐시의 실행 속도는 CPU의 실행 속도를 점차적으로 따라갈 수 있습니다. 주요 기능은 CPU가 L1에서 필요한 데이터를 읽지 않을 때 CPU 필터에 데이터를 표시하는 것입니다 (CPU 미스). L1의 경우 L2에서 계속 히트를 찾습니다. 캐시 히트의 작동 원리는 나중에 설명합니다).

L2 레벨 2 캐시는 L1 레벨 1 캐시보다 용량이 더 크지 만 L2 속도는 느립니다. 이유는 무엇입니까? 우선, L2는 L1보다 CPU 코어에서 더 멀리 떨어져 있습니다. L1은 CPU 코어에 가장 가까운 캐시입니다. CPU는 L1보다 먼 물리적 거리에서 L2의 데이터를 읽어야합니다 .L2는 L1보다 용량이 더 큽니다. 간단히 비유하자면 작은 상자에서 물건을 찾는 것이 큰 방에서 물건을 찾는 것보다 빠르고 쉽습니다. 여기서는 캐시가 클수록 좋지 않고 캐시가 CPU 코어에 가까울수록 빠를수록 더 좋다는 것을 알 수 있습니다. 최후 수준이 아닌 캐시의 캐시 용량은 당연히 충분합니다.


Core Duo Core Duo 프로세서

L2 2 단계 캐시는 실제로 L1 1 단계 캐시와 주 메모리 사이의 버퍼입니다. 2006 년 시점에 Intel과 AMD에서 판매 한 여러 프로세서는 마지막 수준 캐시와 다른 것을 알 수 있습니다. : Intel Core Duo는 이전 제품인 Pentium D 및 EE와 다릅니다. 듀얼 코어 공유 2M L2 2 단계 캐시를 사용합니다. 당시 1 차 2 단계 캐시 아키텍처, 즉 "스마트 캐시"공유에 속합니다. 이 기술은 Intel에서 향후 출시 될 모든 멀티 코어 프로세서에 여전히 사용되고 있습니다 .AMD Athlon 64 X2 프로세서에는 각 CPU 코어에 대해 독립적 인 보조 캐시가 있고 맨체스터 코어 프로세서는 코어 당 512KB이며 Toledo 코어는 코어 당 1MB입니다., 두 코어 간의 캐시 데이터 동기화는 CPU의 내장 SRI (System Request Interface)에 의해 제어됩니다. 이러한 데이터 지연 및 리소스 소비는 Intel의 Pentium D 및 EE 코어보다 낫습니다. ,하지만 여전히 Core만큼 좋지는 않습니다. 대표 Smart Cache에 대한 캐시 공유.

L3 캐시 (L3 캐시)

첫 번째 L3 레벨 3 캐시는 AMD의 K6-III 프로세서 여야하는데, 당시에는 제조 공정으로 인해 L3는 마더 보드에만 통합 될 수있었습니다. 그런 다음 Intel의 L3 레벨 3 캐시가 처음 등장한 것은 Itanium Itanium 서버 프로세서, P4EE 및 Xeon MP입니다. L3 3 레벨 캐시의 모습은 실제로 CPU 성능 향상을위한 상승 곡선을 보여줍니다. CPU 성능 향상은 L3가 0에서 2M으로 바뀌고 L3가 2M에서 6M으로 향상 될 때 10 % 미만일 수 있습니다. 이것은 최신 CPU에 있습니다. 멀티 코어 공유 L3의 경우, L3가 CPU에 통합되고 공식적으로 CPU의 내부 캐시가 될 때 CPU의 5 %만이 데이터를 처리 할 때 메모리의 데이터를 호출하면됩니다. , 메모리 지연을 더욱 줄이고 시스템 응답 속도를 높입니다.


Intel Nehalem L3 SmartCache의 개략도

마찬가지로 L3는 L2와 메인 메모리 사이의 버퍼로 주로 프로세서의 빅 데이터 처리 성능 향상에 반영되어 게임 성능에 큰 도움이됩니다. 그래서 어떤 사람들은 CPU를 선택할 때 L3를 구입하고 L3가 더 큰 CPU를 구입하는 것이 옳은가? 아니요,이 비교는 동일한 아키텍처의 경우에만 의미가 있습니다. 상대적으로 장기적인 예를 들어 보겠습니다. 1MB L3를 사용하는 Intel의 Xeon MP 프로세서는 여전히 L3가없는 AMD의 Opteron 프로세서와 경쟁하지 않습니다. 기존 프로세서를 살펴 보겠습니다. : Intel I7-8700K 12MB L3와 AMD Threadripper 1950X 32MB L3를 비교하면 32MB는 당연히 12MB보다 크지 만 평균적으로 코어 2MB L3이기도합니다. 성능이 다릅니다.

CPU 캐시는 CPU 작동에 어떻게 도움이됩니까?

L1, L2 및 L3의 기원을 알면서 CPU 캐시가 CPU가 작업 효율성을 향상시키는 데 어떻게 도움이되는지 자세히 살펴 보겠습니다.


제한 원리, 사진 출처 : CMU

데이터의 한계로 인해 CPU는 짧은 시간에 여러 번 데이터를 읽어야하는 경우가 많으며 메모리의 동작 주파수는 CPU의 처리 속도에 맞추지 못하는 것이 당연합니다. 어떻게해야합니까? 캐시의 중요성이 강조되고 CPU는 메모리를 피하고 캐시에서 원하는 데이터를 읽을 수 있는데이를 히트라고합니다. L1은 빠르게 실행되지만 데이터 용량은 매우 적습니다 .L1에서 CPU가 적중 할 수있는 확률은 매일 사용시 약 80 %입니다 .L2와 L3의 메커니즘은 비슷합니다. 이렇게하면 CPU가 필요로하는 데이터 메모리에서 읽기는 약 5 % -10 %이며 다른 모든 데이터 적중은 L1, L2, L3에서 수행 될 수 있으므로 시스템의 응답 시간이 크게 단축됩니다. 일반적으로 모든 CPU가 데이터를 읽는 순서는 캐시하는 것입니다. 먼저 메모리.

L1, L2 및 L3 캐시는 메모리 속도와 매우 다르며 구성의 차이로 인해 속도 차이가 발생합니다. 그렇다면 CPU 캐시와 메모리는 어떻게 구성됩니까?

캐시 SRAM과 메모리 DRAM의 차이점

CPU 캐시는 기본적으로 SRAM (Static RAM, static RAM)으로 구성되어 있으며, 메모리의 DRAM은 실제로 DRAM (Dynamic RAM, dynamic)의 일종 인 SDRAM (동기 동적 랜덤 메모리)입니다.


적은 양

DRAM은 트랜지스터 1 개와 캐패시터 1 개만으로 집적도가 매우 높고 대용량 (메모리)을 쉽게 만들 수 있지만, 캐패시터는 정보를 저장하는 데 사용되기 때문에 지속적으로 캐패시터의 충전을 보충하고 리프레시해야합니다. 충전과 방전 사이의 시간차가 DRAM으로 이어집니다. 응답이 SRAM보다 훨씬 느립니다.


SRAM

DRAM에 비해 SRAM은 DRAM보다 복잡하기 때문에 SRAM의 집적도가 매우 낮고 초기 CPU 캐시를 CPU에 통합 할 수없는 이유이기도합니다. SRAM의 특징은 빠르며 전기가있을 때 데이터가 있고 리프레시 시간이 필요하지 않아 빠른 데이터 전송 속도를 강조하며, 단점은 넓은 면적을 차지하고 비용이 저렴하다는 점입니다. 하나의 DRAM이 하나의 공간을 차지하고 하나의 SRAM이 6 개의 공간을 차지한다면 그 차이는 여전히 상당히 큽니다.

팬 외부 : L4 및 L4 캐시 eDRAM


I7-4750H

모든 CPU가 SRAM을 CPU 캐시로 사용하는 것은 아닙니다. IBM의 Power 시리즈 프로세서는 eDRAM을 CPU 캐시로 사용합니다. Intel Haswell I7-4750H CPU를 살펴 보겠습니다 . 주요 관심사는 CPU에 128MB가 내장되어 있다는 것입니다. EDRAM이 사용됩니다. 코어 그래픽 카드 Iris Pro 5200 의 비디오 메모리로 사용됩니다. 코어 그래픽 카드를 사용하지 않으면 128MB eDRAM이 프로세서의 L4 레벨 4 캐시가됩니다. 물론 I7-4750H의 L4가 많아진 후에도 프로세서 성능은 크게 향상되지 않았으며 eDram 캐시의 주요 기능은 코어 그래픽 카드를 비디오 메모리로 제공하는 것입니다.


하드웨어 갤러리

포인트 지급 글 작성(5점) / 댓글(2점) 권한 조회(Lv.0 이상) / 작성(Lv.1 이상)

List of Articles
번호 분류 제목 글쓴이 조회 수
Hot글 일반/잡담 써멀구리스 추천받고 싶습니다. 1 ㅇㅇ 1467
Hot글 질문 롤 프레임 질문있습니다 2 file ㅇㅇ 1474
Hot글 질문 3500x 기본쿨러로 버티기 힘든가요?? 1 ㅇㅇ 1450
4801 일반/잡담 메타버스에 대하여. 로블록스와 IT시장에 미칠 영향 ㅇㅇ 57
4800 일반/잡담 M2(가칭) 프로세서와 애플이 준비하고 있는 이야기들. 2021년의 WWDC 관전 포인트. ㅇㅇ 56
4799 일반/잡담 국가전으로 번진 반도체 패권 전쟁, 반도체 시장 개입에 나선 미국과 일본 반도체의 의미 ㅇㅇ 64
4798 일반/잡담 퀄컴과 구글은 M1을 넘는 프로세서를 만들 수 있을까? 삼성 X 구글 : 프로젝트 화이트채플에 대해 ㅇㅇ 60
4797 일반/잡담 미니LED의 등장과 디스플레이 시장 정세 변화에 대해. 아이패드프로에 미니LED를 채용한 애플, 갤럭시북프로로 응수한 삼성. 미니LED VS OLED ㅇㅇ 55
4796 일반/잡담 삼성전자의 시대가 저문다? 한국의 전설적 투자자가 말하는 메모리반도체 회의론에 대해 ㅇㅇ 55
4795 일반/잡담 윈도우 10 작업 표시줄에 '뉴스 및 날씨' 정보 제공 패치 배포 file ㅇㅇ 357
4794 일반/잡담 최고의 미니 PC ㅇㅇ 353
4793 일반/잡담 인텔, 보안 취약점 73개 권고사항 및 업데이트 발표 file ㅇㅇ 357
4792 일반/잡담 커세어, RTX 3080 Ti 및 3070 Ti-Powered 벤젠스 i7200 시리즈 게이밍 PC 출시 ㅇㅇ 344
4791 일반/잡담 모질라 재단, 파이어폭스 개선에 집단지성을 활용을 위한 아이디어스 출시 file ㅇㅇ 358
4790 일반/잡담 구글, 애플, MS, 모질라, 브라우저 확장 기능 표준화를 위해 WECG 출범 ㅇㅇ 344
4789 일반/잡담 Intel NUC 11 Extreme "Beast Canyon"에 Core i9-11900KB CPU 제공 ㅇㅇ 336
4788 일반/잡담 최신 플레그십 RTX 3080Ti 조합, AMD R7 5800X vs i9 11900K의 승자는? file ㅇㅇ 364
4787 일반/잡담 정보 구글 워크스페이스, 일반 사용자에 개방하고 암호화 기능 강화 ㅇㅇ 350
4786 Araboja 디스플레이 응답 시간의 의미에 대해 전문적으로 알아보자 file ㅇㅇ 384
4785 Araboja 컴퓨팅 시장이 Armv9 아키텍처가 x86로 대체되는 이유에 대해 알아보자 file ㅇㅇ 394
4784 Araboja WiFi 라우터의 활성 안테나에 자세히 알아보자 file ㅇㅇ 397
4783 일반/잡담 GeForce RTX 3080 Ti 성능 테스트 file ㅇㅇ 395
4782 일반/잡담 Nvidia는 영국을위한 새로운 슈퍼 컴퓨터를 만들기 위해 1 억 달러를 투자하기로 약속 file ㅇㅇ 393
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 241 Next
/ 241