Extra Form
링크 http://추천을 하고 댓글을 작성...됩니다.

지난 10 년 동안 Arm의 전체 생태계가 빠르게 발전했습니다. 스마트 폰의 인기 덕분에 거의 모든 사람들이 Arm의 존재에 대해 알고 있습니다. 실제로 데스크톱 플랫폼, 서버 및 슈퍼 컴퓨터와 같은 다른 영역에서 더 큰 변화가 발생합니다. 사람들의 인식에 더 가까운 것은 애플이 자사 제품 라인에서 인텔 칩을 대체하라는 분명한 요구를들은 최초의 자체 개발 칩 M1을 출시했다는 것입니다. 이것은 Apple과 Arm 생태계 모두를위한 획기적인 제품입니다. x86은 수년 동안 컴퓨터 산업을 지배 해 왔으며 Arm의 부상과 함께 다음 제품은 가장 큰 도전에 직면하게 될 것입니다.

Armv8 아키텍처는 2011 년에 출시 된 Arm의 첫 64 비트 아키텍처로, Armv7 아키텍처에서 크게 도약했습니다. 여기에서 애플이 중요한 역할을했으며,이 아키텍처를 기반으로 한 일련의 칩을 빠르게 출시하는 데에도 기여했으며, iPhone 및 iPad 시리즈 제품에서 데스크탑 플랫폼 iMac에 이르기까지 시장 경쟁에서 선두를 차지했습니다. 성공하세요. 많은 기업들이이 아키텍처를 기반으로 서버 및 슈퍼 컴퓨팅 분야에서 사용할 수있는 제품을 개발했으며 일부 제품도 좋은 결과를 얻었으며 Arm 아키텍처 칩이 널리 사용되었습니다. Armv8 아키텍처를 사용하면 Arm 칩이 소형 또는 모바일 장치에서 새로운 분야에 진입 할 수 있습니다.

 

얼마 전 Arm은 새로운 여정을 시작하는 새로운 Armv9 아키텍처를 출시했습니다. Arm의 공식 소개에 따르면 새로운 Armv9 아키텍처는 최소 10 년 동안 사용될 것이며 Armv9 아키텍처를 기반으로하는 차세대 2 세대 프로세서의 성능은 30 % 증가 할 것으로 예상됩니다. Armv8 아키텍처와 달리 Armv9 아키텍처는 더 넓은 애플리케이션 범위를 가지고 있으며, Armv9 아키텍처의 많은 개선 사항은 Arm 아키텍처 칩이 고성능 컴퓨팅을 포장 도로 달성하기위한 것입니다. 즉, 모든 사람이 "x86 프로세서라고 부르는 것에 더 가깝습니다." 상대. "이 위치.

 

Armv8 아키텍처와 비교하여 Armv9 아키텍처의 개선점은 무엇입니까?


Armv8 아키텍처를 기반으로하는 Armv9 아키텍처는 계속해서 AArch64를 벤치 마크 명령어 세트 로 사용하여 하위 호환성을 유지합니다.이를 기반으로 보안, AI (머신 러닝), 확장 가능한 벡터 확장 및 DSP가 개선되었습니다. 신청. Armv9 아키텍처에는 A 시리즈의 범용 컴퓨팅, R 시리즈의 실시간 프로세서 및 M 시리즈의 마이크로 컨트롤러가 포함됩니다.

Armv9 아키텍처는 계산을 수행하기위한 하드웨어 기반 보안 운영 환경을 생성함으로써 Arm Confidential Compute Architecture (CCA) 도입 및 기밀 도메인 (Realms)의 동적 생성 개념과 같은 보안 작업의 여러 측면을 수행했습니다. 보호 코드 및 데이터는 도난 또는 수정으로부터 보호됩니다. Arm은 또한 Google과 협력하여 소프트웨어에서 공간 및 시간 메모리 안전 문제를 찾을 수있는 "메모리 태그 확장"기술을 개발했습니다. 또한 Arm과 University of Cambridge는 CHERI 아키텍처에 협력하여 아키텍처의 바닥에서 보안을 개선하고 있습니다.

 

Arm은 AI가 향후 컴퓨팅 성능 향상을위한 매우 중요한 원동력이라고 믿습니다. 장치마다 AI 성능 요구 사항이 다르며 AI 프로세서에 대한 요구 사항도 다릅니다. 미래의 산업 요구를 충족하기 위해 Arm은 원래 SVE (Scalable Vector Extension) 명령 세트를 기반으로 SVE2 명령 세트를 개발하여 고성능 컴퓨팅, 5G 네트워크, 가상 현실, AI 및 DSP에서 차세대 Arm 아키텍처를 강화했습니다. 등. 성능 측면. 또한 Arm의 행렬 곱셈에 대한 추가 최적화와 Mali GPU 및 Ethos NPU의 지속적인 개선은 Armv9 아키텍처의 기술적 기능을 확장 할 것입니다.

 

모든 계층의 프로세서에 대한 요구 사항이 범용 컴퓨팅에서 전용 컴퓨팅으로 발전함에 따라 Arm은 모든 당사자의 성능 요구 사항을 충족하기 위해 토탈 컴퓨팅 (Total Compute) 설계 방법을 제안했습니다. 시스템 수준 하드웨어 (Arm의 CPU, GPU, NPU 포함) 및 소프트웨어를 최적화함으로써 포괄적 인 컴퓨팅 설계 방법이 자동차, 사용자 엔드, 인프라 및 사물 인터넷 솔루션의 전체 IP 포트폴리오에 적용되어 Armv9 아키텍처 전반을 가속화합니다. 컴퓨팅 성능.

Armv9 아키텍처 개발에서 Fujitsu의 역할


슈퍼 컴퓨터 분야에서 풍부한 경험을 가진 기업으로서 Fujitsu는 Arm과 협력하여 Arm 프로세서를 확장하기위한 SVE 명령어 세트를 개발했습니다. SVE 명령어 세트는 Armv8 기본 사양의 일부가 아니라 확장이지만 Armv9에서는 표준 사양의 일부가되었습니다. 1 세대 제품인 SVE는 응용 프로그램의 범위가 제한되어 있고 HPC 워크로드를 더 많이 대상으로하지만 그 역할을 무시할 수 없습니다.

 

Arm과 Fujitsu의 협력 결과는 현재 세계 최고의 슈퍼 컴퓨터 시스템 "Fugaku"에서 사용하는 칩인 SVE 명령 세트를 사용하는 최초의 Arm 기반 프로세서 인 A64FX로, 그 성능은 상당히 눈길을 끕니다. .

 

Fujitsu의 소개에 따르면 A64FX는 TSMC의 7nm FinFET 프로세스를 사용하여 제조되며, 동일한 구조의 48 개의 컴퓨팅 코어와 4 개의 관리 코어를 포함하여 88 억 6600 만 개의 트랜지스터, 596 개의 신호 핀 및 52 개의 통합 코어가 포함되어 있습니다. 52 개의 코어는 모두 4 개의 그룹으로 나뉘며 각각 13 개의 코어가 있으며 8MB L2 캐시를 공유합니다. 각 그룹 간의 상호 연결은 6D 메시 / 토러스 온칩 상호 연결 네트워크 인 Fujitsu의 2 세대 TOFU를 사용합니다. 동시에 32GB HBM2 메모리, 16 개의 PCIe Gen3 채널 및 1024GB / s 스토리지 대역폭을 갖추고 있습니다. 2.7 TFLOPS @ 64bit 및 21.6 TFLOPS @ 8bit의 성능을 제공 할 수 있습니다.

기본적으로 A64FX는 비싸다는 것 외에 단점이없는 제품입니다. A64FX의 공동 개발 과정에서 Arm과 Fujitsu는 슈퍼 컴퓨팅 시스템에서 많은 R & D 경험을 쌓았으며 Armv9 아키텍처에 대한 표준 및 사양의 후속 공식화를위한 견고한 기반을 마련했습니다.

 

인공 지능, 기계 학습 및 데이터 분석과 같은 프로젝트가 경제 생산 및 일상 생활에서 보편화됨에 따라 데이터 센터 및 슈퍼 컴퓨터 시스템이 점점 더 많은 관심을 받게 될 것입니다. Intel과 AMD의 x86 프로세서가 지배하는이 시장은 당연히 Arm이 미래에 참여하기를 원하는 곳입니다. 이 영역에서 Fujitsu A64FX 프로세서는 Arm 아키텍처 칩의 성공적인 테스트라고 할 수있는 Arm의 첫 번째 샷을 발사했습니다.

 

x86 SIMD와 비교하여 SVE2의 장점은 무엇입니까?


현재 Armv8 아키텍처 프로세서를 사용하는 iPhone 또는 iPad 시리즈와 같은 제품의 경우 SVE 명령어 세트가 지원되지 않기 때문에 A64FX 용으로 만들어진 일부 코드를 실행할 수 없습니다. SVE 명령어 세트가 Armv9 아키텍처 표준의 일부가 되었기 때문에 가까운 장래에 Armv9 아키텍처 프로세서를 기반으로하는 차세대 모바일 장치가이를 수행 할 수 있습니다. 이러한 관점에서 보면 "슈퍼 컴퓨팅"의 주머니에 들어갑니다.

최신 마이크로 프로세서에서는 벡터를 처리하는 명령어를 SIMD 명령어라고합니다. 기술적으로 말하면 Arm의 Neon 및 SVE 명령어 세트는 단일 명령어 다중 데이터 스트림의 약자 인 SIMD 명령어의 한 형태로 간주 될 수 있습니다. 간단히 말해서, CPU에 명령을 내리면 동시에 여러 값에 대해 동일한 작업을 수행하게됩니다. 이러한 유형의 명령어 세트는 실제로 매우 일반적입니다. x86 마이크로 프로세서에서 멀티미디어 처리 및 비디오 인코딩 및 디코딩 작업을 더 빠르게 수행하려면 MMX, SSE 시리즈 및 현재 AVX 시리즈를 포함한 명령어 세트 를 사용하십시오 . 모두 유사한 아이디어와 효과를 가지고 있습니다.

 

그러나 현재 x86 SIMD 명령어에는 특정 문제가 있습니다. 예를 들어, 동일 해 보이는 일부 명령은 매개 변수가 다르기 때문에 독립적 인 명령으로 코딩됩니다. 또한 벡터 레지스터는 64 비트의 MMX에서 512 비트의 AVX-512로 확장됩니다. 그러나 벡터 레지스터의 길이는 x86 SIMD 명령어의 SIMD 명령어로 인코딩되므로 다음과 같은 명령어를 추가해야합니다. 다른 길이로 벡터를 처리합니다. 새로운 확장 및 명령어를 레지스터에 추가해야하므로 인텔이 더 큰 벡터 레지스터를 제공 할 때마다 벡터 레지스터 길이의 변경 사항에 적응하기 위해 많은 수의 새 명령어를 추가해야합니다. 1978 년 이후 IA-32 명령어 세트는 주로 SIMD 명령어에 의해 구동되는 80에서 1400으로 증가했으며 결국 점점 더 부풀어지고 컴파일이 더 번거로워졌습니다.

 

x86 초기에는 프로세서의 제조 공정을 비교적 쉽게 개선 할 수있었습니다. 기하학적 레벨에서 트랜지스터의 수를 쉽게 늘릴 수있었습니다. 명령 세트의 수가 너무 많지 않았습니다. 더 큰 벡터 레지스터를 추가하는 것도 어렵지 않습니다. 매년 새로운 지침을 추가하는 것도 정상입니다. 그러나 공정 개발이 ​​점점 더 어려워지고 너무 높은 트랜지스터 밀도로 인한 다양한 문제가 발생함에 따라 이러한 방식으로 성능을 향상시키는 것이 약간 불가능해질 수 있습니다. 현재 인텔의 11 세대 코어 시리즈 프로세서의 성능은 소비자 수준 플랫폼에서 AVX-512 명령 집합을 사용하는 효과에 대해 모두에게 분명합니다.

 

일반적으로 x86 프로세서를 사용하는 영역은 더 크게 만들 수 있으며, 전력 소모량이 많아도 문제가되지 않을 수 있습니다. 그러나 Arm 아키텍처 프로세서는 대부분 소형 장치에 사용되며 전력 소비 및 열 방출에 민감하므로 매우 신중하게되었습니다. 더욱 중요한 것은 Arm이 자사의 아키텍처가 소형 임베디드 장치에서 "Fugaku"와 같은 슈퍼 컴퓨팅 시스템에 이르기까지 광범위한 분야를 포괄하도록 노력하고 있다는 것입니다. Arm은 또한 서로 다른 명령 세트를 제공하거나 서로 다른 시장 세그먼트에 대해 서로 다른 구성 표준을 제공 할 수 있지만 모든 Arm 아키텍처 칩에서 소프트웨어를 컴파일하고 실행할 수 있으며 이는

Arm의 관심사에 더 부합하고 아키텍처의 이점을 극대화합니다.

 

Arm이 x86 사고 방식을 따른다면 분명히 원하는 효과를 얻지 못할 것입니다. SVE / SVE2 명령어 세트를 사용하면 Arm이 다양한 유형의 칩에 가변 길이 벡터 레지스터를 제공 할 수 있습니다. 벡터 레지스터의 최소 길이는 128 비트이고 최대 길이는 2048 비트입니다. Armv9 아키텍처 칩이 실행되는 것과 상관없이 벡터의 가변 길이는 128 비트입니다.

 

향후 스마트 폰에 사용되는 Arm 프로세서는 128 비트 벡터 레지스터를 사용할 수 있습니다. 슈퍼 컴퓨팅 시스템에서는 2048 비트 설계를 사용할 수 있습니다. 코드는 더 높은 성능을 달성하기 위해 벡터 레지스터의 길이를 최대한 활용할 수 있습니다. 즉, 현재 x86 SIMD 명령어로는 불가능한 슈퍼 컴퓨팅 시스템과 일반인의 스마트 폰에 동일한 코드를 실제로 적용 할 수 있으며, 디코딩 및 관리해야하는 명령어가 적고 캐시도 훨씬 적습니다.

 

어떤 사람들은 SVE2가 SVE와 다른 이유는 무엇입니까? 어떤 변화를 가져 왔습니까?

 

SVE 명령어 세트는 Armv8 아키텍처의 선택적 확장으로, 고성능 컴퓨팅의 요구 사항을 충족하도록 설계되었으며 적용 가능성이 제한적입니다. 대부분의 사용자는 Arm의 Neon 명령어 세트를 더 많이 사용하고 멀티미디어 워크로드가 자신의 요구에 더 적합 할 수 있습니다. 이러한 유형의 작업에는 기본적으로 긴 벡터 레지스터가 필요하지 않습니다. 한편 SVE2 명령어 세트는 SVE 명령어 세트의 단점을 완벽하게 보완 한 반면, 원래 Neon 명령어 세트가 수행해야하는 작업을 기본적으로 달성했으며 효율성과 유연성이 향상되었습니다. 벡터 레지스터의 작업은 짧은 벡터 레지스터를 사용하는 작업에도 적합합니다.

Arm은 미래에 예상 될 수 있으며 x86은 실제 도전에 직면 할 것입니다.


앞으로 사용자는 Armv9 아키텍처를 사용하여 실제 용도에 따라 가장 작고 가장 에너지를 절약 할 수있는 칩이거나 최고 성능이 필요한 칩을 사용하여보다 적합한 칩을 설계 할 수 있으며 사용자는 한 번만 컴파일하면됩니다. 이것은 또한 Arm이 몇 년 후 많은 수의 새로운 SIMD 명령을 추가하는 것을 고려하지 못하게하여 Intel과 AMD 간의 SIMD 명령 군비 경쟁에 참여할 수 있도록합니다. SVE2 명령어 세트는 Arm 아키텍처 칩을 사용하는 사용자에게 안정성과 개발 공간을 제공하는 플랫폼을 제공합니다. 개발자가 Arm 코드를 작성하고 최적화하는 것이 더 쉬워 져 기계 학습, 얼굴 인식 및 음성 인식 프로그램 작성에 도움이됩니다. , 대상 플랫폼이 이러한 지침을 지원하는지 여부에 대해 걱정할 필요가 없으며 기내 장비가 더욱 다양해집니다.

실제로 Arm과 마찬가지로 RISC-V는 명령어 세트 유형에서 동일한 추구를합니다. 향후 몇 년 안에 Intel과 AMD는 심각한 도전에 직면하게 될 것입니다. 머신 러닝, 인공 지능, 데이터 센터, 슈퍼 컴퓨팅과 같은 고성능 및 고수익 분야에서는 서로 마주하지 않고 Arm 또는 RISC- V와 같은 새로운 힘은 강력한 영향을 미칩니다. Armv9 아키텍처의 출시는 Arm의 발전 방향을 지적했으며 미래의 길은 점차 빛을 보여주었습니다.


하드웨어 갤러리

포인트 지급 글 작성(5점) / 댓글(2점) 권한 조회(Lv.0 이상) / 작성(Lv.1 이상)

List of Articles
번호 분류 제목 글쓴이 조회 수
Hot글 일반/잡담 써멀구리스 추천받고 싶습니다. 1 ㅇㅇ 1492
Hot글 롤 프레임 질문있습니다 2 file ㅇㅇ 1500
Hot글 3500x 기본쿨러로 버티기 힘든가요?? 1 ㅇㅇ 1508
4851 하드웨어팁 cpu와 쿨러방열판이 합체되었을 때 분리하는 법 file ㅇㅇ 11
4850 정보 추가) 뉴 월드의 베타 버전을 플레이하면 그래픽카드가 죽는다? file ㅇㅇ 21
4849 정보 Neo Forza, DDR4-5000와 DDR4-4600 메모리 키트 발표 file ㅇㅇ 13
4848 정보 2021.07.22 02:12 크루셜 P5 플러스. PCIe 4.0 SSD file ㅇㅇ 13
4847 정보 코어 i9-12900K QS, 시네벤치 R20에서 5950X보다 높음 ㅇㅇ 16
4846 정보 라이젠 3 5300G, FCLK 2.4GHz로 오버클럭 file ㅇㅇ 13
4845 정보 라데온 RX 6600 XT의 사진 유출 file ㅇㅇ 13
4844 일반/잡담 중국 최초의 12인치 웨이퍼 재생시설이 양산에 성공 ㅇㅇ 18
4843 일반/잡담 v file ㅇㅇ 11
4842 일반/잡담 인텔 Xe DG1 그래픽의 벤치마크 file ㅇㅇ 11
4841 일반/잡담 14코어 알더레이크-P의 긱벤치 결과 ㅇㅇ 13
4840 일반/잡담 지포스 RTX 40, 에이다 러브레이스가 TSMC 5nm로 제조 ㅇㅇ 17
4839 일반/잡담 Loongson 3A5000 프로세서 정식 발표 file ㅇㅇ 16
4838 일반/잡담 메테오레이크의 후속작, 루나레이크 ㅇㅇ 14
4837 일반/잡담 인텔 2021년 2분기 실적 발표 file ㅇㅇ 14
4836 파워컬러, 24개의 라데온 RX 6600 XT/6600을 등록 file ㅇㅇ 14
4835 일반/잡담 씨게이트, 앞으로 몇 달 안에 20TB PMR 하드를 대량 출시 file ㅇㅇ 15
4834 정보 Puget 시스템, 인텔보다 AMD 프로세서를 더 많이 판매함 file ㅇㅇ 13
4833 일반/잡담 2700x vs 8700K 성능차이 비교하기 file ㅇㅇ 13
4832 정보 ASRock Industrial, NUC 6000 BOX, iBOX 6000 및 NUC 6000 마더 보드 공개 file ㅇㅇ 979
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 243 Next
/ 243
위로