banner

ニュース

Apr 30, 2023

インテルがサファイアラピッズとHPCを正式に発売

ティファニー・トレーダー著

2023 年 1 月 10 日

何度かの遅れを経て、インテルは、Ice Lake の後継となる第 4 世代インテル Xeon スケーラブル プロセッサ (開発コード名: Sapphire Rapids) を発売しました。 Intel 7 ノード (以前は 10nm と呼ばれていました) で製造され、プロセッサあたり最大 60 個の Golden Cove コアと新しい専用アクセラレータ コアを搭載したこのプラットフォームは、前世代と比較して平均 1.53 倍の平均パフォーマンス向上と、ワットあたりの平均パフォーマンス 2.9 倍の効率を実現します。 Intel によれば、新しいアクセラレータを使用すると、対象のワークロードが改善されます。

本日、世界的なライブストリーミングウォッチパーティーとして開催されたこの発表会には、以前はそれぞれ「Sapphire Rapids HBM」と「Ponte Vecchio」と呼ばれていた、最近呼び名が変わったMaxシリーズのCPUとGPUも含まれていました。

Sapphire Rapids ファミリには、Max シリーズを含む 10 セグメントにグループ化された 52 の SKU (グラフを参照) が含まれています。11 は 2 ソケットのパフォーマンス (8 ~ 56 コア、150 ~ 350 ワット) に最適化されており、7 は 2 ソケットのメインライン パフォーマンスに最適化されています ( 12 ~ 36 コア、150 ~ 300 ワット)、10 のターゲット 4 および 8 ソケット (8 ~ 60 コア、195 ~ 350 ワット)、および 3 つのシングルソケット最適化パーツ (8 ~ 32 コア、125 ~ 250 ワット) )。 クラウド、ネットワーキング、ストレージ、メディア、その他のワークロード向けに最適化された SKU もあります。

「HPC 最適化」Xeon Max シリーズ SKU のラインナップには、32、40、48、52、および 56 コア バージョンが含まれます。 これらの 2 ソケット パーツ 5 つすべての最高出力は 350 ワットで、定価は 32 コア 9462 の 7,995 ドルから 56 コア 9480 の 12,980 ドルです。9480 Max シリーズより高価な SKU が 2 つあります。コア 8490H は 17,000 ドル、48 コア 8460H は 13,923 ドルです。

先月オレゴン州ヒルズボロで行われたプレスイベントで、Intel シニアフェローの Ronak Singhal 氏は、幅広い SKU について言及し、次のように述べました。「顧客は、SKU が多すぎると言うでしょう。SKU の数を減らすことはできますが、追加はできないでしょうかこれら 3 つの SKU は、本当に、本当に重要ですか? したがって、私たちはお客様とこのようにプッシュ&プルを行っています。」

第 4 世代インテル Xeon スケーラブル プロセッサーの新機能には、PCIe 5.0、DDR5 メモリー、CXL 1.1 のサポートが含まれます。

56 コア 8480+ トップオブビン 2 ソケット (非 HBM) パーツは、Ice Lake の対応物よりも 40% 多いコアを備え、多くのベンチマークで世代間のパフォーマンス向上を達成し、1.5 倍のパフォーマンスを実現しました。 Stream Triad では 1.4 倍、HPL では 1.4 倍、HPCG では 1.6 倍の改善が見られます。 Intel が十数個の実世界のアプリケーション (WRF、Black Scholes、Monte Carlo、OpenFoam など) でテストしたところ、同様の高速化が示され、物理ワークロードである CosmoFlow (2.6 倍) で最大の向上が見られました。

Max シリーズ CPU は、高帯域幅メモリを統合した初の x86 プロセッサです。 Intel によれば、メモリに制約されたワークロードのパフォーマンスが 3.7 倍向上し、必要なエネルギーは「導入された競合システム」より 68% 削減されます。 AlphaFold2 アプリケーションでは、Xeon Max CPU は Intel のテストで Ice Lake プロセッサよりも 3 倍の高速化を示しました。 HPC ベンチマーク ウォッチャーにとって注目に値する Max シリーズ プロセッサは、DDR のみの Sapphire Rapids 同等プロセッサと比較して、HPCG で約 2.4 倍、Stream Triad で 3.5 倍の高速化を実現します。 Max シリーズ CPU の HBM では、High Performance Linpack ベンチマークのパフォーマンスが向上しませんでした。

同じく本日発売された Max シリーズ「Ponte Vecchio」GPU には、最大 128 個の Xe HPC コアを備えた 47 タイル パッケージに 1,000 億個を超えるトランジスタが含まれています。 フォーム ファクターに応じて、最大 128 GB の HBM2e メモリをサポートし、最大 52 ピーク FP64 テラフロップスを実現します。 Intel が実施したベンチマークによると、Max シリーズ GPU と Max シリーズ CPU プラットフォームを組み合わせると (GPU:CPU 比 3 対 1)、GPU を使用しない Ice Lake プラットフォームと比較して、LAMMPS 分子動力学ワークロードのパフォーマンスが 12.9 倍向上します。 Max GPU (2 CPU サーバーに 6 つの GPU を追加) を追加すると、同じワークロードの場合、Max シリーズ CPU のみのプラットフォームと比較して 9.9 倍のブーストが得られました。 ホスト CPU 上の高帯域幅メモリにより、DDR5 のみを使用した場合と比較して 1.55 倍のパフォーマンス向上が可能になりました。 (先月オレゴン州ヒルズボロで行われたデモの写真。)

Max シリーズの両方のパーツは当初、Aurora スーパーコンピューターでデビューする予定でしたが、遅延のため、初期導入では Max シリーズの「Ponte Vecchio」GPU に加えて、HBM 以外の Sapphire Rapids が使用されています。 HBM を搭載した Max シリーズ CPU は、ロス アラモス国立研究所で建設中の HPE 製 Crossroads スーパーコンピューターでデビューすることになります。 研究者らは、コードを変更することなく、LANL での量産前 Intel Max ハードウェアのパフォーマンスが Intel Broadwell 世代の HPC システムと比較して最大 8.6 倍向上したと報告しています。 LANL の HPC プラットフォーム/プロジェクト プログラム ディレクターである Jim Lujan 氏によると、平均で 4 倍の改善が見られます。

Max シリーズの CPU 製品は、ローレンス リバモア国立研究所とサンディア国立研究所の CTS-2 システム、およびデルが両プロジェクトのサーバー パートナーである京都大学の Camphor 3 スーパーコンピュータにも選ばれています。 アルゼンチンはこの春、国家気象局に Lenovo の Max+Max システムを導入する準備を進めています。

Max シリーズ CPU は現在、アルゴンヌ国立研究所の Aurora のアップグレード パスの一部になっています。 現在導入されているインテル/HPE システムには、インテルがエクサスケール コンピューティング プラットフォーム (ECP) (エクサスケール コンピューティング プロジェクトへの明確な敬意) と呼ぶフォーム ファクターに、20,000 個の Sapphire Rapids CPU と 60,000 個の Max シリーズ GPU が搭載されています。 ラボでは今年、Max CPU HBM パーツを交換する予定です。 このプロジェクトに詳しいインテル関係者によると、新しい CPU の貼り付けには 5,000 時間程度かかる可能性があり、1 ブレード (x10,000 ブレード) あたり約 30 分かかると試算されています。

2 エクサフロップス以上のピークの Aurora システムのテクノロジーを評価およびデバッグするためのテストベッドは、オレゴン州ヒルズボロのジョーンズ ファーム サイトにあります。 Borealis と呼ばれるこのシステムは、2 ラック、128 ブレード システムであり、追加のテスト機会を提供するもう 1 つの 1 ラック、64 ブレード システムを備えています。 Borealis には、Sunspot という名前のツイン システムがあり、アルゴンヌに設置されて運用されています。 Sunspot は、アルゴンヌで今年打ち上げられる予定の Aurora スーパーコンピューターのテスト開発システムです。 Intel は現在、Max シリーズ CPU を使用して Borealis をアップデートしています。

組み込みのアクセラレーションと新しいライセンス オプション

Sapphire Rapids は、(2016 年に Xeon Phi「Knights Landing」製品でデビューした AVX-512 に加えて) 4 つの新しい専用アクセラレータを導入しました。

インテル アドバンスト マトリックス エクステンション (インテル AMX) は、自然言語処理 (NLP)、推奨システム、画像認識などのディープ ラーニング (DL) 推論とトレーニング ワークロードを高速化します。

インテル データ ストリーミング アクセラレーター (インテル DSA) は、ストリーミング データの移動と変換操作を改善することで、ストレージ、ネットワーキング、およびデータ集約型のワークロードのパフォーマンスを向上させます。

Intel In-Memory Analytics Accelerator (Intel IAA) は、CPU コアからタスクをオフロードしながら分析パフォーマンスを向上させ、データベース クエリのスループットやその他のワークロードを高速化します。

Intel Dynamic Load Balancer (Intel DLB) は、システム負荷の変化に応じてネットワーク データを複数の CPU コアに動的に分散することで、効率的なハードウェア ベースの負荷分散を実現します。

Intel On Demand (以前は Software-Defined Silicon、SDSi と呼ばれていました) と呼ばれる新しいサービスを使用すると、顧客はこれらのアクセラレータの一部をオンにするか、購入後にアップグレードするかを選択できます。 「オンデマンドにより、エンド顧客はフル機能のプレミアム SKU を柔軟に選択したり、Xeon プロセッサのライフサイクルを通じていつでも機能を追加したりできるようになります」と Intel は述べています。 価格はライセンス モデルによって異なります。 オンデマンドは現在、インテル ダイナミック ロード バランサー、インテル データ ストリーミング アクセラレーター、インテル インメモリー分析アクセラレーター、インテル クイック アシスト テクノロジー、およびインテル ソフトウェア ガード エクステンションの機能に適用されます。 Max シリーズ CPU とソケット スケーラブル (-H タグ付き) SKU にはオンデマンド機能がないことに注意してください。 8 コア シングル ソケット パーツ (3408U) も同様です。

Sapphire Rapids エコシステム パートナーには、AWS、Cisco、Dell Technologies、富士通、Google Cloud、HPE、IBM Cloud、Inspur、Lenovo、Microsoft Azure、Nvidia、Oracle、Supermicro、VMware などが含まれます。 Intel は、30 以上の Max シリーズ CPU システム設計が市場に投入され、Max シリーズ GPU に基づく 15 のシステム設計も開発中であると報告しています。

組み込みのアクセラレーションと新しいライセンス オプション
共有