banner

ニュース

May 26, 2023

富士通がフォークアームサーバーチップラインに雲を追いかける

チップに関しては、キッカーとフォークの間には大きな違いがあります。

キッカーは、アーキテクチャと設計を実装し、コアのパフォーマンス (CPU に関してはコアという言葉の二重の意味でのコア) を向上させるためのマイクロアーキテクチャの強化を含む後継製品であり、チップ製造プロセス (および現在はパッケージング) を利用して、ソケット内でパフォーマンスをさらに拡張します。

分岐点はある種の分岐点であり、ロバート・フロストが言うように、文字通りすべての違いを生み出す道の分岐点です。 Arm、Power、そして現在の X86 市場における大きなコアと小さなコアの違いなど、互換性が存在する可能性があります。 IntelとAMDは今年、サーバーCPUラインにビッグ・リトル・コア戦略を導入する予定で、AMDは「Bergamo」Epycsに、Intelは「Sierra Forest」Xeon SPに導入する予定だ。 Intel は 10 年半にわたって X86 互換の Atom および Xeon チップ、そして現在は E および P コアを搭載しているため、世界最大の CPU メーカーにとってこれはまったく新しいことではありません。

そして、この種のフォークは、日本のCPUおよびシステムメーカーである富士通が将来の「モナカ」および「富岳-ネクスト」プロセッサで行うことになると我々が考えているものであり、前者は最近明らかにされ、後者は臭いとホワイトボードに載った。マーカー – そう、これは日本の文部科学省による実現可能性調査の始まりであり、教育、文化、スポーツ科学は変数 X であり、したがって略語の文部科学省を構成しています – 遡ります。 2022 年 8 月。

富士通は、64 ビット精度浮動小数点の 10 ペタフロップスの壁を突破するために 2006 年に開始された 12 億ドルのスーパーコンピューター「Keisuko」K の設計以来、国内有数の HPC 研究センターである理化学研究所の緊密なパートナーです。富士通は、9 億 1,000 万ドル、513.9 ペタフロップスの「富岳」スーパーコンピュータの後続モデルの設計を 2012 年に開始しました。富岳システムは、Sparc64 アーキテクチャからカスタムのベクトルターボチャージャーを備えた Arm アーキテクチャに切り替えました。は 2020 年 6 月に納入され、2021 年に完全稼働し、その 1 年後に予定通り富岳 Next システムの作業が開始されました。

昨年11月のSC22で富士通と理化学研究所が発表したロードマップによると、富岳Nextマシンは「2030年頃」に稼働する計画となっており、そのタイミングが重要となる(これについては後ほど説明する)。

取り組んでいる研究アイデアと富岳ネクストで具現化された技術と、誰が取り組んでいるかを以下に示します。

従来の HPC と AI の組み合わせ、および量子コンピューティングとニューロモーフィック コンピューティングの追加など、6 ~ 7 年後に導入されるマシンに期待されるすべてのアイデアがそこにあります。 将来のスーパーコンピューターが強力になるのは間違いありませんが、さまざまな種類のコンピューティングと、連携して動作するさまざまな小規模アプリケーションのワークフローで構成されるアプリケーションが混在するため、「スーパー コンピューティング」というよりも「フロー コンピューティング」と呼ぶほうが適切かもしれません。 、シリアル方式または反復ループのいずれかで。

重要なのは、富士通と理化学研究所が「既存のエコシステムとの互換性」と「高帯域ネットワークで接続された異種システム」を強調していることだ。 富士通はさらに、富岳-Nextシステムのアーキテクチャは新興の高密度実装を使用し、エネルギー効率が高く高性能のアクセラレータ、低遅延、高帯域幅メモリを備えていると述べている。

歴史を参考にすると、日本のスパコンは間違いなく稼働開始の前年にマシンが設置されることになるので、富岳Nextが設置されるのは「2029年頃」ということになる。

このことを念頭に置いて、富士通が日本政府の新エネルギー・産業技術総合開発機構(NEDO)の支援のもとで開発を進めているCPU「モナカ」を見てみましょう。 2 月末、富士通、NEC、AIO Core、キオクシア、京セラはすべて、よりエネルギー効率の高いデータセンター処理と相互接続に取り組むよう依頼されました。 具体的には、NEDO の取り組みでは、エネルギー効率の高いサーバー CPU とフォトニクスを強化する SmartNIC の実現を目指しています。

この取り組みの中で、富士通は富岳システムの中核となる A64FX Arm プロセッサの派生プロセッサを開発しているように見えますが、人々はこれを、Monaka が富岳 Next システムで使用される後継プロセッサであるという意味と混同しています。 。

まさに「富士通はこの技術をさらに磨き上げ、次世代のグリーンデータセンターで使用できる低消費電力CPUを開発する」と述べられていた。

NEDO パートナーに割り当てられたタスクは次のとおりです。

Monaka CPU は 2027 年に開発される予定で、より低いエネルギー消費でより高いパフォーマンスを提供することを目指しています。

これがどのように実現するかは不明ですが、意味するところは、それが Arm ベースのサーバー プロセッサであるものの、HPC や AI センター向けではなく、ハイパースケーラーやクラウド ビルダー向けに最適化されたものになるということです。 これは、A64FX (または富岳 Next システムの A64FX へのキッカー) と比較してコア数が増え、ベクトル処理が少なくなることを意味し、おそらく AI 推論用の低精度行列演算ユニットが追加されることを意味します。 概念的には、Intel の「Sapphire Rapids」Xeon SP や、機能の点でザイリンクス DSP AI エンジンを搭載した将来の AMD Epyc プロセッサに似ていますが、Arm コアを搭載し、エネルギー効率を重視しており、ワットあたりのパフォーマンスがはるかに高くなります。

実際、富士通は、Monaka が実稼働システムに導入される 2027 年を見据えて、それが何であれ、「Another – 2027」CPU の 1.7 倍のアプリケーション パフォーマンスと 2 倍のワットあたりのパフォーマンスを実現できるだろうと述べています。

Monaka が A64FX のキッカーとなり、富岳 Next システムで使用されるプロセッサであると一部の人が信じ込まされている混乱の原因は、次の文です。「従来の HPC ワークロードを向上させるだけでなく、HPC ワークロードに高いパフォーマンスを提供します。 AI とデータ分析のワークロード。」

しかし、私たちが頻繁に指摘している問題は次のとおりです。HPC とは、いかなるコストを払ってでもパフォーマンスを得ることが目的であり、ハイパースケーラーとクラウド ビルダーは、最低のコストと最低の電力で最高の妥当なパフォーマンスを得る必要があるのです。

これらはまったく異なる設計ポイントであり、クラウドで HPC を構築することはできますが、Web アプリケーションの実行に最適化されたクラウドを構築し、HPC シミュレーションやモデリング、さらには AI トレーニング ワークロードでさえも適切な動作を期待することはできません。 およびその逆。 HPC クラスターは低コストおよび低消費電力向けに最適化されていないため、Web アプリケーションには不適切な選択となります。 もちろん、クラウド内のノードの 20% に InfiniBand と多くの GPU を備えたファット ノードを配置することで、クラウド モデルで実際の HPC システムを販売することはできますが、単純なバニラ クラウド インフラストラクチャほど安くはなりません。それはその異なるデザインポイントを持っています。

富岳-Next はヘテロジニアスな「フロー コンピューター」スタイルのスーパーコンピューターであるため、クラウド インフラストラクチャを目的とした Monaka Arm CPU へのキッカーが富岳-Next システムに組み込まれる可能性があると考えるのは非常に合理的です。 しかし、これは A64FX の後継機が存在しないと言っているのと同じではありません。A64FX は、Arm コア上で大量の L3 キャッシュをスタックしプロセスを縮小することで、2028 年までにパフォーマンスが 10 倍向上する可能性があることが研究者らによってすでに示されています。 これには、A64FX コアのアーキテクチャ上の改善はなく、ここで微調整が行われることはご存知のとおりです。

私たちは、2 年間のプロセッサ サイクルを考慮すると 2029 年に期待される Monaka の後継機が富岳 Next に組み込まれる可能性がはるかに高いと考えていますが、それがシステム内の唯一の CPU になる可能性は非常に低いと考えています。 – 経済タンクと文部科学省と NEDO が資金を共有する必要がない限り。

大不況により、富士通がスカラー CPU、NEC がベクトル CPU、そして日立が現在 Tofu として知られるトーラス相互接続を行う当初の「Keisuko」プロジェクトが台無しになりました。 NECと富士通は、プロジェクトの費用が高すぎて、コストをカバーできるほどこの技術が商業化できるとは考えていなかったため、撤退した。 富士通がプロジェクトを引き継ぎ、見事に成果を上げましたが、Sparc64fx と A64FX から収益を上げるのは困難だったのではないかと思われます。

しかし、富士通が理化学研究所との関係のおかげで政府の支援を得ていること、そして最速のスーパーコンピューターに関しては独立したいという日本の願望があれば、そんなことは問題ではない。 サプライチェーンの独立性の価値について 2009 年に真実であったこと (多くの国がスーパーコンピューターの利便性と低コスト化のために無視していました) は、2029 年にはさらに真実になります。

富士通は具体的には明らかにしていないが、理化学研究所所長で東京工業大学教授の松岡聡氏は、モナカが富岳ネクストマシンに使用されているとの報道について自身のツイッターフィードで次のようにコメントした。モナカは #富岳NEXT を強化するものであり、それは確かに検討中の技術要素の 1 つです。」 しかし、彼は次のようにも付け加えました。「#HPC(AI、BD 付き) はもはやニッチ市場ではないため、重要なのはシングルトン *** スケールのマシンを作成することではなく、SC、クラウドなどにまたがる S&T プラットフォームを作成することです。そのためには、SW の汎用性と市場浸透性、特にハイパースカラーが必須です。同じビジョンを共有するベンダーと提携していきます。」

Furaku-Next では 2 つの Arm CPU が使用されると考えています。1 つは AI 推論と一般的な CPU ワークロードに特化し、もう 1 つは非常にハードな HPC シミュレーションと AI トレーニングを実行するように調整されています。 必要に応じて、A64FX2 および Monaka2 と呼んでください。 チップが 1 つになる唯一の方法は、K マシンで起こったように、予算がやむを得ない場合です。

しかし、これは明らかに単なる推測であり、私たちは様子を見守る必要があります。

今週のハイライト、分析、ストーリーを、何も挟むことなく直接あなたの受信箱にお送りします。今すぐ購読してください。

共有