SOLUTION
理研、九州大学、フィックスターズ、富士通による研究グループがスーパーコンピュータ「富岳」Graph500のBFS部門で世界第1位
2022.11.15 4:13 pm
6期連続で獲得、ビッグデータの処理で重要となるグラフ解析で最高の評価
理化学研究所(理研)、九州大学、株式会社フィックスターズ、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[1]のフルスペックを用いた測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS部門において、世界第1位を6期連続で獲得しました。
このランキングは、現在米国テキサス州ダラスのケイ・ベイリー・ハッチソン・コンベンション・センター・ダラスおよびオンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「SC22」に合わせて、Graph500 Committeeから11月14日(日本時間11月15日)に発表されます。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標です。
※共同研究グループ
理化学研究所 計算科学研究センター プログラミング環境研究チーム
チームリーダー 佐藤三久(サトウ・ミツヒサ)
上級技師 児玉祐悦(コダマ・ユウエツ)
技師 中尾昌広(ナカオ・マサヒロ)
九州大学 マス・フォア・インダストリ研究所
教授 藤澤克樹(フジサワ・カツキ)
株式会社フィックスターズ
エグゼクティブエンジニア 上野晃司(ウエノ・コウジ)
「富岳」測定結果
共同研究グループは、「富岳」のフルスペックである158,976ノード[2](432筐体)を用いて、通信性能の最適化などを行うことにより、約2.2兆個の頂点と35.2兆個の枝から構成される超大規模グラフに対する幅優先探索問題を調和平均0.34秒で解きました。「Graph500」のスコアは、102,955GTEPS(ギガテップス)[3]です。
Graph500ランキング
https://graph500.org
Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワーキング・サービスなどでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[4]に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することにより、新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)[5]」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用力を持つグラフ解析の性能を競うのが「Graph500」です。
「Graph500」には、BFS(Breadth-First Search:幅優先探索)部門とSSSP(Single-Source Shortest Path:単一始点最短路)部門があり、2010年に始まり(SSSP部門は2017年11月から)、そのランキングは年に2回(6月と11月)更新されます。BFS部門では頂点間の枝の長さが同じグラフを扱うのに対し、SSSP部門では頂点間の枝の長さが異なるグラフを扱います。
「Graph500」では大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能の最適化も重要になります。共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)~(3)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています注1)。
(1)複数のノード間におけるグラフデータの効率的な分割方法
(2)冗長なグラフ探索を削減するアルゴリズム
(3)スーパーコンピュータの大規模ネットワークにおける通信性能の最適化
「Graph500」のBFS部門における第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる「富岳」の優れた汎用性を示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもあります。今後、共同研究グループは、さらなる通信性能の最適化に加えて、冗長な探索の削減や各ノードにおけるメモリ使用量の均一化などに取り組む予定です。
理研 計算科学研究センター
https://www.r-ccs.riken.jp/jp/
注1)
本研究では以下の成果(アルゴリズムやプログラム)を活用しています。
1: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」
2: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」
3: 大規模グラフ解析プログラムの GitHubレポジトリ
https://github.com/suzumura/graph500/