東京大学 医科学研究所 ヒトゲノム解析センターは、日立との協創のもと2022年4月1日から新世代データサイエンスコンピューティングシステム「Shirokane6」の運用を開始。稼働中の「Shirokane5」とあわせ、ライフサイエンス分野では国内最大級の演算性能を持つ計算機システム「SHIROKANE」の基盤を強化しました。

パーソナルゲノムに基づく個別化医療を支援

画像1: 東京大学 医科学研究所 ヒトゲノム解析センター(スーパーコンピューター導入事例)ライフサイエンス分野で国内最大級の演算性能を誇るスーパーコンピューター 「SHIROKANE」の最新システムが稼働開始

東京大学 医科学研究所
ヒトゲノム解析センター
井元 清哉 氏

 近年のゲノム研究は個人の全ゲノムを解析し、がんや難病の治療・予防に役立てる「個別化医療」をめざしています。その中で東京大学 医科学研究所 ヒトゲノム解析センター(以下、HGC)は、日本のゲノム解析の中核拠点として1993年からスーパーコンピューターシステムを導入し、2009年には「SHIROKANE」(※1)と名付けたシステムが稼働開始。全国の大学、研究所、医療機関、民間企業などに広くそのリソースを提供してきました。

 「SHIROKANEは日本のゲノム研究、生命科学を加速させる非常に大きな基盤となっています。このシステムを活用して日本からも、がんゲノミクスにおける世界トップクラスの成果が次々と生み出されています」と語るのは、HGCセンター長の井元 清哉氏です。

 SHIROKANEはシステム更新時の停止期間を最小化するため、片系が停止している場合もユーザーに継続したサービス提供が行える“2世代1システム”の構成をとっています。これまでは2017年運用開始のShirokane4と、2019年運用開始のShirokane5の2台体制でしたが、近年のゲノム研究活発化にともない、ユーザー数が年間1,000名近く増加。蓄積されるデータ量も増加の一途をたどっていたため、Shirokane4をリプレースして、より強固な解析基盤の構築をめざすShirokane6の開発計画が進められてきました。

 その仕様策定にあたったHGC技術専門職員の斉藤 あゆむ氏は、「前回のShirokane5は計算サーバーをメインに強化しました。それに対して今回のShirokane6は、ユーザー数の増加によるストレージ帯域の過負荷を解決するため、より高速で安定的かつ拡張可能なストレージの実装を大きなポイントに据えました」と振り返ります。

※1 HGCのある白金台キャンパスにちなんで命名

SHIROKANEの構築・運用を支え続けてきた日立

 Shirokane6の開発・運用パートナーとして総合評価方式入札で選定されたのが日立です。日立はSHIROKANEの運用が始まって以来、一貫して歴代システムの構築・運用を担当してきました。今回の選定でも日立は、HGCが求める要件に対し、多様なサーバー/ストレージ/ネットワーク製品を精査・検証しながら、性能・費用の両面で適切なソリューションを提案。システム稼働後の運用計画も見据えた内容が高く評価されました。

 「SHIROKANEではピーク時に15,000ジョブ、年間では5,100万を超えるゲノム解析ジョブが並列的に実行されます。この数は他の分野で使われるスーパーコンピューターに比べて2桁以上多い数になります。そうしたばく大なジョブを安定的にさばき、稼働も止めない運用を日立さんは長年支え続けてきた実績があります。またゲノム解析ではオープンソースソフトウェアを中心とした扱いづらいプログラム群をユーザーが独自に投入する状況も多々あります。それについても経験豊富な日立のエンジニアの方々が適切な形で対応してくれる一方で、ユーザビリティも着実に改善するなど、この業務を深く理解されていることが分かります。今回の提案にもその経験とノウハウがしっかり生かされていました」と、井元氏は語ります。

画像2: 東京大学 医科学研究所 ヒトゲノム解析センター(スーパーコンピューター導入事例)ライフサイエンス分野で国内最大級の演算性能を誇るスーパーコンピューター 「SHIROKANE」の最新システムが稼働開始

東京大学 医科学研究所
ヒトゲノム解析センター
斉藤 あゆむ 氏

 Shirokane6の稼働開始までには限られた期間内に共有ディレクトリのホームディスクと長期保存用のアーカイブディスク、計18PB(※2)もの膨大なデータを新しいストレージに移行する必要がありました。日立はコロナ禍(か)による半導体枯渇の影響で機器搬入が遅延するなか、その影響を最小化する提案を行い、計画どおりの日程でデータ移行を実現しました。

 「今回はスーパーコンピュータールームの空調設備も入れ替えたのですが、他部署との工事の順番で、一時的に冷却性能が低下する可能性が出てきました。それについても日立さんは仮設冷却装置の設置やエアフロー(暖気と冷気の通路)の見直し、室内温度の細かな監視などを行ってくださり、システムを止めずに乗り切ることができました。IT機器だけでなくセンター全体のファシリティまで考慮した対応にとても感謝しています」と斉藤氏は語ります。

※2 1PBは1,000TB

最先端クラスのゲノム解析プラットフォームが稼働

 2022年4月1日より稼働を開始したShirokane6は、Shirokane4に比べ2倍以上のコア数の計算サーバー群を導入。Shirokan4からの切り替えにより、SHIROKANE全体のCPU総コア数が19,632コアに増加しました。複数のゲノム解析ツールの性能結果から選定した最新世代CPUと、ばく大なデータI/Oに耐えうる24PB(32PBまで拡張可能)の大容量高速ストレージを新たに導入したことで、ゲノム解析の実行時間とユーザーのジョブ待ち時間それぞれの短縮が見込まれています。

 「これだけ大規模なスーパーコンピューターを約2年周期で半分ずつ入れ替えていく事例は珍しく、正直なところわれわれにとってもベンダーにとってもとても労力のかかる作業です。しかしユーザーに対して常に最新の技術とユーザビリティを提供し、その研究を加速させていくという意味では大変意義があることです。こうした作業を10年来続けてこられたのは、常にタイミングよく新しい提案をくださり、安心して基盤運用を任せられる日立さんのおかげです」と、斉藤氏は評価します。

 井元氏も「SHIROKANEは今後、日本のゲノム研究を一段と進化させ、ゲノム情報を活用したSociety 5.0時代の個別化医療の実現に貢献する重要な社会インフラとなっていくはずです。その継続的な強化と安定的な運用、さまざまなユーザーニーズを満たすソリューションの提供において、日立さんはベストな協創パートナーだと考えています。これからも引き続き、力強い支援をいただければうれしいですね」と期待を寄せます。

 個別化医療の推進や新型コロナウイルス感染症(COVID-19)の感染拡大を受け、ゲノム情報を活用した研究ニーズが一段と高まっています。日立は今後もHGCとともに、日本のゲノム解析のインフラとなるSHIROKANEの進化をサポートし、研究推進やライフサイエンス分野の進展などに貢献していきます。

画像3: 東京大学 医科学研究所 ヒトゲノム解析センター(スーパーコンピューター導入事例)ライフサイエンス分野で国内最大級の演算性能を誇るスーパーコンピューター 「SHIROKANE」の最新システムが稼働開始
画像4: 東京大学 医科学研究所 ヒトゲノム解析センター(スーパーコンピューター導入事例)ライフサイエンス分野で国内最大級の演算性能を誇るスーパーコンピューター 「SHIROKANE」の最新システムが稼働開始

お客さまプロフィール

東京大学 医科学研究所 ヒトゲノム解析センター

[所在地] 東京都港区白金台4-6-1
[設立] 1991年

東京大学 医科学研究所 ヒトゲノム解析センターのWebサイトへ

スーパーコンピューターシステム SHIROKANE

スーパーコンピューターシステム SHIROKANEのWebサイトへ

他社登録商標
本記事に記載の会社名、商品名、製品名は、それぞれの会社の商標または登録商標です。

お問い合わせ先・情報提供サイト

株式会社 日立製作所 公共システム営業統括本部

お問い合わせは、こちらから

This article is a sponsored article by
''.