シミュレーションとリアルを融合するデータ同化の技術で、これから何が起こるかをより正確に予測する
理研数理は、理化学研究所 計算科学研究センター(R-CCS)データ同化研究チームと連携し、データ同化技術の活用を支援します。
データ同化とは
シミュレーションは現実世界をモデル化して行われるので、その結果と現実世界の間にはどうしてもずれが出てきます。そこで、シミュレーションを実際の観測データとつきあわせ、シミュレーションの軌道を修正して「確からしさ」を高めることが行われています。これが「データ同化」です。理化学研究所R-CCSデータ同化研究チームでは、これまで気象分野で開発してきたデータ同化の手法を高性能スーパーコンピュータで効果的に使えるように高度化するとともに、さらに先端的なデータ同化理論の開発に取り組んでいます。これにより、気象シミュレーションの大規模化・高精度化への貢献が期待される一方、ほかの分野にもデータ同化の適用が広まっていくことが期待されます。
データ同化の手法
データ同化は統計数理学に基づいて行われ、いくつかの手法が知られています。理化学研究所R-CCSデータ同化研究チームでは、 LETKF (Local Ensemble Transform Kalman Filter: 局所アンサンブル変換カルマンフィルタ)法をはじめとする手法を用いて、より精度の高い計算を行うための改善を重ねてきました。
LETKF法
少しばらつきをもった複数の初期値(オレンジの楕円)からシミュレーションを行うと、結果のばらつきは大きくなります(青の楕円)。そこで観測値(赤の円)とつきあわせて結果を絞り込み(緑の楕円)、それをこの時点からのシミュレーションの初期値とします。
データ同化の応用事例
ゲリラ豪雨予測
ゲリラ豪雨を引き起こす積乱雲は、わずか数分の間に急激に発生、発達します。理化学研究所R-CCSデータ同化研究チームでは、3次元的に隙間なくスキャンするフェーズドアレイ気象レーダの特長を生かした立体的な「3D降水ナウキャスト手法」を開発しました。30秒毎に得られるフェーズドアレイ気象レーダの観測データをリアルタイムに処理し、10分後までの予測データを算出することができます。
スーパーコンピュータ「京」を用いたシミュレーションによるゲリラ豪雨の再現
理化学研究所R-CCSデータ同化研究チームは、2014年9月11日に神戸市付近に降った「ゲリラ豪雨」をシミュレーションで再現しました。
「京」と「フェーズドアレイ気象レーダ」の双方から得られる高速かつ膨大なデータを組み合わせることで、解像度100mで30秒ごとに新しい観測データを取り込んで更新する、空間的・時間的に桁違いの天気予報シミュレーションを実現し、実際のゲリラ豪雨の動きを詳細に再現することに成功しました。
詳細は、2016年8月9日プレスリリース「「京」と最新鋭気象レーダを生かしたゲリラ豪雨予測」を参照ください。
台風の予測
気象の予測はスーパーコンピュータを使った天気予報シミュレーションに基づいており、シミュレーションと実測データを融合する「データ同化」が予報の精度を左右します。理化学研究所R-CCSデータ同化研究チームは、ひまわり8号の10分ごとの赤外放射輝度データを、雲域も含めた全天候で数値天気予報に直接利用することに成功し、2015年最強の台風第13号(Soudelor)の急発達の予測の大幅な改善や、2015年9月関東・東北豪雨の雨量予測の改善などを実現しました。
COVID-19
COVID-19の流行は私たちの日々の生活を大きく変えました。様々な分野の研究者たちにとっても、COVID-19とそれがもたらす影響を理解し対抗するため、その知見を駆使することが求められています。理化学研究所R-CCSデータ同化研究チームでは、日々の入院者数、死亡者数、回復者数の観測を用いて、潜在的な無症候性者数および症候性者数を再帰的に分析し、同時に無症候性者罹患率に関するパラメータの推定を行っています。機械学習とデータ同化のアイデアを融合させることで、より信頼性の高い予測につながることが期待されています。
生命医科学における予測の問題に対する深層学習の応用
図は集中治療室のデータから敗血症の発症を予測するための再帰型ニューラルネットワークの基本構造の1例を示しています。最終的な予測モデルはこのユニット6個の合議制でできており、極めて高い予測性能を示しています。しかし深層学習を使っている以上、この強力な予測モデルがどういう仕組みで判断を下しているのか人間には理解ができません。そこでデータ同化など数理的手法を深層学習と融合させることで、説明不可能な予測システムを説明可能に変えていく方法を探求されています。
細胞内のシグナル伝達
細胞性粘菌の走化性シグナル伝達系の鍵となる分子であるPIP3は、走化性誘引物質の濃度勾配があると、その勾配に沿って細胞膜上に極性を形成することが知られています。しかし、走化性誘引物質の刺激がなくても、自発的に非一様分布をランダムな方向に形成し、進行波などのダイナミックな振る舞いを示します。このシグナル伝達系の数理モデルをデータ同化の方法と組み合わせることで、細胞の状態を推定する方法の開発が進んでいます。
理研データ同化スクール(基礎編)
理研数理は、理化学研究所・JSOLと共催にて、2024年度「理研データ同化スクール(基礎編)」を開催します。最先端のデータ同化理論を開発する、理化学研究所 計算科学研究センター データ同化研究チームから講師とチューターをお招きし、実践的で”使える”データ同化技術の習得をサポートします。今年度は、参加者・講師・チューターが一堂に会する合宿形式として開催し、講師や参加者間のコミュニケーションを深め、データ同化コミュニティのさらなる拡大やレベルアップへの貢献を図ります。
2020年度「理研データ同化オンラインスクール(基礎編)」第1回目講義(抜粋)
2020年度の「理研データ同化オンラインスクール(基礎編)」の第1回目講義から、冒頭の「講義・実習の流れ」と「題材であるLorenz-96モデルの説明」、「データ同化の基礎となる Kalman Filter の式の説明」を抜粋して動画を用意しました。ぜひ、ご覧になった上で、本スクールの申込についてご検討ください。
※当スクールの進め方や講義の雰囲気の参考としてご覧ください。
本スクールのポイント
- データ同化研究の第一人者である、理化学研究所 三好建正氏による講義
- 「講義」+「少人数クラスでの演習・チュータリング」で、基礎から学べる実践的なカリキュラム
- アカデミア・企業から130名以上の受講実績(※)
- 「シミュレーション」×「観測・計測データ」の融合によって、精度向上やデータ品質保証を目指すなど、様々な目的での受講
※理化学研究所/理研数理にて開催された過去の理研データ同化合宿/オンラインスクール(基礎編・応用編)の実績です。
これまでの受講目的(例)
- 【材料:企業】 材料開発における分子動力学シミュレーションやマテリアルズインフォマティクスの高度化(企業からの参加者)
- 【バイオ:企業】 バイオインフォマティクスや細胞シミュレーション等でのモデル開発の高度化(企業からの参加者)
- 【機械:企業】 リアルタイムでの性能モデルや異常検知モデルの更新(企業からの参加者)
- 【重工:企業】 数値シミュレーションとデータ同化技術を組み合わせた製品品質の予測(企業からの参加者)
- 【製造:企業】 IoT技術とデータ同化による機器の劣化度や故障の予測(企業からの参加者)
- 【ヘルスケア:アカデミア】 医療現場における大量の患者データとシミュレーションを融合(アカデミアからの参加者)
- 【バイオ:アカデミア】 生物の時系列データに関して測定点間の補間や内部状態の推定(アカデミアからの参加者)
- 【アグリ:アカデミア】 データ同化による農作物の収量予測の高精度化(アカデミアからの参加者)
- 【防災/減災:アカデミア】 準リアルタイムの洪水予測の精度向上(アカデミアからの参加者)
- 【環境:アカデミア】 ビッグデータ取得とデータ同化により生態系を可視化・予測 (アカデミアからの参加者)
参加者の声
- 実装と理論の双方から理解が深められた点がとても参考になりました。
- 受講生で参加し、手を動かしてコーディングをしたことでかなり理解が深まった。
- 最先端のデータ同化研究者である講師・チューターから、実装上の工夫やはまりやすいポイントをいろいろと伺うことができ、とても参考になった。
- 実際にコードを書くというスクールの方針は、データ同化を理解する上で役立ちましたし、必須であったと思います。
理化学研究所R-CCSデータ同化研究チームのご紹介
理化学研究所R-CCSデータ同化研究チームでは、シミュレーションと実測データを最も効果的に融合することをめざし、高度なデータ同化手法やデータ同化の幅広い応用に関する先端研究に取り組んでいます。
特に、高性能なスーパーコンピュータによる「ビッグシミュレーション」と新型センサから得られる「ビッグデータ」を生かすための効率的かつ高精度なデータ同化に向けたチャレンジに取り組んでいます。
具体的には、
- 効率的かつ高精度なデータ同化に向けた基礎理論やアルゴリズム研究
- 高性能スーパーコンピュータおよび新型センサによる「ビッグデータ」を生かしたデータ同化の理論・応用研究
- 幅広いシミュレーション領域への新たなデータ同化応用を探る探索研究
に取り組んでいます。
これらの先進的なデータ同化研究により、シミュレーションの可能性を広げ、高性能スーパーコンピュータの有効活用につながっていくことが期待されています。
出典:理化学研究所 R-CCS データ同化研究チーム/開拓研究本部三好予測科学研究室の許可を得て、同チームウェブサイト(http://www.data-assimilation.riken.jp/)並びに同研究室ウェブサイト(http://prediction.riken.jp/)の文章・図を掲載(一部、理研数理が文章を改変)。