Blog

2021.10.27

Research

深層学習を用いた物理探査技術の研究開発

Naoto Mizuno

エンジニアの水野尚人です。PFN は、深層学習を用いた物理探査技術の研究開発を三井物産株式会社との合弁会社 Mit-PFN Energy を通じて行なっており、この取り組みの成果を第 82 回 EAGE ANNUAL Conference & Exhibition という物理探査分野の国際会議で発表しました。この発表では、実用的な学習用データセット生成と、物理探査に適した深層学習モデルの構築という 2 つの課題を改善する手法を提案しました。本記事では物理探査に深層学習を用いる際に技術的にどのような難しさ・面白さがあるのかに触れつつ、発表内容について紹介します。

* 本記事の図はいずれも下記の発表からの引用です。

T. Shibayama, N. Mizuno, H. Kusano, A. Kinoshita, M. Minegishi, R. Sakamoto, K. Hasegawa, and F. Kachi. Practical deep learning inversion using neural architecture search and a flexible training dataset generator. 82nd EAGE Annual Conference & Exhibition, October 2021. https://www.earthdoc.org/content/papers/10.3997/2214-4609.202112777

Mit-PFN Energy の物理探査への取り組み

PFN は三井物産株式会社との合弁会社である Mit-PFN Energy 株式会社を 2020 年 8 月に設立し、地下資源開発や二酸化炭素の地下貯留において用いられる物理探査に機械学習技術を取り入れたシステムの研究開発・事業化に向けた取り組みを行なっています。

物理探査とは、物理的な信号を用いて地下の状況を解析する技術の総称です。用いられる物理現象は地震波・電磁気・重力などさまざまですが、この記事では地震波を用いる地震探査、特に人工的に発生させた地震波が地層境界で反射して地表面で観測される反射法地震探査について扱います。また、P 波速度を解析対象の物理量とします。

反射法地震探査でよく行われる観測設定として地震波の観測センサーを測線と呼ばれる直線上に並べ、その測線上で震源を少しずつずらしながら観測を行うというものがあります。この観測の 1 回の震源によるデータは観測位置と観測時刻の 2 次元となり、推定対象は測線に沿った 2 次元の断面となります。したがってこの解析は画像から画像への変換と似た問題設定となっています。*

* 実際の入力は震源位置・観測位置・観測時刻の 3 次元だが、震源位置は深層学習におけるチャンネルとして扱われることが多い。

図1 今回の研究に用いた人工的な地下速度構造(上)と観測波形(下)の例。観測波形の縦軸は観測時刻、横軸は観測位置。

実用的な大規模データセットの生成

物理探査への機械学習の適用を困難にするポイントとして、地下構造の正解を知ることが難しいという問題があります。解析対象の領域は深さ方向に数 km、水平方向に数 km からそれ以上になり、その全体の正確な物性値を得ることは不可能です。そのため観測によって得られたデータではなく、人工的に作った仮想的な地下構造とそれに対応する地震波形記録をシミュレーションにより生成することで、正解の分かっているデータで学習できるようにしました。

シミュレーションを用いると大規模なデータセットにスケールさせやすいというメリットがある一方で、実際のターゲットに類似した地下構造をどのように用意するかという課題が残ります。本研究では堆積・褶曲・断層生成・貫入・侵食といった地質的な現象に対応する生成プロセスによって地下構造を生成するシステムを開発しました。実際の物理探査においては、従来の解析手法や試掘などによっておおまかな地下構造が推定されているケースがあり、そのような情報を用いてターゲットにより似せた学習用データを生成できるように工夫しています。

図2 データ生成プロセスの例

Neural Architecture Search を用いた深層学習モデルの構築

1 つの測線での観測から測線の下の地下構造を推定する問題は 2 次元データから 2 次元データへの変換となるので、自動着色や超解像などの画像から画像への変換を行う問題と類似しています。しかしながら、物理探査はこれらの画像分野の問題とは異なり入力と出力の空間的な対応が弱いということが指摘されており、画像分野で良い性能を発揮している深層学習モデルとは異なるモデルが物理探査に適している可能性があります。性能の良い深層学習モデルの構築には多くの試行錯誤が必要となりますが、本研究ではこの作業を Neural Architecture Search (NAS) と呼ばれる技術を用いて自動化しました。ResNet50 を用いたエンコーダー・デコーダーモデルをベースとし、層の数やチャンネル数などのハイパーパラメータを Optuna を用いて最適化することでより性能の高いモデルを探索しました(参考:Neural Architecture Searchを用いたセマンティックセグメンテーションモデルの探索)。

図3 本研究で行った NAS の構造

実験結果

本研究では物理探査のベンチマークでよく用いられる Marmousi モデルという地下構造をターゲットとしました。データセットの生成には地震波速度のおおよその範囲など、現実の物理探査で用いることが可能であると想定される情報のみを用いてデータセット生成システムの設定を行いました。生成システムにより地下速度構造と対応する地震波形記録を 30 万セット生成し実験を行いました。
図4 生成した地下構造の例

NAS では ResNet50 を用いたエンコーダー・デコーダーモデルをベースとし、層の数やチャンネル数などのハイパーパラメータを最適化しました。その結果得られたモデルは 100 以上の畳み込み層からなり、先行研究と比較して非常に大きなモデルとなりました。

図5 Marmousi モデル解析結果

Marmousi モデルでの解析結果を図に示します。(a) が Marmousi モデルの地下構造であり、(b) が本研究による解析結果、(c) が NAS でのベースラインとした ResNet50 を用いた解析結果です。ターゲットの地下構造と似通った大規模なデータセットという、質と量の双方で改善された学習データを用いることで、(c) のベースラインモデルでの解析結果でも地下構造をおおよそ推定できていますが、(b) の NAS を用いた結果では深さ 4 km 付近の岩塩層や中央付近の断層のある領域での速度推定がさらに改善しています。

図6 1994 Amoco statics test dataset 解析結果

本研究ではさらに手法の開発やデータセットの生成に全く用いていない 1994 Amoco statics test dataset というベンチマークデータでも検証を行いました。この結果でも良い地下構造の推定が得られており、我々の結果は Marmousi モデルに過学習したものではなく汎化性能があることを示しています。

おわりに

本記事では Mit-PFN Energy が取り組んでいる物理探査技術開発について紹介しました。大規模なデータセット生成と NAS は共に大量の計算資源が必要となりますが、PFN の計算機クラスタを活用することで効率的に研究開発を進めることができました。また、実験設定や生成する地下構造の性質については物理探査の専門知識が必要となりますが、三井物産株式会社及び三井石油開発株式会社の方々のご助言により今回の成果を達成することができました。PFN と三井物産は、Mit-PFN Energy を中心に、今後も深層学習を用いた物理探査システムの開発・事業化に取り組んでいきます。

最後に、PFN では機械学習・最適化・データサイエンス分野のエンジニアを募集しています。興味を持ってくださった方は、ぜひご応募ください。 https://www.preferred.jp/ja/careers/

  • Twitter
  • Facebook