Blog

この記事は先日公開したMaterials Discovery に関するブログLattice thermal conductivity calculation with PFPの日本語訳です。

はじめに

機械学習の発展に伴い、DFT計算と同等の高精度とスケーラビリティの両立を目指した機械学習ポテンシャル(Machine Learning Potential, MLP)が活発に開発されています。特に、元素によらずに様々な材料に適用可能な汎用機械学習ポテンシャル(Universal Machine Learning Potential, UMLP)が近年急速に実現されてきました。2024年現在、学術機関だけでなく、DeepMind (GNoME)、Microsoft (MatterSim)、Orbital (ORB)、META (OMat)などの企業も、開発したUMLPを次々と発表しています。しかし、これらUMLPのベンチマークとして広く使われているMatbench Discoveryのリーダーボードは飽和状態になりつつあり、多くのUMLPがベンチマークにオーバーフィットしているのではないかという懸念があります[1]。このベンチマークでは、結晶構造のポテンシャルエネルギーの局所安定点での値のみを評価しますが、格子の振動・拡散・化学反応などの多くの材料特性はポテンシャルエネルギーのより広い範囲でのふるまいに依存します。

そこで、格子熱伝導率(Lattice Thermal Conductivity, LTC)の計算に特化した新たなベンチマークとして、k_SRMEが近年提案されています。LTCは工学的に重要な熱特性であるだけでなく、ポテンシャルエネルギー局面の高次微分を必要とするため、安定構造付近のポテンシャルエネルギー曲面の滑らかさが要求され、UMLPをより厳しく評価することができます。興味深いことに、多くのUMLPでは、安定構造のポテンシャルエネルギーの予測精度とLTCの予測精度に相関が見られず、オーバーフィットの懸念が実験的に示されています。

私たちPFNでは、他社に先駆けて2019年からUMLPの開発を進めてきました。その成果であるPFPは、PFNとENEOS株式会社が共同開発したSaaSプロダクトであるMatlantis™上で利用可能です。Matlantis™は、現在100以上の組織で利用されており、材料分野によらず高い汎化性能を示しています。

本記事では、公開されたばかりのk_SRMEを用いて、PFP v6の性能を評価します。結果として、PFP v6がポテンシャルエネルギー曲面の高次微分においても高い精度を示すことを示します。なお、PFP v6はk_SRMEの公開前である2024年4月にリリースされたモデルであり、今回の用途でファインチューニングされたものではありません。

実験設定

まず、k_SRMEにおけるLTC計算方法とデータセットの概要を説明します[3] 。LTCの計算には、phono3pyを使用し、緩和時間近似に基づいてLTCを求めます。フォノン-フォノン相互作用は、有限変位を伴うスーパーセル法により求められた2次および3次の力の定数から計算されます。その後、LTC予測値を、PhononDBと同様の103種類の二元化合物を含むPhononDB-PBEデータセットのDFT計算結果と比較します。

LTCの計算には、基本的にデフォルト設定の計算条件を使用しました。具体的には、FIREによる2段階の構造緩和計算で、FrechetCellFilter、fmax=1e-4、max_steps=300を指定しました。注目すべき点として、UMLPによるLTC計算では、力の定数計算時の変位距離(distance)が結果に大きく影響することがわかりました。そこで、変位距離0.03 Å(デフォルト)と0.1 Åの2種類で評価を行いました。

結果

表1に、PhononDB-PBEデータセットにおける、PFP v6と他のUMLP(MACE-L、MatterSim-v1)のLTC計算誤差を示します。誤差は、LTCのmean Symmetric Relative error(mSRE)と各フォノンのmean Symmetric Relative Mean Error(mSRME)で定量化されています[3]。まず、MACE-LとMatterSim-v1に対して再現実験を行いましたが、変位距離0.03 Åの結果は元の結果と同程度です。また、変位距離が大きい(0.1 Å)方が、UMLPのLTC計算結果が向上する傾向があり、特にPFP v6ではその効果が顕著です。変位距離0.1 ÅのPFP v6は、他のUMLPよりも優れた性能(mSRME 0.374)を発揮し、これは現在のMatbench Discovery リーダーボードのトップモデルであるMACE-MPA-0のmSRME(0.412)よりも低い値を示しています。

表1: PhononDB-PBEデータセットにおける格子熱伝導度の予測精度

mSRE (↓) mSRME (↓)
PFP v6 (distance 0.03 Å) 0.530 0.656
PFP v6 (distance 0.1 Å) 0.245 0.374
MACE-L (Ref.) 0.710 0.935
MACE-L (distance 0.03 Å) 0.719 0.932
MACE-L (distance 0.1 Å) 0.694 0.915
MatterSim-v1 (Ref.) 0.413 0.575
MatterSim-v1 (distance 0.03 Å) 0.413 0.575
MatterSim-v1 (distance 0.1 Å) 0.366 0.541

図1は、PFP v6(変位距離0.1 Å)とDFT-PBEによるLTCの比較を、対数プロットで示しています。PFP v6は、103種類の化合物のうち100種類で、LTCを2倍以内の精度で予測できています (元データ: metrics.txt)。

図1:PhononDB-PBEデータセットの構造における、300 KでのLTCの、PFP v6とDFT-PBEの比較。マーカーの形状と色は、化合物の代表構造(岩塩、閃亜鉛鉱、ウルツ鉱のいずれか)を示します。破線は、完全一致(対数プロット上の直線)からのずれが50%と200%までの範囲を示しています。

図2は、PFP v6(変位距離0.1 Å)によるLTC予測の誤差分布を示しています。誤差は、LTCについてはSymmetric Relative Difference(SRD)[3]、各フォノンについてはSRMEで定量化されています。図2からも見て取れるように、変位距離が誤差分布に大きく影響することがわかります。

図2:PhononDB-PBEデータセットにおける、PFP v6によるLTC予測の誤差分布。

結論

PFP v6は、格子熱伝導率予測のベンチマークにおいて、現在の最高精度を実現することを示しました。また、通常DFT計算で使われる値と比べて変位距離0.1 Åというのは大きい値ですが、多くのUMLPは、予測精度の面ではこのような大きな変位距離を好む傾向があることをみました。このような傾向は、UMLPのさらなる性能向上の手掛かりを与えるかもしれません。

注記: PFP v6は、産業技術総合研究所の人工知能橋渡しクラウド(AI Bridging Cloud Infrastructure、ABCI)とPreferred Networksの自社スーパーコンピューターを使用して開発されました。

[1]: J. Riebesell et al., Matbench Discovery — A framework to evaluate machine learning crystal stability predictions, arxiv:2308.14920

[2]: https://www.mrs.org/meetings-events/annual-meetings/2024-mrs-fall-meeting/symposium-sessions/presentations/view/2024-fall-meeting/2024-fall-meeting-4154317

[3]: B. Póta et al., Thermal Conductivity Predictions with Foundation Atomistic Models, arxiv:2408.00755

  • Twitter
  • Facebook