お問い合わせ

CAE Technical Library 注目機能紹介 - CAE技術情報ライブラリ

マテリアルズ&プロセス・インフォマティクス 〜J-OCTAにおける材料設計のための機械学習の活用〜

カテゴリー
:機能紹介
関連製品
J-OCTA

1. はじめに

本記事では、J-OCTAが用いている機械学習関連技術について最新動向をご紹介します。物性から分子構造を求める逆解析の機能や、短時間の分子動力学の結果から長時間の分子運動を予測する機能など、マテリアルズ・インフォマティクスやプロセス・インフォマティクスに関連する新しい技術をご説明します。

J-OCTAの機械学習機能の概要を図1にまとめます。マテリアルズ・インフォマティクスに関しては以前のCAE技術ライブラリ「AIを活用した材料設計(J-OCTA)」にてご紹介しておりますので、あわせてご確認ください。

図1. J-OCTAの機械学習機能の概要 図1. J-OCTAの機械学習機能の概要

2. 分子・結晶構造からの物性予測

本節では、最近追加された、分子構造や結晶構造から物性を予測する機能などをご紹介します。従来実装されている、グラフで表現した分子構造から物性との関係を学習・予測するGCN(グラフ畳み込みネットワーク)を用いたQSPR機能については前回の記事「AIを活用した材料設計(J-OCTA)」でご紹介しています。

まず、J-OCTAに同梱している物性DBと学習済みライブラリの数を増やしました。対応している物性の一部を図1の右下の「*1」に記載しています。また、無機結晶を取り扱えるように、CGCNという手法を導入しました。GCNとCGCNを用いることで、分子構造や無機結晶構造をもとに物性値を予測することができます。CGCNの詳細は文献(Phys.Rev.Lett.,120,145301,(2018))をご参照ください。

次に、GCN以外の手法として、DNN(全結合型の深層ニューラルネットワーク)やXGBoost(決定木モデルの一種)に対応しました。GCNは、分子構造のみを説明変数(インプット)として物性を予測します。一方、DNNやXGBoostは、分子構造以外の、たとえばプロセス条件などを考慮した物性予測、すなわち、プロセス・インフォマティクスを実施することもできます。このとき説明変数(インプット)には、J-OCTAに同梱されているChemDC(RDKitをベースとした記述子計算機能)を用いて得られる分子記述子のデータと他の諸条件を指定します。DNNやXGBoostでは、分子記述子を説明変数(インプット)として用いない、より汎用的な使い方も可能です。

機械学習を用いた物性予測には、多くの物性値データが必要です。今回新たに、パブリックアクセス可能なDBからも物性値を取得できるようになりました。Materials ProjectとPubChemからのデータ取得が可能となり(図1)、より多くの物性値データをもとにした精度の高い物性予測を実現しました。また、モデリングAPI機能を用いることで、シミュレーションのハイスループット化による大量物性データ取得も可能です。

3. 物性からの分子構造予測

本節では、逆解析、すなわち、物性から分子構造を予測する手法をご紹介します。J-OCTAは、京都大学の永持研究室で開発しているmol-inferとのインターフェイスを実装しており、逆解析の実行が可能です。

まず、人工ニューラルネットワーク(Artificial Neural Network:ANN)を用いて分子の構造から物性を予測します。次に、ANNの逆演算を混合整数線形計画法(Mixed Integer Linear Programming:MILP)によって解きます。これにより、ANNだけでは不可能な、逆向きの高速・高精度な演算の実行が可能になりました。MILPは、あらかじめ用意した分子構造の種となるグラフ構造と、官能基に相当するツリー構造を用いて分子構造を推定します。

ここで、mol-inferを用いた逆解析の事例を紹介します。図2は、テスト計算に用いた分配係数のデータです。最初に、1297個のデータを用いて、分子構造と物性の関係を学習させます。続いて、MILPにより逆演算を行いました。目標とする分配係数の値は10.0としました。

図2. mol-inferの学習データとターゲット物性(分配係数=10.0) 図2. mol-inferの学習データとターゲット物性(分配係数=10.0)

MILPによる逆演算の結果として、図3の構造が得られました。ここでは、構造異性体も取得されています。この分子構造について再度順方向の物性推算を行うと、分配係数の値は9.8となり、この分子構造はターゲット物性をほぼ満たしていることが示されました。

図3. mol-inferで得られた分子構造 図3. mol-inferで得られた分子構造

4. シミュレーションを補佐する機械学習

前節までは、物性・プロセスと分子・結晶構造の関係を機械学習でつなぐ機能をご紹介しましたが、機械学習は他の用途にも適用可能です。J-OCTAには、短時間の分子動力学(Molecular Dynamics、MD)の計算結果をもとにして、長時間の分子のダイナミクスを予測するMD-GANが含まれています。

MD-GANは、慶應義塾大学の泰岡研究室で開発している技術です。詳細は、J-OCTA事例:MD-GANを用いた長時間の分子運動の予測をご参照ください。MD-GANを用いることで、図4のような平均二乗変位(Mean Square Displacement:MSD)の長時間領域を予測できます。図4において赤線で示すデータは、緑色の領域の点線のデータから全領域を予測した結果です。白色の長時間領域で、参照データとよく一致していることが分かります。MD-GANを用いた長時間予測は、高分子メルトや全固体電池のLiイオンの拡散など、複雑な現象に適用することで、より効果を発揮します。

図4. MD-GANで得られたMSD 図4. MD-GANで得られたMSD

5. おわりに

機械学習を用いた新しい技術は、次々と登場しております。J-OCTAでは、本記事でご紹介しましたマテリアルズ・インフォマティクス、プロセス・インフォマティクスをはじめとして、ユーザーの皆様のお役に立つ技術を中心に実装していきますので、ご興味、ご要望がございましたら、こちらからお気軽にご連絡ください。

*CONTACT

お問い合わせ

電話でのお問い合わせ:03-6261-7168 平日10:00〜17:00

※ お問い合わせページへアクセスできない場合

以下のアドレス宛にメールでお問い合わせください

cae-info@sci.jsol.co.jp

ページトップへ