機械学習によるσプロファイルを記述子とした物性推算
深層学習モデルの一種であるGCNを用いてSMILES記法からσプロファイルを予測しました。得られたσプロファイルを分子記述として用いて、機械学習アルゴリズムの一つであるXGBoostでガラス転移温度(Tg)を推算しました。量子化学計算を用いずに高速で高精度な物性予測が可能です。
解析・利用例のポイント
- 機械学習を用いて推算されたσプロファイルを記述子としたガラス転移温度の予測
- ディスクリプタとしての有用性
- 化学構造と物性との相関が解析可能
機械学習によるσプロファイルの高速な計算
アセトアミドのσプロファイルについて、量子化学計算と機械学習(GCN)による推算結果の比較が示されています。青線が量子化学計算、橙線が機械学習による結果であり、両者がよく一致していることから、GCNによる高速かつ高精度なσプロファイル推算が可能です。

アセトアミドのσプロファイル比較
ディスクリプタとしての有用性
XGBoostを用いたガラス転移温度(Tg)の予測結果が示されています。縦軸が予測値、横軸が実験値であり、トレーニングデータでR²=0.999、テストデータでR²=0.942と高い精度を示しています。これは、σプロファイルを記述子とした機械学習モデルの有効性を示す結果です。

ガラス転移温度(Tg)の予測結果
化学構造と物性との相関が解析可能
UMAPによって次元削減されたσプロファイルのマッピング結果が示されています。各点は物質を表し、色はTgの値を示しています。X軸がTgに影響する特徴を表しており、σプロファイルの形状から分子の分極がTgに関与していることが読み取れます。

σプロファイルのUMAPマッピングとTg分布
参考文献
- A. Klamt, J. Phys. Chem. 1995, 99, 2224 ( https://doi.org/10.1021/j100007a062 )
- S. -T. Lin and S. I. Sandler, Ind. Eng. Chem. Res., 2002, 41, 899 ( https://doi.org/10.1021/ie001047w )
- D. O. Abranches et al., JCTC, 2023, 19, 9318 ( https://doi.org/10.1021/acs.jctc.3c01003 )
- T. Galeazzo and M. Shiraiwa , Environ. Sci. Atmos., 2022, 2 , 362-374
- L. McInnes et al., JOSS, 2018, 3, 861 ( https://doi.org/10.21105/joss.00861 )
解析内容の詳細