お問い合わせ

[解析事例] 機械学習によるχパラメータの推定

データサイエンス
分子構造・親和性・溶解性
マテリアルサイエンス
ライフサイエンス

User OnlyUser Only

事例データDL

2つの分子の記述子から特徴量を作成し、相互作用パラメータχとの関係を学習

目的と手法

J-OCTA機械学習機能(MI-Suite)を使用して χ パラメータの推定を行いました。使用したデータは Flory-Huggins Chi Database から取得しました。取得したデータは2つの化合物 A、B の名称とそれら化合物間の χ パラメータの値です。データ件数は 263件でした。χ パラメータの学習/予測の手順は以下のとおりです。

【 χ パラメータの学習/予測の手順 】
  1. 1. 各化合物のSMILES表現をパブリックな化合物データベースである PubChem から取得しました。
    取得にあたっては MI-Suite のデータ取得機能である DB-Explorer を使用しました。A、B 双方の SMILES 表現が取得できた化合物対(169件)だけを使用しました。
  2. 2. 記述子計算機能ChemDCを用いて各化合物の記述子(AutoCorr3D)の値を計算しました。
  3. 3. 元データの化合物対の記述に従い記述子の計算値を混合させ1つの特徴量としました。
    混合の方式は記述子(AutoCorr3D)が空間的自己相関量と見做せることから、計量地理学で使用される混合方式を使用しました。
  4. 4. 混合した計算値(特徴量)を入力値、各化合物対のχパラメータを目的値として学習を行いました。
    学習時の設定は以下のとおりです。
    • ・MI-Suite の学習機能でサポートされている学習方式のうち、ブースティングベースの学習方式であるXGBoost を使用。XGBoost のハイパーパラメータの設定は GP(ガウス過程)に基づいた最適パラメータ設定
    • ・90パーセンタイル点(両側)でアウトライヤー除去を行う
    • ・学習時の訓練セット、テストセットのデータ比率は 8:2 とする

結果

以下に学習の結果を示します。
学習によって得られた予測モデル(学習済みモデル)に対して訓練セットを使用した場合の予測精度は決定係数ベースで R^2=0.937、テストセットを使用した場合の予測精度は R^2=0.778 となりました。

図1

事例一覧

  • ※記載されている製品およびサービスの名称は、それぞれの所有者の商標または登録商標です。

*CONTACT

お問い合わせ

※ お問い合わせページへアクセスできない場合

以下のアドレス宛にメールでお問い合わせください

hg-cae-info@s1.jsol.co.jp

ページトップへ