cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 
Choose Language Hide Translation Bar
Toolkit for Materials Informatics

このアドインについて

マテリアルズ・インフォマティクス(MI)、ケモ・インフォマティクスのためのアドインです。マテリアルズ・インフォマティクスは、材料の開発や探索をより効率的にするために、機械学習などの情報科学の技術を活用する取り組みです。

分子を機械学習で扱う際の課題は、分子をコンピュータが解釈できる数値にどう変換するか、という点です。その一つの解決策として「フィンガープリント」があります。これは化合物の構造的な特徴を数値で表現したもので、特徴量とも呼ばれます。このような特徴量には、様々な記述子が提案されています。

このアドインでは、RDKitというライブラリを使って、SMILESからこれらの記述子を計算することができます。計算した記述子は予測モデルの説明変数として利用することが可能です。

このアドインでは、以下のようなことが可能です。

  • 分子記述子を生成する
  • フィンガープリントを生成する
  •  分子の描画
  •  予測モデルで記述子を使用するための前処理

RDKitについては、以下のページをご覧ください。

https://www.rdkit.org/ 

 

システム要件

  • JMP 18以降
  • 表示言語は、英語および日本語のみ
  • Windows OS
  • 以下のPython Packageがインストールされている
  • RDKit
  • Numpy
  • Pandas

 

事前の準備

RDKitのインストール

  1.  [ファイル]>[新規作成]>[JSLスクリプト]を選択します
  2.  以下のスクリプトを入力して[編集]>[スクリプトを実行]を選択します

 

Python Install Packages("numpy pandas rdkit");

 

 

使い方

分子記述子/フィンガープリントの生成

  1.  「アドイン」>「Toolkit for Materials Informatics」>「Descriptor Calculation」を選択します。
  2.  SMILESが入力されている列を「Y,SMILES」に指定します。手法の選択の一覧から生成したい、記述子、フィンガープリントにチェックを入れます。
  3.  「OK」ボタンをクリックすると、選択した特徴量が生成されます。
  4.  「閉じる」ボタンをクリックします。

screenshot0.png

 

How to use this add-in

This add-in for materials informatics and chemical informatics. This add-in uses an RDKit(https://www.rdkit.org/ ) to calculate these descriptors from SMILES. The calculated descriptors can be used as feature variables in the prediction model.
Here's what you can do:

  • Generate molecular descriptors
  • Generate a fingerprint
  • Draw molecules
  • Preprocess descriptors for use in predictive models

You must install RDKit before using this add-in .

  1. Select File > New > JSL Script
  2. Enter the script below and select Edit > Run Script (JMP 18 required)
Python Install Packages("numpy pandas rdkit");

 

  1.  Select Add-ins > Toolkit for Materials Informatics > Descriptor Calculation.
  2.  Specify the column in which SMILES is entered as "Y,SMILES". Check the descriptors and fingerprints you want to generate from the list of method selections.
Comments

Excellent add-in @yuichi_katsumur !   Chemistry is arguably the most popular branch of science for JMP and you have just provided us easy access to the powerful and feature-rich RDKit package, making QSAR in JMP much more accessible.

The clear instructions for installing RDKit in Python are very easy to follow and really appreciate the nice checking utility with attractive output.

The Descriptors and three kinds of Fingerprints are great inputs to use for exploratory analyses (e.g. PCA, Multivariate Embedding, Hierarchical Clustering, Response Screening) and predictive modeling (e.g. Fit Model, Neural, SVM, XGBoost, Torch).

The molecule drawings are fast and make compelling labels in the JMP table.

The JSME editor and substructure search capabilities are remarkable and a very welcome bonus.

The attention to detail in this add-in is terrific!      <- SMILE

Recommended Articles