このアドインについて
マテリアルズ・インフォマティクス(MI)、ケモ・インフォマティクスのためのアドインです。マテリアルズ・インフォマティクスは、材料の開発や探索をより効率的にするために、機械学習などの情報科学の技術を活用する取り組みです。
分子を機械学習で扱う際の課題は、分子をコンピュータが解釈できる数値にどう変換するか、という点です。その一つの解決策として「フィンガープリント」があります。これは化合物の構造的な特徴を数値で表現したもので、特徴量とも呼ばれます。このような特徴量には、様々な記述子が提案されています。
このアドインでは、RDKitというライブラリを使って、SMILESからこれらの記述子を計算することができます。計算した記述子は予測モデルの説明変数として利用することが可能です。
このアドインでは、以下のようなことが可能です。
- 分子記述子を生成する
- フィンガープリントを生成する
- 分子の描画
- 予測モデルで記述子を使用するための前処理
RDKitについては、以下のページをご覧ください。
https://www.rdkit.org/
システム要件
- JMP 18以降
- 表示言語は、英語および日本語のみ
- Windows OS
- 以下のPython Packageがインストールされている
- RDKit
- Numpy
- Pandas
事前の準備
RDKitのインストール
- [ファイル]>[新規作成]>[JSLスクリプト]を選択します
- 以下のスクリプトを入力して[編集]>[スクリプトを実行]を選択します
Python Install Packages("numpy pandas rdkit");
使い方
分子記述子/フィンガープリントの生成
- 「アドイン」>「Toolkit for Materials Informatics」>「Descriptor Calculation」を選択します。
- SMILESが入力されている列を「Y,SMILES」に指定します。手法の選択の一覧から生成したい、記述子、フィンガープリントにチェックを入れます。
- 「OK」ボタンをクリックすると、選択した特徴量が生成されます。
- 「閉じる」ボタンをクリックします。
How to use this add-in
This add-in for materials informatics and chemical informatics. This add-in uses an RDKit(https://www.rdkit.org/ ) to calculate these descriptors from SMILES. The calculated descriptors can be used as feature variables in the prediction model.
Here's what you can do:
- Generate molecular descriptors
- Generate a fingerprint
- Draw molecules
- Preprocess descriptors for use in predictive models
You must install RDKit before using this add-in .
- Select File > New > JSL Script
- Enter the script below and select Edit > Run Script (JMP 18 required)
Python Install Packages("numpy pandas rdkit");
- Select Add-ins > Toolkit for Materials Informatics > Descriptor Calculation.
- Specify the column in which SMILES is entered as "Y,SMILES". Check the descriptors and fingerprints you want to generate from the list of method selections.