マテリアルズ・インフォマティクス(MI)、ケモ・インフォマティクスのためのアドインです。マテリアルズ・インフォマティクスは、材料の開発や探索をより効率的にするために、機械学習などの情報科学の技術を活用する取り組みです。
分子を機械学習で扱う際の課題は、分子をコンピュータが解釈できる数値にどう変換するか、という点です。その一つの解決策として「フィンガープリント」があります。これは化合物の構造的な特徴を数値で表現したもので、特徴量とも呼ばれます。このような特徴量には、様々な記述子が提案されています。
このアドインでは、RDKitというライブラリを使って、SMILESからこれらの記述子を計算することができます。計算した記述子は予測モデルの説明変数として利用することが可能です。
このアドインでは、以下のようなことが可能です。
RDKitについては、以下のページをご覧ください。
Python Install Packages("numpy pandas rdkit");
This add-in for materials informatics and chemical informatics. This add-in uses an RDKit(https://www.rdkit.org/ ) to calculate these descriptors from SMILES. The calculated descriptors can be used as feature variables in the prediction model.
Here's what you can do:
You must install RDKit before using this add-in .
Python Install Packages("numpy pandas rdkit");
Excellent add-in @yuichi_katsumur ! Chemistry is arguably the most popular branch of science for JMP and you have just provided us easy access to the powerful and feature-rich RDKit package, making QSAR in JMP much more accessible.
The clear instructions for installing RDKit in Python are very easy to follow and really appreciate the nice checking utility with attractive output.
The Descriptors and three kinds of Fingerprints are great inputs to use for exploratory analyses (e.g. PCA, Multivariate Embedding, Hierarchical Clustering, Response Screening) and predictive modeling (e.g. Fit Model, Neural, SVM, XGBoost, Torch).
The molecule drawings are fast and make compelling labels in the JMP table.
The JSME editor and substructure search capabilities are remarkable and a very welcome bonus.
The attention to detail in this add-in is terrific!
I've just started to use the JMP 19EA version and I get this message. Is there a way to update the add-in to enable it to run? the Python packages has been installed and I get the green ticks for these so I don't believe that this is the problem.
can be done manually:
rename the .jmpaddin to .zip, open AddIn.def and change to: