(English follows Japanese)
日本語タイトル:JMPの機械学習機能を用いた高精度毒性予測法の開発
明治薬科大学 准教授 植沢 芳広
近年の環境に対する意識の向上に伴い、身の回りにある全ての化学物質に対する有害性を網羅的に調査しようという機運が世界的に高まっている。しかし、化学物質の種類は膨大であるため、実験的な調査は時間的、予算的、動物実験倫理的な観点から非現実的である。この様な背景から、化学物質の毒性を現在までに蓄積された既知情報に基づき統計的・計算機科学的に予測することを目的とした学術分野である「計算毒性学」が注目されている。2014年には米国NIHが1万化合物の毒性関連データを用いた大掛かりな計算毒性学のコンペティション、“Tox21 Data Challenge 2014”を開催した。18カ国から100チーム以上が参加登録した本コンペティションにおいて、演者はJMP Proに搭載された機械学習機能の1つであるブートストラップ森を用い、化学構造から得られる多様な情報のパターンを解析することにより、女性ホルモン様物質の予測に関して部門優勝することができた。本発表では、演者がコンペティションに使用した、JMPの柔軟な機能に基づく最適なブートストラップ森モデルの選択に関して紹介したい。
関連サイト: http://www.my-pharm.ac.jp/news/info_detail.html?id=599
The Development of Highly Accurate Toxicity Prediction Methods Using the JMP® Machine Learning Function
The Development of Highly Accurate Toxicity Prediction Methods Using the JMP® Machine Learning Function
Along with the increase in environmental consciousness in recent years, the exhaustive investigation of all of the hazardous chemical substances around us is gaining momentum around the globe. However, there is a vast number of different types of chemical substances, meaning that experimental investigations are not practical from a time perspective, budget perspective, or ethical perspective (animal testing). The academic field of computational toxicology is garnering attention for its ability to predict, statistically and with computer science, the toxicity of chemical substances based on existing information that has been accumulated. In 2014, National Institutes of Health in the United States held the Tox21 Data Challenge 2014, an ambitious computational toxicology competition using toxicity-related data regarding 10,000 compounds. At this competition, which featured over 100 participating teams from 18 countries, competitors used bootstrap forest, one of the machine learning functions in JMP Pro, to analyze a variety of information patterns acquired from chemical structures. This resulted in a departmental victory related to the prediction of female hormone-like substances. In this presentation, I will discuss the selection of the optimal bootstrap forest model based on the flexible functions in JMP that were used during the competition.
Related site : http://http://www.my-pharm.ac.jp/news/info_detail.html?id=599