AIデータセット作成のためのチュートリアル

[AIデータセット例:化合物と疾患の関連データセットの取得]

化合物と疾患の関連データセットは,ドラッグリポジショニングに役立ちます。TargetMineで,推測されるものも含んだ,たくさんの異なる関連を探り,化合物を疾患に結びつけることができます。

以下の例で,化合物と疾患の関連データセットを作成する方法を説明します。

ドラッグリポジショニングに向けてのデータセットの比較

repoDB[1]とTargetMine[2]より作成された,ドラッグリポジショニング用データセットに含まれる化合物-疾患関連数の比較を下図に示します。

[1]ドラッグリポジショニングデータベース
Sci Data. 2017 Mar 14;4+170029. doi: 10.1038/sdata.2017.29.
全データ範囲:
・drugs: 1,571
・UMLS disease concepts: 2,051
構成内容:
・approved: 6,677
・failed drug-indication pairs: 4,123
データポイント数:
・10,562

[2]Integrated dataware house
(条件を指定して各種DBからデータセットの作成が可能です)
PLoS One. 2011 Mar 8;6(3):e17844. doi: 10.1371/journal.pone.0017844.
内部版2019年9月
全データ範囲:
(DrugBank Interaction利用によるデータセット作成ケース)
・化合物ID: 1,962 (ソース: DrugBank or KEGG)
・疾患ID: 477 (ソース: MeSH) / 1,031 (ソース: UMLS)
データポイント数:
・74,454

repoDBとTargetMine(上記ケース2)のデータセットの比較

repoDBとTargetMine(上記ケース2)のデータセットの比較

Top