統合パスウェイクラスタ

 

序論

遺伝子セット機能的エンリッチメント(GSFE)は,特定の遺伝子セットに関連する生物学的テーマ,例えばパスウェイ,の相対存在量の統計分析に依存し,大きな比率を占めているという理由で,研究中の生物学的条件に,より関連している可能性が高いテーマ(及び関連遺伝子)を識別します。しかし,既存のパスウェイリソースは構成と概念が大きく異なることが多く,複数のパスウェイリポジトリを使用したハイスループット生物学データの統合分析と解釈をかなり妨げます。パスウェイリポジトリの統合は,より広範で正確な機能的注釈という点で非常に魅力的な利点を提供し,これによって複雑な生物学的システムにおける遺伝子の機能と制御のより良い理解を助けます。さらに,結合されたGSFEの研究において,エンリッチされた生物学的テーマの,より簡潔で比較的分離された説明を提供するのにも役立ちます。

伝統的な遺伝子セット機能エンリッチメント(GSFE)研究…

多すぎる,ことによると冗長な生物学的テーマ

新しいアプローチ…

より小さく区別可能な生物学的テーマのリスト,しかも有益な名前が付いている

方法

パスウェイ間の共通する遺伝子は,それらの間の全体的な機能一致を反映するはずであるという前提で,共有遺伝子の割合に基づくパスウェイクラスタリングの方法を提案した。KEGG,Reactome,及びNCI-PIDデータベースからのパスウェイデータを統合するためのアプローチの概要を以下に示します。

検証

IPCの機能的および生物学的関連性

結果は、Gene Ontology Semantic Similar(GOSS)を使用して機能的類似性(FS)を推定することで確認されています。 GOSSは,注釈の類似性に基づいた2つのGO用語間の関連性の範囲として定義されます。 私たちはWangらの方法を採用しました。 (G-SESAME)。 このアプローチは以下のとおりです。

IPCには,異なるクラスター(クラスター間)からのパスウェイよりも相互(クラスター内)で,全体的に高い機能的類似性を共有するパスウェイが含まれていました。 (p = 2.2×10-16)

ターゲットの優先順位付けにおけるIPCの評価-GSFE分析

マウスでの発がん性物質誘発肺腫瘍形成の研究(Lokesh et al. 2012)からの発現変動遺伝子のリストは,パスウェイとIPCの両方を使用して分析されました。IPCは,標準分析では見落とされがちな関連付けをピックアップします。

IPCは,Auxiliary Toolkitを含むTargetMineに統合されています。詳細および生物学的応用については,元の論文に記載されています。

参考文献:

  • Chen Y-A, Tripathi LP, Dessailly BH, Nyström-Persson J, Ahmad S, Mizuguchi K. (2014) Integrated pathway clusters with coherent biological themes for target prioritisation. PLoS One. 9(6):e99030. [PubMed:24918583]
Top