【R】パスウェイ解析を学んでみたい③
・お題:どのようなパスウェイが変わりがちか調べる解析のことを、パスウェイ解析というらしい。やってみたい。
・私はwet人間なので、パスウェイ解析も全く分からない。そこで、ネットで調べたチュートリアルをなぞって学んでみたい。今回参考にしたのは、以下のサイト。
・前回、複数の遺伝子セットでエンリッチのされ方を比較できるclusterProfilerで遊んだ。次に、Gene Set Enrichment Analysis (GSEA)と言うやつをやってみたい。
・これまでのエンリッチメント解析では、発現変動が大きい遺伝子を対象にしていたけれど、発現変動が小さい遺伝子は対象にされにくかった。GSEAではすべての遺伝子を対象に、遺伝子セット内の遺伝子全体の遺伝子ごとの統計を集計するため、事前定義されたセット内の、変化が少ないものも含めてすべての遺伝子が対象になるらしい。
・原理は分からないが、そういうものらしい。詳細はDOSEパッケージを参照。
> y <- gsePathway(geneList, nPerm=100,
+ minGSSize=120, pvalueCutoff=0.2,
+ pAdjustMethod="BH", verbose=FALSE)
・yを覗いてみる。
> y %>% as.data.frame() %>% head()
・個別の遺伝子セットに関して、より詳細を可視化する。先の例でMitotic G1 phase and G1/S transitionという遺伝子セットをピックアップする。IDはR-HSA-453279とのことなので、これを使ってgseaplotを描く。
> gseaplot(y, geneSetID = "R-HSA-69620")
・このプロットの見方 などに関して、以下のサイトで詳しく記載してあったので、ぜひそちらを参照していただきたい。
・最後に、パスウェイを可視化してみる。
> viewPathway("E2F mediated regulation of DNA replication", readable = TRUE, foldChange = geneList)
・どれが上がった、下がったがなんとなく分かる。
・いろいろな解析手法があるけれど、その選択となにを読み取るかが大事。難しい。。
おわり。