いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【R】パスウェイ解析を学んでみたい③

・お題:どのようなパスウェイが変わりがちか調べる解析のことを、パスウェイ解析というらしい。やってみたい。

 

・私はwet人間なので、パスウェイ解析も全く分からない。そこで、ネットで調べたチュートリアルをなぞって学んでみたい。今回参考にしたのは、以下のサイト。

 

https://bioconductor.riken.jp/packages/3.3/bioc/vignettes/ReactomePA/inst/doc/ReactomePA.html#pathway-analysis-of-ngs-data

 

・前回、複数の遺伝子セットでエンリッチのされ方を比較できるclusterProfilerで遊んだ。次に、Gene Set Enrichment Analysis (GSEA)と言うやつをやってみたい。

・これまでのエンリッチメント解析では、発現変動が大きい遺伝子を対象にしていたけれど、発現変動が小さい遺伝子は対象にされにくかった。GSEAではすべての遺伝子を対象に、遺伝子セット内の遺伝子全体の遺伝子ごとの統計を集計するため、事前定義されたセット内の、変化が少ないものも含めてすべての遺伝子が対象になるらしい。

・原理は分からないが、そういうものらしい。詳細はDOSEパッケージを参照。

> y <- gsePathway(geneList, nPerm=100, 
+                 minGSSize=120, pvalueCutoff=0.2, 
+                 pAdjustMethod="BH", verbose=FALSE)

・yを覗いてみる。

> y %>% as.data.frame() %>% head()

・個別の遺伝子セットに関して、より詳細を可視化する。先の例でMitotic G1 phase and G1/S transitionという遺伝子セットをピックアップする。IDはR-HSA-453279とのことなので、これを使ってgseaplotを描く。

> gseaplot(y, geneSetID = "R-HSA-69620")

・このプロットの見方 などに関して、以下のサイトで詳しく記載してあったので、ぜひそちらを参照していただきたい。

www.ncc.go.jp

・最後に、パスウェイを可視化してみる。

> viewPathway("E2F mediated regulation of DNA replication", readable = TRUE, foldChange = geneList)

・どれが上がった、下がったがなんとなく分かる。

 

・いろいろな解析手法があるけれど、その選択となにを読み取るかが大事。難しい。。

 

おわり。