[問題] bioinformatics, XStringset格式

看板R_Language作者 (Absurde.Y)時間10年前 (2015/11/09 17:12), 10年前編輯推噓2(206)
留言8則, 2人參與, 最新討論串1/1
[程式諮詢] Bioinformatics的XStringset格式轉換 [入門] 2010修課玩過VBA,不過之後就沒了直到今日,也算新手吧 此版首po,請前輩們指教 [問題敘述]: 小弟我剛踏入bioinformatics,用Bioinfomatics with R cookbook 自學中 在MSA, Multiple Sequence Alignment部分, 使用下面這個package時卡關了 muscle, (multiple sequence comparison by log-expectation) 我的問題是: 如何轉換XStringset格式,且是多筆資料轉換 (有查詢Biostrings 中AAString功能,但仍不知道如何使用) [程式範例] 這是原書步驟 http://imgur.com/eFWyDjk
http://imgur.com/94zPqQQ
這是會用到的fasta檔案 http://tinyurl.com/q6kjpru 以下是我的內容 pastie版 (第一次使用,還不熟,請見諒) http://pastie.org/10540288 自己截圖版 http://imgur.com/ecLpoF1
http://imgur.com/4BqdEng
http://imgur.com/rT9PEqr
(後面是其他物種的序列,共十種,我就不貼了) http://imgur.com/0WvRNXJ
因為教材有點年份,code有些出入 例如install.packages("muscle")會找不到東西 或是沒有muscle::read.fasta這個功能 這裏再說一次我的問題 有查詢Biostrings 中 XStringset、AAString功能,但仍不會使用 想請問: 如何將多筆資料轉換成XStringset格式 [環境敘述]: 直接截圖 http://imgur.com/u42f95X
[關鍵字]: R, muscle, Biostrings, multiple sequence alignment, XStringset -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.125.195 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1447060378.A.A30.html ※ 編輯: cb1040 (140.109.125.195), 11/09/2015 17:46:42

11/09 23:57, , 1F
用readDNAStringSet("fastaMSA.fasta", format="fasta")讀
11/09 23:57, 1F

11/09 23:58, , 2F
這個package請用bioconductor上的新版本
11/09 23:58, 2F
我用source("http://bioconductor.org/biocLite.R") biocLite("muscle") library(muscle) 這樣應該是從bioc那裡安裝最新版吧 (我看到版本都是3.12.0)

11/10 00:00, , 3F
多筆資料可以直接通通塞到同一個fasta檔裡頭跑
11/10 00:00, 3F

11/10 10:25, , 4F
我用source(http://bioconductor.org....) 然後
11/10 10:25, 4F

11/10 10:25, , 5F
biocLite ("muscle") 安裝,這樣應該是最新版對吧
11/10 10:25, 5F

11/10 10:38, , 6F
我用readXStringSet成功了!!謝謝!!!
11/10 10:38, 6F

11/10 10:39, , 7F
關於第三點,是我必須額外存一個新的fasta檔案對嗎
11/10 10:39, 7F
※ 編輯: cb1040 (140.109.123.109), 11/10/2015 10:49:53 ※ 編輯: cb1040 (140.109.123.109), 11/10/2015 10:56:05

11/10 17:16, , 8F
對, 可以用cat去串聯每個fasta檔
11/10 17:16, 8F
文章代碼(AID): #1MG6EQem (R_Language)
文章代碼(AID): #1MG6EQem (R_Language)