細菌基因組上傳NCBI(一)(GenBank)
相信做過細菌基因組測序專案的科研工作者們,在投稿的時候都會碰到編輯要求上傳基因組序列到NCBI,並提供基因組資料登入號的問題。對於初次上傳基因組的小白來說,確實挺犯難的。其實上傳基因組到NCBI, 主要包括三部分:
BioProject
、
BioSample、GenBank
BioProject:測序基因組所屬的專案背景描述。
BioSample:測序樣品背景描述。
GenBank:組裝的基因組(WGS:草圖or Complete:完成圖)
具體操作步驟:
1、
註冊My NCBI賬號
,NCBI主頁右上角 Sign in to NCBI,如果未註冊就申請註冊,很簡單,不做介紹。
2、
申請BioProject號
開啟網址
https://
submit。ncbi。nlm。nih。gov
/subs/bioproject/
,點選New submission
1)填寫聯絡人基本資訊
2)專案資料型別
3)物種名稱
4)專案基本資訊
5)填寫Biosample。此處省略,直接continue。後面單獨申請Biosample號。
6)Pbulication:文章描述,continue
7)確認填寫的資訊,點選submit後完成
3、
申請BioSample號
開啟網址
https://
submit。ncbi。nlm。nih。gov
/subs/biosample/
點選New submission
按照步驟往下continue,沒難度,這裡不再介紹。
完成BioProject 和 BioSample後,就開始上傳基因組到GenBank
4、上傳基因組到GenBank
開啟網址 https://submit。ncbi。nlm。nih。gov/subs/genome 點選New submission
1)submitter
2)general info
組裝方法:填寫組裝軟體和軟體版本,本例是Canu組裝
3)Files
這一步才是整個提交流程的重點,接下來重點講一下如何準備。sqn檔案
檔案準備:genome。sbt , genome。fsa
1、生成包含作者資訊的 。sbt 檔案
開啟網站
https://
submit。ncbi。nlm。nih。gov
/genbank/template/submission/
,按要求填寫
2、生成genome。fsa檔案,包含物種,菌株名稱,是否環狀
3、利用tbl2asn 生成 。sqn檔案
tbl2asn -t genome。sbt -p 。/ -a r1k -M n -l paired-ends -V vb -Z discrep
tbl2asn下載連結:
https://
ftp。ncbi。nih。gov/toolbo
x/ncbi_tools/converters/by_program/tbl2asn/
具體用法可以看下網站說明:
https://www。
ncbi。nlm。nih。gov/genban
k/tbl2asn2/
將生成的genome。sqn檔案上傳到上面的位置,然後往下conitue,後面的上傳過程很簡單,就不講了。
好了整個細菌基因組上傳就完成了。
總的來說,僅僅上傳基因組序列還是很簡單的,較為複雜的是上傳帶有註釋資訊的基因組。
後面找個時間專門再講講這部分內容。