在线综合亚洲欧美日韩-欧美特黄视频在线观看-国产午夜亚洲精品理论片不卡-亚洲毛片免费在线观看-麻豆成人国产尤物在线播放-成人美女黄网站色大色下载-精品福利一区二区视频

數(shù)據(jù)淘金——公共數(shù)據(jù)再利用

高通量測序技術(shù)的出現(xiàn),使全世界產(chǎn)出的測序數(shù)據(jù)出現(xiàn)了爆炸式增長,這些數(shù)據(jù)存放在或大或小的數(shù)據(jù)庫中,區(qū)域性的大數(shù)據(jù)庫包括NCBI、ENA/EBI、DDBJ等,今天我們重點給大家介紹下NCBI的SRA數(shù)據(jù)庫。

 

Part 1?|?SRA數(shù)據(jù)庫介紹

SRA(Sequence Read Archive)是NCBI中專門用于存放原始高通量測序數(shù)據(jù)的一個子庫,收錄了各種二代、三代測序儀產(chǎn)生的數(shù)據(jù),與ENA/EBI、DDBJ間共享原始測序數(shù)據(jù)。

INSDC(International Nucleotide Sequence Database Collaboration)成員間共享測序數(shù)據(jù)

有過數(shù)據(jù)上傳經(jīng)歷的童鞋應(yīng)該對SRA并不陌生,上傳數(shù)據(jù)前我們一般要創(chuàng)建BioProject、BioSample,用于詳細(xì)說明項目信息、樣品信息;并通過SRA的Experiment、RUN描述建庫測序相關(guān)信息,如建庫類型、測序儀器、單雙端等;下圖概括出了幾者之間的關(guān)系。

https://www.ncbi.nlm.nih.gov/sra/docs/submitmeta/

SRA上傳和檢索數(shù)據(jù)時,我們會遇到各種各樣的編號,這些編號間的對應(yīng)關(guān)系通過下表我們可以理清。項目和樣品信息首先會存放在BioProject和BioSample數(shù)據(jù)庫中,得到類似PRJNA和SAMN的編號;在SRA數(shù)據(jù)庫中也會對項目和樣品進行編號,分別以SRP和SRS作為前綴,并與BioProject和BioSample中對應(yīng);其余SR開頭的編號都屬于SRA數(shù)據(jù)庫。

SRA數(shù)據(jù)庫中各種編號對應(yīng)表

SRA數(shù)據(jù)庫中存儲的是高度壓縮后的sra格式數(shù)據(jù),截止到目前,SRA中已經(jīng)累計存儲了超過20P堿基數(shù)據(jù),而且每年仍在以極快的速度增長。

SRA數(shù)據(jù)量增長圖(縱坐標(biāo)代表sra格式文件大小,單位TB;橫坐標(biāo)代表年;藍線代表總數(shù)據(jù)量)

Part 2?|?SRA數(shù)據(jù)庫中疾病相關(guān)數(shù)據(jù)統(tǒng)計

在SRA數(shù)據(jù)庫的愿景中,除了進行原始測序數(shù)據(jù)的保存之外,還有一個目的就是希望這些數(shù)據(jù)可以被再次利用,得出新的發(fā)現(xiàn)。但是目前這些數(shù)據(jù)就像宇宙中無法被探測的暗物質(zhì),無人問津。

https://www.ncbi.nlm.nih.gov/sra/docs/

既然已經(jīng)有如此多的公共數(shù)據(jù),我們應(yīng)該充分挖掘,不僅可以產(chǎn)出新發(fā)現(xiàn),也可以有效降低科研成本。俗話說的好,知己知彼,百戰(zhàn)不殆。要想充分利用這些公共數(shù)據(jù),我們首先需要對這些數(shù)據(jù)有更加深刻的認(rèn)識,于是我們針對熱點研究疾病,統(tǒng)計了不同測序類型的數(shù)據(jù)量,以及項目數(shù)和樣品數(shù),想了解其他疾病數(shù)據(jù)量情況的童鞋可以文末留言,我們統(tǒng)計好之后發(fā)送給您。

熱點研究疾病數(shù)據(jù)統(tǒng)計(單位:Gbase)

熱點癌癥數(shù)據(jù)統(tǒng)計(單位:Gbase)

Part 3 |?公共數(shù)據(jù)使用策略

如此多的數(shù)據(jù),該怎樣去利用,我們整理了一些思路,供大家參考。

策略一:數(shù)據(jù)整合,增大樣本量

以研究疾病相關(guān)基因表達為例,可以整合多個項目中的RNA-Seq數(shù)據(jù)(也可以結(jié)合自己的數(shù)據(jù),增大樣本量),計算基因表達量,并篩選疾病組織和正常組織間差異表達的基因;

再針對差異表達基因進行共表達分析,獲得共表達基因集;然后進一步對這些基因的功能、所屬通路進行分析,從而更完整的描述出疾病發(fā)生的機理。

策略二:多種疾病間橫向比較

以研究肺癌患者中S100A4基因的差異表達為例,通過下載其他類型癌癥如:胸腺癌、惡性間皮瘤的RNA-Seq數(shù)據(jù),并分析該基因在這兩種癌癥中的差異表達情況,如果與肺癌中有相同的差異表達趨勢,則可以增強我們結(jié)論的說服力。

策略三:不同水平間橫向比較

分析不同水平的數(shù)據(jù),如:細(xì)胞水平、組織水平、動物模型上目標(biāo)基因的差異表達情況,增強分析結(jié)論的說服力。

策略四:不同類型數(shù)據(jù)間聯(lián)合分析

我們只自測了mRNA數(shù)據(jù),但是想了解miRNA對于mRNA的調(diào)控,那我們可以下載對應(yīng)疾病的miRNA類型的數(shù)據(jù),通過兩者的聯(lián)合分析,更深入的了解疾病發(fā)生的機理。

Part 4 |?結(jié)語

公共數(shù)據(jù)使用看似很困難,需要下載、轉(zhuǎn)換格式、生信分析,目前百邁客云(m.taixingren.com.cn)已經(jīng)集成了SRA數(shù)據(jù)檢索、下載、轉(zhuǎn)換和分析,我們錄制了一個短視頻,展示了如何通過簡單的鼠標(biāo)點擊高效完成以上所有工作,詳情:http://live.biocloud.net/open/course/10

 

參考文獻:

[1]????Chun-Ping Yu et al.?Transcriptome dynamics of developing maize leaves andgenomewide prediction of cis elements and their cognate transcription factors.Proc Natl Acad Sci . 2015

[2]????Iyer MK et al. The landscape oflong noncoding RNAs in the human transcriptome. Nat Genet. 2015

[3]????Patil G. et al. Soybean(Glycine max) SWEET gene family: insights through comparative genomics,transcriptome profiling and whole genome re-sequence analysis. BMC Genomics.2015

[4]????Matthijs M. et al. Profiling ofthe Early Nitrogen Stress Response in the Diatom Phaeodactylum tricornutumReveals a Novel Family of RING-Domain Transcription Factors. Plant Physiol.2016

?

免費贈送云平臺使用權(quán)限

點擊下方按鈕,參與調(diào)查問卷,獎品可以任選其一:

獎品一:免費使用百邁客云專業(yè)版套餐中真核有參轉(zhuǎn)錄組分析平臺(單次可分析300Gbase)或小RNA分析平臺(單次可分析400Mreads)或外顯子分析平臺(單次可分析300Gbase)完成一次SRA數(shù)據(jù)分析。

獎品二:開通百邁客云所有工具(100+款)1個月免費使用權(quán)限。

 



亚洲精品熟女国产老熟女 | 国产a一级毛片爽爽影院无码 | 国产V综合V亚洲欧美久久 | 一区二区三区囯产精品乱码不卡 | 蜜桃日本免费看MV免费版 | 日本老妇一级特黄aa大片 | 亚洲国产婷婷综合在线精品 | 美女黄色在线网站大全 | jizz国产丝袜18老师美女 | 国产精品乱码久久久久久小说 | 99久久久无码国产精品 | 国产精品人人爽人人做Av片 | 国语对白露脸XXXXXX | 少妇无码太爽了视频在线播放 | 2020天堂在线亚洲精品专区 | 国产99视频精品免费视亚洲一级Av无码毛片久久精品 | 一本大道加勒比久久 | 亚洲AV怡红院影院怡春院 | 欧美日韩精品一区二区三区 | 10000部拍拍拍免费视频 | 日出水了特别黄的视频 | 国产的一级毛片最新在线直播 | AV无码播放一级毛片免费野外 | 永久免费精品精品永久-夜色 | 免费人成在线观看网站品爱网 | 国产伦精品一区二区三区妓女 | 翁止熄痒禁伦短文合集免费视频 | 777久久国产精品无码专区 | 国产精品午夜免费观看网站 | 亚洲AV无码久久久久久精品酒店 | 欧美激情欲高潮视频在线观看 | 一级a一级a爱片免费免免高潮 | 又白又嫩毛又多15P 伦人伦 XXX国语对白 | 午夜AV内射一区二区三区红桃视 | 精产国品一区二区三产区 | 国产精品成人一区二区无码欠欠源 | 少妇精品无码一区二区三区 | 91精品国产乱码久久久久久 | 狠狠做深爱婷婷久久综合一区 | 国内少妇人妻偷人精品XXX | 中文字幕在线观看国产 |