轉錄組測序是利用第二代高通量(liang)測序技(ji)術(shu)快速(su)獲取(qu)某一物(wu)種特定器官或組織在某一狀態下幾乎所(suo)有轉錄本的序列信(xin)息,進(jin)行疾病(bing)(bing)與正常(chang)樣本間的基因(yin)表(biao)達(da)差異分(fen)析、可(ke)變剪切和(he)(he)融(rong)合基因(yin)分(fen)析,尋找(zhao)與癌癥、遺(yi)傳(chuan)病(bing)(bing)相(xiang)關的致病(bing)(bing)基因(yin),已廣(guang)泛(fan)應用于基礎研究、臨床診斷和(he)(he)藥物(wu)研發等(deng)領域。相(xiang)對于傳(chuan)統芯片而言,無需預先(xian)設計特異性探針,具有分(fen)辨率(lv)高、檢測范圍廣(guang)和(he)(he)準(zhun)確率(lv)高的優(you)點(dian)。
實驗方案
測序策略:Illumina 平臺 PE150
數據量:6G/樣
技術優勢
(1)任意物種檢測:相對于傳統芯片而言,無需預先設計特異性探針,因此無需了解物種基因或基因組信息,能夠直接對任何物種進行最全面的轉錄組分析;
(2)分辨率高:可以檢測基因家族中相似基因及可變剪接造成的單堿基差異;
(3)檢測范圍廣:從幾個到數十萬個拷貝精確計數,可同時鑒定正常和稀有的轉錄本;
(4)信息分析全面:可以做基因差異表達分析、可變剪切、融合基因分析、新轉錄本預測及注釋。
信息分析
標準信息分析
(1)按標準流程進行數據整理及數據質量評估;
(2)與參考序列比對,計算不同基因的RPKM值;
(3)基因的差異表達分析;
(4)樣本間基因表達水平的相關性分析(僅限于有生物重復的樣本);
(5)樣本間差異基因韋恩圖及PCA分析;
(6)差異基因的表達模式聚類分析;
(7)差異表達基因GO功能富集分析;
(8)差異表達基因Pathway顯著富集分析;
(9)差異表達基因的蛋白質互作網絡分析;
(10)條件特異表達;
(11)鑒定基因的可變剪切;
(12)SNP/InDel分析;
(13)新轉錄本預測及注釋;
(14)融合基因分析(僅限于人);
高級信息分析
(1)基因結構優化(只針對真核生物)
(2)RNA編輯
(3)差異基因的轉錄因子分析(適用于植物)
技術流程
轉錄組測序案例分析
案例(1)科學家繪制細胞周期的高分辨率轉錄組圖譜
細胞周期的(de)(de)(de)(de)推進很大(da)程度上(shang)依賴于周期性(xing)(xing)基(ji)因表達。本研究(jiu)(jiu)繪制了細胞周期的(de)(de)(de)(de)高分(fen)辨率轉錄(lu)組圖譜,揭示了周期性(xing)(xing)基(ji)因與癌(ai)癥(zheng)之間(jian)的(de)(de)(de)(de)新(xin)關聯。研究(jiu)(jiu)人員在(zai)兩個連續的(de)(de)(de)(de)細胞周期中對人類(lei)細胞進行RNA測序,鑒定(ding)了一千多個周期性(xing)(xing)表達的(de)(de)(de)(de)mRNA、非編(bian)碼(ma)RNA和假基(ji)因。研究(jiu)(jiu)顯(xian)示,這(zhe)些周期性(xing)(xing)轉錄(lu)本主要集中在(zai)與DNA代謝、有(you)絲分(fen)裂和DNA損傷應答(da)有(you)關的(de)(de)(de)(de)功能上(shang)。他們分(fen)析了癌(ai)癥(zheng)基(ji)因組圖譜TCGA和其他數據庫的(de)(de)(de)(de)四千多個腫瘤(liu)樣本,證實“有(you)絲分(fen)裂特征(zheng)”與遺(yi)傳(chuan)改變、腫瘤(liu)類(lei)型和患者(zhe)生(sheng)存狀況有(you)顯(xian)著的(de)(de)(de)(de)關聯。研究(jiu)(jiu)人員還定(ding)義(yi)了67個核(he)心(xin)基(ji)因,這(zhe)些基(ji)因在(zai)多種細胞中均有(you)很強的(de)(de)(de)(de)周期性(xing)(xing)表達。
圖(tu)1 細(xi)胞周期核心(xin)基(ji)因(yin)的表達(da)特征
案例(2)人類組織和個體的轉錄組差異
轉錄(lu)調控和(he)(he)(he)轉錄(lu)后(hou)加(jia)工影響許多細胞(bao)和(he)(he)(he)器官的(de)表(biao)型(xing)。基因(yin)型(xing)組(zu)織(zhi)表(biao)達(GTEx)項目通過RNA測(ce)序(xu)(xu)得到(dao)的(de)數(shu)據(ju)探(tan)索個(ge)(ge)體(ti)和(he)(he)(he)組(zu)織(zhi)間(jian)的(de)轉錄(lu)組(zu)類(lei)型(xing)的(de)變化差(cha)異(yi)。本(ben)研究從175個(ge)(ge)個(ge)(ge)體(ti)的(de)43個(ge)(ge)身體(ti)部位采集得到(dao)1641份(fen)(fen)樣本(ben),包括(kuo)29份(fen)(fen)器官組(zu)織(zhi)、11份(fen)(fen)腦亞區(qu)、全(quan)血和(he)(he)(he)兩份(fen)(fen)細胞(bao)系。轉錄(lu)組(zu)測(ce)序(xu)(xu)數(shu)據(ju)表(biao)明(ming),平均每(mei)個(ge)(ge)樣本(ben)得到(dao)8千萬比對到(dao)的(de)片(pian)段(duan)數(shu)。尸體(ti)的(de)組(zu)織(zhi)樣本(ben)表(biao)現(xian)出帶(dai)有特點的(de)并(bing)且(qie)穩定性(xing)(xing)強的(de)轉錄(lu)組(zu)信號。個(ge)(ge)體(ti)之間(jian)表(biao)現(xian)出高度基因(yin)表(biao)達差(cha)異(yi),包括(kuo)不(bu)同性(xing)(xing)別、種(zhong)族和(he)(he)(he)年齡的(de)患病(bing)人(ren)群。原始轉錄(lu)是細胞(bao)特異(yi)性(xing)(xing)的(de)主(zhu)要驅動因(yin)子,后(hou)期剪切(qie)行(xing)(xing)使(shi)補充(chong)性(xing)(xing)角(jiao)色。差(cha)異(yi)剪切(qie)可能在鑒定個(ge)(ge)體(ti)表(biao)型(xing)中(zhong)行(xing)(xing)使(shi)更加(jia)重要的(de)作用。
圖1 樣(yang)本和組(zu)織的表達譜相似性分析
案例(3)錫蘭鉤蟲基因組和轉錄組的解析為藥物靶向奠定基礎
該(gai)研究針對致病性(xing)寄生(sheng)蟲(chong)(chong)錫蘭鉤蟲(chong)(chong)基(ji)因(yin)組進(jin)行(xing)(xing)了深(shen)(shen)度(du)測序(xu),該(gai)寄生(sheng)蟲(chong)(chong)基(ji)因(yin)組大小約313Mb。測序(xu)獲(huo)得(de)了其每個生(sheng)長周(zhou)期(qi)(qi)的(de)(de)(de)轉錄(lu)組數據并進(jin)行(xing)(xing)深(shen)(shen)度(du)分析,感染(ran)期(qi)(qi)共有(you)30,738條(tiao)基(ji)因(yin)表達。大約有(you)900條(tiao)基(ji)因(yin)在感染(ran)早期(qi)(qi)下調。基(ji)于(yu)這(zhe)些測序(xu)數據,研究者成功挖掘(jue)獲(huo)得(de)錫蘭鉤蟲(chong)(chong)生(sheng)命周(zhou)期(qi)(qi)中(zhong)(zhong)各(ge)節點處許(xu)多重要(yao)(yao)的(de)(de)(de)功能基(ji)因(yin)信(xin)息,這(zhe)些功能基(ji)因(yin)信(xin)息中(zhong)(zhong)存在能夠(gou)治療或(huo)阻斷錫蘭鉤蟲(chong)(chong)引起致病性(xing)的(de)(de)(de)重要(yao)(yao)靶向位點信(xin)息等。
圖1 不同感染期的(de)錫蘭鉤蟲的(de)基因表達差異情況
參考文獻
[1] Dominguez et al. A high-resolution transcriptome map of cell cycle reveals novel connections between periodic genes and cancer. Cell Research, 2016.
[2] Melé et al. The human transcriptome across tissues and individuals. Science, 2015.
[3] Schwarz et al. The genome and transcriptome of the zoonotic