06月07 植物研究百邁客云解決方案-BMKCloud_數據庫收錄的棉花數據所涉及研究方向
解決方案概述
針對植物基因組學研究,百邁客云可通過BMKCloud_數據庫模塊向用戶提供海量的植物高通量測序公共數據,借助公共數據,可大幅降低研究成本,提升研究層次。數據檢索、下載、保存均在圖形化界面下完成,避免了傳統模式中,須在命令行界面下進行數據下載、格式轉換等一系列繁瑣操作的限制,完全適用于國內生信0基礎的用戶。
對于公共數據的下游分析,百邁客云目前已實現公共數據模塊與分析模塊的無縫對接,用戶可直接將已保存至用戶目錄的數據直接導入BMKCloud_APP分析模塊進行下游分析,該模塊同樣采用圖形化操作界面,無需用戶掌握任何編程基礎,高度集成化專業化的分析流程可保證用戶快速完成對數據的基礎分析以及必要的數據深度挖掘。
BMKCloud_數據庫目前收錄數據9PB,覆蓋約1100個屬,常見作物數據收錄情況見下圖:

整合公共數據庫中棉屬RNA-seq數據,進行轉錄本重構(有參)并鑒定其中lncRNA,用于后續的棉纖維發育相關lncRNA分析
BMKCloud_數據庫收錄的棉花數據所涉及研究方向:
發育調控類:玉米產量 葉發育 根發育 胚乳發育 胚芽發育 花藥發育 子房發育 組織發育 光合作用 雜種優勢……
非生物脅迫類:干旱脅迫 淹水脅迫 寒冷脅迫 熱脅迫 鹽脅迫 低磷脅迫 氮脅迫 甘露醇脅迫 機械損傷應答 蔗糖處理胚乳 種子中Zn積累 ……
生物脅迫類/免疫互作類:輪狀鐮刀霉菌侵染 禾谷鐮刀菌侵染 立枯絲核菌侵染 水稻黑條矮縮病毒侵染 蠕孢菌侵染 蟲害應答 玉米葉斑病 吸脹冷害 ……
其他:ncRNA鑒定 轉錄因子鑒定 基因組組裝 標記開發 遺傳進化 雜種優勢 線粒體功能研究 表觀遺傳……
文章思路

Wang M et al. ?Long noncoding RNAs and their proposed functions in fibre development of cotton (Gossypium spp.). ?New Phytol. 2015
1. 棉屬轉錄本組裝數據準備
1)海島棉葉、根、莖、花瓣、花藥、柱頭、開花期0天棉鈴、開花后10天棉鈴、開花后20天棉鈴共9個樣本的自測轉錄組數據
2)搜集SRA數據庫中,棉屬轉錄組數據,共搜集得到154個來源于illumina平臺的棉屬轉錄組數據。BMKCloud公共數據模塊數據搜集過程:進入平臺公共數據模塊,輸入關鍵詞“Gossypium”,并按SRA項目編號進行檢索,使用數據類型“transcriptome”進行過濾,最終得到104個項目數據,可根據數據來源平臺在進行進一步手動過濾,最后一鍵保存數據至用戶賬號用于后續分析

2. 運行lncRNA_APP鑒定lncRNA
1)進入BMKCloud APP界面,選擇lncRNA分析 平臺,打開任務投遞界面
2)分別從用戶目錄中導入棉屬轉錄組數據
3)選擇文庫類型
4)選擇海島棉參考基因組v1.0
5)選擇差異表達分析相關參數
6)任務提交運行

3. lncRNA _APP運行結果

4. lncRNA表達量特征分析

5. 棉纖維發育相關lncRNA分析(棉纖維起始相關)
1)隨機挑選20個傾向在海島棉棉鈴中高表達的lncRNA,通過RT-PCR觀察它們分別在lint纖維fuzz纖維均正常發育陸地棉野生株(TM-1、Xuzhou142、YZ1)、lint纖維fuzz纖維均缺失陸地棉突變株(XZ142WX、XinWX)、lint纖維正常發育fuzz纖維缺失陸地棉突變株(n2、GZnn、GZNn)的轉錄水平
2)結果發現,編號為LINC02在開花期0天左右轉錄水平在lint纖維正常發育株中顯著高于lint纖維缺失株;在開花期5天左右轉錄水平fuzz纖維正常發育株中顯著高于fuzz纖維缺失株;而上述兩個時間點分別為兩種棉纖維起始(initiation)時間點,因此,文章認為編號為LINC02的lncRNA與棉纖維的initiation有關

6. 棉纖維發育相關lncRNA分析(棉纖維延伸、次級細胞壁生成階段相關)
1)為了鑒定與棉纖維“伸長”、“次級細胞壁生成”階段相關的lncRNA,對lncRNA組裝階段得到開花期10天與開花期20天的棉屬lincRNA(720個)與mRNA(6858個)進行WGCNA分析,該分析可調用BMKCloud平臺小工具WGCNA來完成。
2)WGCNA分析共將上述基因劃分為17個模塊,其中模塊16與模塊12分別表現為D亞基因組、A亞基因組偏倚表達,模塊16也在oxidation -reduction生物途徑上有顯著 富集,這一途徑一般認為與棉纖維的發育相關。

7. 棉纖維發育相關lncRNA分析(聯合miRNA數據分析)
1)下載海島棉纖維起始、伸長、次級細胞壁生成3個階段7個樣本的小RNA測序公共數據,數據SRA數據庫項目編號PRJNA284336。
2)使用上述公共數據鑒定海島棉中的microRNA及各自的前體序列。該步驟可將在BMKCloud平臺目錄下保存的PRJNA284336項目數據直接導入BMKCloud 小RNA分析平臺 完成。
3)通過對小RNA前體序列與lncRNA序列進行同源比對,根據比對結果判斷lncRNA來源的microRNA,該步利用部署于BMKCloud平臺的BLAST小工具完成。
4)其中lncRNA來源的microRNA miR397,其靶基因LAC在木質素合成過程中發揮了重要的作用,而一般認為,microRNA的來源lncRNA對其合成有負調控作用,因此認為miRNA397的來源lncRNA參與了棉纖維的發育過程。

