immune-network免疫網絡**微環境(TME)是**周圍的環境,包括周圍血管,免疫細胞,成纖維細胞,信號分子和細胞外基質(ECM)。**與周圍微環境密切相關,不斷相互作用。**可以通過釋放細胞外信號,促進**血管生成和誘導外周免疫耐受來影響微環境,而微環境中的免疫細胞可以影響*細胞的生長和進化。免疫細胞泛指所有參與免疫反應的細胞,也特指能識別抗原,產生特異性免疫應答的淋巴細胞等。主要包括T淋巴細胞、B淋巴細胞、單核細胞、巨噬細胞、粒細胞、肥大細胞、輔佐細胞,以及它們的前體細胞等,是免疫系統的功能單元。**微環境中免疫細胞之間相互作用形成免疫網絡,網絡設立可以清晰了解**微環境中免疫細胞之間的影響機制。應用場景用網絡圖同時展示相關關系、pvalue、聚類/分類結果、跟預后的關系。-例如例文中各細胞之間的相關關系、跟預后的關系。基本原理:免疫系統遍布全身,涉及多種細胞、***、蛋白質和組織。它可以區分我們的組織和外來組織自我和非自我。死亡和有缺陷的細胞也會被免疫系統識別和***。如果免疫系統遇到病原體就會產生免疫反應。免疫細胞泛指所有參與免疫反應的細胞,也特指能識別抗原,產生特異性免疫應答的淋巴細胞等。 不斷拓展各類大學、科研院所、醫院學術資源,互通有無,形成強大學術生態圈。遼寧臨床統計數據科學專業服務
survivalCurve生存分析生存分析(survivalCurve)旨在更好地分析對不同因素對患者預后的影響,從而找到影響患者疾病的關鍵因素。生存曲線(Kaplan-Meier曲線)是生存分析的基本步驟,展示分類樣本的生存曲線,從而揭示不同因素對疾病預后的影響。一般可應用的研究方向有:患者的生存期跟基因變異的關系、藥物處理導致模式動物生存期變化。基本原理Kaplan-Meier法,直接用概率乘法定理估計生存率,故稱乘積極限法(product-limitmethod),是一種非參數法。相比其他方法,KM曲線能更好的處理刪失數據。先將樣本生存時間從小到大排列。若遇到非刪失值和刪失值相同時,非截刪失****。在生存時間后列出與時間相應的死亡人數,期初病例數(即生存期為某時間時尚存活的病例數)。然后計算活過每個時間點的生存率。以生存時間為橫坐標,生存率為縱坐標所作的曲線,即為Kaplan-Meier曲線。術語解釋風險比(HazardRatio,HR):Kaplan-Meier方法中計算的風險比HR為兩分組對生存期影響的比例,用來描述該基因高表達對生存期的危險程度。該方法中的假設檢驗為兩組中樣本的生存期是否存在差異,即該因素是否會導致生存期的改變。刪失(censored):在生存分析中。 四川生物/藥物信息學分析數據科學共同合作采用機器學習算法對疾病的干性指數進行分型分類研究。
GeneBodyProfile(對比不同的樣品在某一區域的信號特征,不**于ChIP-seq、DNase-seq、ATAC-seq數據):GeneBodyProfile表觀遺傳修飾和對基因表達、細胞發育等過程有著深遠的影響,但相關的研究還未完善。通過對比不同的樣品在某一區域的信號特征,了解不同情況下該基因的表觀遺傳情況,幫助更好的了解其發***展過程。一般應用場景:觀察相關基因轉錄起始位點(TSS)、轉錄終止位點(TTS)、genebody以及兩側信號特征;觀察某一功能區域(CpGi、TSS、TTS、peaksummits或enhancer區)及其兩側信號特征。數據要求:ChIP-seq、DNase-seq或ATAC-seq數據。下游分析:基于展示的基因或功能情況1.補充展示部分的已有相關研究2.解釋展示部分對研究課題的意義。
GSEA數據要求1、通常為表達譜芯片或測序數據(已經過預處理),也可以是其他形式可排序的基因數據。2、具有已知生物學意義(GO、Pathway、**特征基因集等)的基因集。下游分析:得到GSEA結果之后的分析有:1.基因注釋:1、繪制基因集富集趨勢圖(Enrichmentplot)橫坐標:按差異表達差異排序的基因序列。數值越小(偏向左端)的基因**在shICAM-1組中有越高倍數的差異表達,數值越小(偏向右端)的基因在對照組中有越高倍數的差異表達。縱坐標:上方的縱坐標為富集打分ES,ES是一個動態的值,沿著基因序列,找到條目中的基因則增加評分,否則減少評分。通常用偏離0**遠的值作為**終富集打分。下方的縱坐標**基因表達與表型的關聯,***值越大**關聯越強,數值大于0**正相關,小于0則**負相關。 與復旦大學問附屬醫院合作,開發人血液外泌體中RNA的數據庫。
LASSO回歸:更多的變量在擬合時往往可以給出一個看似更好的模型,但是同時也面臨過度擬合的危險。此時如果用全新的數據去驗證模型(Validation),通常效果很差。一般來說,變量數大于數據點數量很多,或者某一個離散變量有太多獨特值時,都有可能過度擬合。LASSO回歸復雜度調整的程度由參數λ來控制,λ越大對變量較多的線性模型的懲罰力度就越大,從而**終獲得一個變量較少的模型。LASSO回歸與Ridge回歸同屬于一個被稱為ElasticNet的廣義線性模型家族。這一家族的模型除了相同作用的參數λ之外,還有另一個參數α來控制應對高相關性(highlycorrelated)數據時模型的性狀。LASSO回歸α=1,Ridge回歸α=0,一般ElasticNet模型0<α<1。LASSO過程中我們通常會進行多次交叉驗證(crossvalidation)擬合(1000次)進而選取模型,從而對模型的性能有一個更準確的估計。 實驗室致病類病原微生物數據分析平臺。山東診療軟件開發數據科學共同合作
OmicCircos圖可以對感興趣的多個基因,展示其染色體的位置、拷貝數變異等多個特征。遼寧臨床統計數據科學專業服務
三角坐標統計圖是采用數字坐標形式來表現三項要素的數字信息圖像。三角形坐標圖常用百分數(%)來表示某項要素與整體的結構比例。三條邊分別表示三個不同分量,三個頂點可以看作是三個原點。三角圖可以展示某特定值在一個整體中不同類型的分布。在生物信息中三角圖可以方便地展示3種不同疾病或者3個不同分組之間某個指標的相關性。
數據要求
多個樣本的三個變量值,或者多個基因在三個不同分組中的數據值,可以是突變頻率數據、基因表達數據、甲基化數據等。 遼寧臨床統計數據科學專業服務