Nomogram列線圖(nomogram,諾莫圖)是在平面直角坐標系中,用一簇互不相交的線段表示多個臨床指標或者生物學特征,用以預測一定的臨床結局或者某類事件發生的概率的圖。列線圖使預測模型的結果更具有可讀性,可個性化地計算特定**患者生存率,在臨床實踐中有較大的價值。一般可應用的研究方向有:將回歸的結果進行可視化呈現,對個體樣本給出其發病風險或比例風險;根據多個臨床指標或生物學特征,判斷個體樣本的疾病分類或特征?;驹恚毫芯€圖的理論于1884年提出,**早用于工程學。它能夠將復雜的計算公式以圖形的方式,快速、直觀、精確的展現出來。列線圖通過構建多因素回歸模型(例如Cox回歸、Logistic回歸等),根據模型中各個影響因素對結局變量的影響程度的高低,即回歸系數的大小,給每個影響因素的每個取值水平進行賦分。將各個評分相加得到總評分,通過總評分與結局事件發生概率之間的函數轉換關系,從而計算出該個體結局事件的預測概率。校準曲線(calibrationcurve)為實際發生率和預測發生率的散點圖,常于用于化工行業溶液配制。在這里通過觀察預測值與實際值相差情況,判斷基于回歸模型構建列線圖的有效性。 承擔各類項目超過400余項。成果發表指導數據科學共同合作
單細胞測序數據挖掘:GEO目前收錄的單細胞研究樣本已經超過2萬例,單細胞測序幾乎成為生物醫學領域CNS***文章的標配。實驗費用高昂,阻斷了CNS夢,既然其他數據可以挖,單細胞測序數據照樣可以挖。已知公共數據庫中單細胞測序數據涉及各種疾病類型,包括**、免疫細胞、炎癥類甚至神經、肌肉、骨骼等,樣本豐富、數據龐大,你不挖就是失去了一座金山。我們提供各種設計單細胞測序、各種測序、芯片、多組學的公共數據庫挖掘、培訓、模型構建、臨床統計、算法還原服務;你能想到,我能做到;你提供參考文獻、思路和目的,我們提供結果;如果沒有思路,我們提供付費科研設計服務。示例如下:利用公共數據庫的1539個單細胞樣本,構建自己的生物學故事。 重慶組學實驗數據科學口碑推薦指導科研方案糾偏,更好更快發表文章。
ssGSEA(single sample GSEA)主要針對單樣本無法做GSEA而提出的一種實現方法,原理上與GSEA是類似的。ssGSEA根據表達譜文件計算每個基因的rank值,再進行后續的統計分析。通過這個方法,我們可以得到每個樣本的免疫細胞或者免疫功能,免疫通路的活性,然后根據免疫活性進行分組。
ssGSEA量化免疫細胞浸潤**的一個優點就是自己可以定制量化免疫浸潤細胞種類。目前公認并且用的**多的免疫細胞marker就是2013年發表在Immunity上的SpatiotemporalDynamicsof IntratumoralImmuneCellsReveal the Immune Landscape in Human Cancer 所提供的免疫細胞marker genes(Table S1),能提取到24種免疫細胞信息。
TMB**突變負荷**突變負荷(TMB)作為免疫療法的生物標志物,能夠較好的預測患者免疫***的療效?;?*突變負荷,可以從一種新的角度探尋基因跟免疫及預后的關系。一般應用場景:基于TMB預測不同性狀的免疫***療效、不同基因表達或突變對免疫***潛在的影響。基本原理:**突變負荷(TumorMutationBurden,TMB),通常被定義為一份**樣本中,所評估基因的外顯子編碼區每兆堿基中發生置換和插入/缺失突變的總數。近年許多研究都報道了TMB與PD-1/PD-L1抑制劑的療效高度相關,同時基于TMB進行的臨床研究都得到了較好的結果。這讓一些**患者可以通過TMB標志物對免疫療法的療效進行一定程度的預測。結合TMB,可以從免疫***角度探尋關鍵基因、探究不同亞型**存在的不同發病機制。數據要求:基因突變數據,臨床或其他分類數據。 可對接各類公共數據庫,切入各類接口,并對公共數據庫進行大規模數據挖掘。
Inmmune gene
免疫學研究是目前科研領域爭相研究的熱點,**免疫細胞浸潤是其中一種。**免疫細胞浸潤是指免疫細胞從血液中移向**組織發揮作用。我們從**組織中分離出浸潤免疫細胞含量,計算基因與浸潤免疫細胞含量的相關性,篩選出影響免疫浸潤的候選基因。
基本原理:
從基因矩陣數據中提取免疫細胞含量,生成免疫細胞含量矩陣;
計算目標基因與浸潤免疫細胞含量的相關性,篩選與浸潤免疫細胞含量高度相關的基因。
術語解讀:
相關性系數(pearson,spearman, kendall)反應兩個變量之間變化趨勢的方向以及程度。相關系數范圍為-1到+1。0表示兩個變量不相關,正值表示正相關,負值表示負相關,值越大表示相關性越強。
數據要求:
**數據表達矩陣 按照斯普林格學術規范化處理準則提供文稿同行**投稿前意見評估。成果發表指導數據科學共同合作
生物醫學科研領域的組學數據處理。成果發表指導數據科學共同合作
PCA主成分分析測序技術的發展使得現在能夠從宏觀角度分析基因表達,但是也在一定程度上增加了數據分析難度。許多基因之間可能存在相關性,如果分別對每個基因進行分析,分析往往是孤立的,盲目減少指標會損失很多有用的信息。PCA(PrincipalComponentAnalysis),即主成分分析方法,是一種使用*****的數據降維算法。一般可應用的研究方向有:一組基因在多個分組中的差異情況,多個基因在該樣本中的差異情況?;驹鞵CA的主要思想是將n維特征映射到k維上,這k維是全新的正交特征也被稱為主成分,是在原有n維特征的基礎上重新構造出來的k維特征。PCA的工作就是從原始的空間中順序地找一組相互正交的坐標軸,新的坐標軸的選擇與數據本身是密切相關的。其中,**個新坐標軸選擇是原始數據中方差**的方向,第二個新坐標軸選取是與**個坐標軸正交的平面中使得方差**的,第三個軸是與第1,2個軸正交的平面中方差**的。依次類推,可以得到n個這樣的坐標軸。通過這種方式獲得的新的坐標軸,我們發現,大部分方差都包含在前面k個坐標軸中,后面的坐標軸所含的方差幾乎為0。于是,我們可以忽略余下的坐標軸,只保留前面k個含有絕大部分方差的坐標軸。事實上。 成果發表指導數據科學共同合作