
不知道你有没有感觉,自己做一次PheWAS或者SMR等耗费时间非常久,今天作曲家带大家使用一款可以在线做泛癌PheWAS,SMR等的网页实用工具,今年1月份发表在Nucleic Acids Res上。结局变量是各个癌的生存鼎信天下,也就是可以迅速获取对肿瘤生存有因果效应的变量。为干湿实验提供证据。作曲家实测非常方便哦!
网址:http://njmu-edu.cn:3838/SUMMER/
摘要:在这里,我们利用英国生物库队列中 17 种癌症类型共 19 628 名发病患者的数据,系统地评估了全基因组水平的遗传效应对癌症生存期的影响,包括总生存期(OS)和癌症特异性生存期(CSS)。此外,我们还通过孟德尔随机化(MR)分析框架评估了风险因素和循环生物标志物对癌症预后的因果效应,该框架整合了癌症生存率 GWAS 数据集、全表型关联研究(PheWAS)和血液全基因组基因表达/DNA 甲基化定量性状位点(eQTL/meQTL)数据集。平均而言,超过 10 个性状、700 个基因和 4,500 个 CpG 位点易与癌症预后相关。
工具实操模块一:Survival GWAS Dataset(单个SNP对生存的遗传学效应)该模块可用于浏览超过800万个遗传变异对泛癌生存的关联效应(单个SNP对生存的影响)
图片鼎信天下
1:该部分可选择感兴趣的癌症类型(包括:膀胱癌、脑癌、乳腺癌、结直肠癌、宫颈癌、食管癌、胃癌、肺癌、淋巴性白血病、多发性骨髓瘤、口腔癌和咽癌、卵巢癌、胰腺癌、前列腺癌、肾癌、皮肤黑色素瘤、甲状腺癌)2:该部分输入感兴趣的SNP最后选择“Submit”,网页底部可出现以下结果表格:
图片
表格内容包括:Cancer(癌症类型)、CHR(染色体ID)、SNP(SNP ID)、BP_hg19(SNP基因组位置)、A1(次要/效应等位基因)、A2(主要/参考等位基因)、MAF、风险比(HR)、标准误差(SE)和P值Ps: 癌症生存率(包括 OS 和 CSS)
模块二:Phenotype-Wide Association Analysis孟德尔随机化该模块可用于浏览150种表型对泛癌生存率的因果影响
图片
1:该部分可选择感兴趣的癌症类型2:该部分可选择感兴趣的表型(包括:人体测量学、自身免疫/炎症、行为、心血管、ICD10代码、杂项、非癌症疾病、精神/神经学特征)3:该部分可选择感兴趣的生存类型最后选择“Submit”鼎信天下,网页底部可出现以下结果表格:
图片
表格内容包括:Category(表型类别)、Trait(性状)、ID_trait(性状ID)、Cancer(癌症类型)、Survival_type(生存类型)、Method(MR方法)、N_SNPs(IV数量)、MR分析的beta、SE和P值
图片
小编似乎发现睡眠时间越长,胃癌OS越短?这是值得探究的。
该部分分析主要应用了孟德尔随机化的方法(MR)
在该研究中其数据筛选以及分析方法如下:数据获取:PheWAS数据集中的GWAS汇总统计数据通过IEU Open GWAS项目(https://gwas.mrcieu.ac.uk/)访问,并使用R包TwoSampleMR提取。数据质控要求如下:(i)欧洲人群中(ii)具有≥3独立性[连锁不平衡(LD)r2< 0.01](iii)遗传工具(P值≤5×10-8),我们在这项研究中共纳入了150个特征,涵盖人体测量学、自身免疫/炎症、行为、心血管、ICD10代码、杂项、非癌症疾病和精神/神经学特征等类别(补充表 S1)。 MR分析:使用R包TwoSampleMR在表型-生存关联分析中应用多种MR方法,包括逆方差加权(IVW)、加权中位数、惩罚加权中位数和 MR Egger 方法。此外,异质性检验用于评估遗传变异对结局的影响是否与其对暴露的影响成正比,并拟合MR-Egger截距检验以评估水平多效性的存在。当达到三个标称阈值时,确定了表型与癌症生存率之间的提示性证据,包括IVW分析的P值≤0.05,Egger截距的P值>0.05,异质性的P值>0.05。
模块三:Biomarker-Wide Association Analysis该模块可用于浏览全基因组基因和 CpG 位点对泛癌生存的因果影响
图片
1:该部分可选择感兴趣的癌症类型2:该部分可选择感兴趣的生物标志物类型(包括:基因表达、CpG位点)3:该部分可选择感兴趣的生存类型4:该部分输入感兴趣的基因名最后选择“Submit”,网页底部可出现以下结果表格,可以在P值处直接拉动筛选:
图片
表格内容就是常规SMR的结果
该部分分析主要应用了SMR方法,其数据筛选以及分析方法如下:数据获取:eQTL和meQTL数据集eQTL数据获取:从eQTLGen联盟(https://eqtlgen.org/)获得了eQTL数据集,该数据集包含37个数据集,共有31684份血液样本,其中大部分是欧洲血统。meQTL数据数据获取:meQTL数据数据集来源于Hannon等人研究,共有1175份欧洲血统的血液样本用于后续分析。基于汇总数据的MR(SMR)分析:与基于表型的MR分析类似,SMR分析评估生物标志物与癌症生存率之间的关联GWAS汇总统计数据与cis-eQTL和cis-meQTL结果,条件设置为(i)以靶生物标志物为中心的SNP的大小为2000kb;(ii)–peqtl-smr 5E-08 –peqtl-heidi 1.57E-03 –cis-wind 2000。此外还使用了来自1000基因组计划第3阶段欧洲人群的基因型数据用于LD估计。SMR分析结果的P值≤0.05提示共定位,HEIDI的P值(即相关仪器中的异质性测试)>0.05提示无异质性
模块四:Running your data该模块可用于评估自己的泛癌生存数据
图片
1:该部分输入自己数据的名字2:该部分上传自己的数据3:该部分为上传数据的模板,包括表型数据以及生物标志物数据4:该部分选择选择感兴趣的癌症类型(包括:膀胱癌、脑癌、乳腺癌、结直肠癌、宫颈癌、食管癌、胃癌、肺癌、淋巴性白血病、多发性骨髓瘤、口腔癌和咽癌、卵巢癌、胰腺癌、前列腺癌、肾癌、皮肤黑色素瘤、甲状腺癌)5:该部分可选择感兴趣的生存类型6:该部分选择自己的数据类型,包括表型数据以及生物标志物数据7:该部分为上传自己的邮箱地址,结果可以发送到邮箱
小结总体而言这个网页可以为关注肿瘤生存的同学提供较好的初筛和数据补充!赶紧使用起来吧!
关注作曲家,备注加群,学习更多干货。
图片
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。财盛证券提示:文章来自网络,不代表本站观点。