设为首页 | 加入收藏
当前位置: 拉斯维加斯网上赌博 > 热图天下 > 生物信息学讨论版
生物信息学讨论版
发表日期:2019-07-03 12:23| 来源 :本站原创 | 点击数:
本文摘要:在组学研究的相关文章中,我们常常可以看到热图(Heatmap)的展示。这些红绿相间且色彩变化丰富的热图总是能吸引读者的眼球,从而为文章增添不少亮色。当然,作

在组学研究的相关文章中,我们常常可以看到热图(Heatmap)的展示。这些红绿相间且色彩变化丰富的热图总是能吸引读者的眼球,从而为文章增添不少亮色。当然,作为严谨的科学研究论文,图表的展示当然不可能仅仅是为了好看。热图作为一种对实验数据及其分析结果的直观的表达方式,在很多文章中都有着不可或缺的地位。本文我们就来讨论一下热图在文章中的作用以及如何对其进行解读。



热图是对实验数据分布情况进行分析的直观可视化方法,可以用来进行实验数据的质量控制和差异数据的具像化展示,还可以对数据和样品进行聚类,观测样品质量。它有多种形式,但基本的元素却是通用的。例如下图,就是一副组学研究中热图的常用绘制模式,每个小方格表示每个基因,其颜色表示该基因表达量大小,表达量越大颜色越深(红色为上调,绿色为下调)。每行表示每个基因在不同样本中的表达量情况,每列表示每个样品中所有基因的表达量情况。上方树形图表示对来自不同实验分组的不同样品的聚类分析结果,左侧树状图表示对来自不同样本的不同基因的聚类分析结果:



生物信息学讨论版




在文章中,热图通常有两大作用:数据质量控制和直观展示重点研究对象的差异变化情况。首先,我们来说说热图在数据质量控制(质控)过程中的应用。如下图,通过观察上方树形图(对列的聚类分析)大家可以明显的看到,两个实验分组中的Experiment组,其基因的总体表达模式与作为对照的control组存在很大的差异:在对照组中,多数基因都呈现极大下调的表达模式(绿色条带),而实验组则正好相反,多数基因为上调模式。属于对照组的三个样本(C1、C4和C5)的表达模式相似,属于实验组的三个样本(E1、E4和E5)的表达模式相似。这证明无论是对照组还是实验组,各自的样本重复性都是很好的,至少可以证明其在实验处理上是不存在大的失误的,得出的数据也是可信的、可靠的、符合逻辑的。而一旦出现同一组的某一个或某几个样本的表达模式与本组内其他样本表达模式迥异的情况,则需要小心调查前期实验是否存在问题了。



生物信息学讨论版




热图在文章中的另一大作用就是直观展示重点研究对象的表达量数据差异变化情况。通过上文的介绍,大家可能已经发现了一个问题,那就是一次实验中检测到的基因或蛋白往往成千上万,导致一副全局性的热图的行数(基因或蛋白数)也相应地十分庞大,使得在一副图片大小的篇幅内,代表单个基因或蛋白的每一个小方格的信息(如基因名和表达量等)几乎不可能被肉眼所识别。所以类似的用整个数据集画出的热图往往只能用于数据的整体质控。而要能够向读者清晰展示自己所研究的某一批基因或蛋白的数据分布与变化情况,就应当如下图所示(原文链接),把自己的研究对象从数据集中找出来再绘制热图(作为重点关注的几个标志性的基因在右侧以黑色标注):



生物信息学讨论版



那么热图应该如何绘制呢?实际上,网上有很多工具可以实现热图的绘制,大家只需要把绘制热图的数据矩阵作为输入即可;或者有对自己的编程能力比较有信心的,也可以使用脚本调用R包,如Pheatmap等。



其实用完整数据集绘制全局性热图好办,但要为自己选择的重点研究对象绘制一幅个性化的热图则需要大家花些时间和精力,小心谨慎地挑选数据。大家可以根据自己的兴趣、文献提供的信息或者结合功能分析的结果(如显著的信号通路、生物过程等等)来从数据集里挑选自己想要的数据,之后再绘制个性化的热图。这个过程可能会有些费时费力,为了方便大家的工作,这里给大家介绍一种快速绘制个性化热图的方法,那就是利用OmicsBean组学数据整合分析云平台来绘制热图。例如研究对象是参与了“positive
regulation of cellular process、cellular response to chemical
stimulus以及single-multicellular organism process这三个显著的生物过程的基因,那么我们只需在功能分析的结果列表中将这三个生物过程挑选出来,使用系统自带的导出热图功能即可:



生物信息学讨论版





相信这样一副热图放在文章里,除了可以清晰有效地说明研究对象的表达量变化情况,还能为文章带来不少亮色,可谓是锦上添花!

拉斯维加斯网上赌博 (责任编辑:admin)
热门推荐