2023年1月Jan2023DigitalTechnology&Application第41卷第1期Vol.41No.1数字技术与应用10中图分类号:TP311.13;F239.65文献标识码:A文章编号:1007-9416(2023)01-0010-03DOI:10.19695/j.cnki.cn12-1369.2023.01.03大数据背景下R语言在生物统计学图形可视化中的应用*广西民族师范学院化学与生物工程学院汪国海随着经济社会的快速发展,生物学实验数据的收集方法更趋向于综合化和复杂化,致使获得的实验数据信息呈现爆发式增长并不断积累,对深度挖掘实验数据的软件和数据可视化的需求越来越高。将R语言应用于生物统计图形的可视化中,既能满足学生对数据可视化分析的需求,又能提高学生对实验数据动态变化的理解和课程兴趣。生物统计学是一门理论知识丰富且实践性很强的课程,其主要以概率论、线性代数为基础推断并解释生物学现象,该课程的开设有利于培养学生分析和解决实际生物学问题的能力,为后期数据分析和科研能力的提升打下坚实的基础[1]。但由于生物统计学课程公式推导复杂,对学生的数学基础要求高,易使学生缺少兴趣[2];同时随着大数据技术的快速发展,实验数据的类型和收集方法更倾向于综合化和复杂化,对数据挖掘的深度和图形可视化的要求越来越高,需要不断的引入新的数据分析软件才能全面综合的反映出实验数据的动态变化。R语言是一个能兼容多种类型的数据格式并具备交互式的数据分析能力的开源软件[3],尤其是强大的扩展能力和丰富的功能选项,使其能独立完成不同类型的生物统计数据分析和可视化过程,降低了不同软件间的频繁切换程度[4]。ggplot2是R语言中最为强大的作图程序包,其核心理念是将绘图与数据分离,数据相关的绘图与数据无关的绘图分离,是按图层作图,同时它保有命令式作图的调整函数,使其更具灵活性,绘制出来的图形美观,同时避免繁琐细节,从而使数据分析者更能将注意力集中于数据分析本身[5]。本文通过使用R语言中的ggplot2程序包实现生物统计学常见图形的可视化过程,并附上相关的代码以便为生物统计学的课程发展与改革提供参考。1基于ggplot2的条形图条形图由一组宽度相同,高度与频数成比例的长方形组成,表示研究对象数据的大小,如图1所示。12.510.07.55.02.50.0RemovalSoilsurfaceMicrohabitatStonecavesStonesurface图1啮齿动物对不同微生境中种子的搬运率Fig.1.Seedtransportratesofrodentsindifferentmicrohabitats代码如下:1.install.packages("ggplot2")#安装ggplot2程序包2.library(ggplot2)#调用ggpl...