2023年郑老师多门科研统计课程:多次直播,含孟德尔随机化方法
线性回归是一种常用的统计分析方法,用于建立自变量和因变量之间的线性关系模型。当知道两个变量间存在相关关系时,我们时常想进一步去探讨是否可以通过其中一个变量的数值定量的去预测另外一个变量的数值。
经典案例:父亲身高与儿子身高存在相关关系,是否可以通过父亲身高预测儿子的身高?
(资料图片)
这类问题在统计学上常采用线性回归的方法来解决。
对于统计小白来说,会想到用SPSS开展线性回归分析,毕竟SPSS工具非常简单,统计分析操作过程明晰,可谓是傻瓜式操作。但是做单因素线性回归时只能一个一个来,结果显示又过于僵硬,回头分析报告需要自己一点一点填入统计表,虽然简单但工作量太大。
如果可以批量开展单因素线性回归,还能一键生成三线表就再好不过了!那今天,就为诸位介绍两种方式来实现它!分别是风暴统计和R语言软件!
本文主要内容包括:
1.实操案例介绍
2.风暴统计复现批量单因素线性回归
语言软件复现批量单因素线性回归
1、实操数据集介绍
我们使用R语言MASS包自带数据集birthwt作为实操数据集。这是一份于1986年在在马萨诸塞州收集的与婴儿出生体重低相关的危险因素的数据。以定量数据出生体重(bwt)作为结局变量,探讨下列因素对出生体重的影响。可能的影响因素如下:
下面将结合本数据分别通过风暴统计智能在线免费平台与R语言软件来进行批量单因素回归分析复现,方便大家对两种方法的特点有更加直观的认识!
2、风暴统计复现批量单因素线性回归
第一步:输入网址,打开“风暴智能统计”——“线性回归分析”
第二步:导入整理好的数据,目前支持10M以内的csv格式数据
第三步:点击“快速线性回归分析”——选择因变量和自变量,右侧直接显示批量单因素回归法的结果
第四步:导出统计分析报告——一键导出word版三线表结果
风暴统计结果展示如下,直接生成word版三线表,高效快速,结果还比较美观!
3、R语言软件复现批量单因素线性回归
第一步:安装并加载R包
("autoReg")
library(autoReg)
autoReg包,一款功能十分强大的R包,加gaze函数即可快捷完成基线表的制作,还可以直接一行代码输出单因素+多因素回归分析(支持线性模型、广义线性模型和比例风险模型)的表格。
第二步:导入整理好的数据
setwd("D:/R")#设置工作空间,将要导入的csv格式数据放在工作空间文件夹中
BWT<-("")
第三步:autoReg包做批量单因素线性回归分析
#函数表达式:
#linfit<-lm(y~x1+x2+x3+x4+x5……,data=数据集名)
#linreg<-autoReg(linfit,uni=TRUE,multi=TRUE,threshold=)
#uni为T指输出单因素模型结果,multi为T输出多因素模型结果,threshold纳入多因素回归模型的条件
linfit<-lm(bwt~age+lwt+race+smoke+ptd+ht+ui+ftv,data = BWT)
linreg<-autoReg(linfit,uni=T,multi=F,threshold=1)
linreg#展示结果
从以上结果对比可以看出,风暴统计平台与R语言单因素线性回归结果完全一致,并且风暴统计平台操作更简单,且p值单独分列,结果更加的清晰明了!
风暴统计平台的分析结果十分规范可靠,这也是由于平台的构建依托于R代码进行分析。同时操作过程也十分的简便,相较于R语言的使用门槛那真的是低太多了。结果直接一键输出word三线表,方便又快捷,大家进行统计分析时不妨一试!
标签: