当前位置:懂科普 >

综合知识

> 非线性回归方程经过平均值吗

非线性回归方程经过平均值吗

非线性回归方程经过平均值吗

非线性回归方程不一定经过平均值。线性回归中,回归方程通常经过自变量和因变量的平均值,但是在非线性回归中,回归方程的形式不再是简单的一次函数,因此不一定满足经过平均值的条件。

非线性回归方程不一定经过平均值。线性回归中,回归方程通常经过自变量和因变量的平均值,但是在非线性回归中,回归方程的形式不再是简单的一次函数,因此不一定满足经过平均值的条件。

非线性回归方程不一定经过平均值。线性回归中,回归方程通常经过自变量和因变量的平均值,但是在非线性回归中,回归方程的形式不再是简单的一次函数,因此不一定满足经过平均值的条件。

小编还为您整理了以下内容,可能对您也有帮助:

非线性回归方程公式

非线性回归方程公式如下:

线性回归方程公式:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。线性回归方程是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,应用十分广泛。

一、概念

线性回归方程中变量的相关关系最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点,将散布在某一直线周围。因此,可以认为关于的回归函数的类型为线性函数。

分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

二、计算方法

线性回归方程公式求法:

第一:用所给样本求出两个相关变量的(算术)平均值:

x_=(x1+x2+x3+...+xn)/n

y_=(y1+y2+y3+...+yn)/n

第二:分别计算分子和分母:(两个公式任选其一)

分子=(x1y1+x2y2+x3y3+...+xnyn)-nx_Y_

分母=(x1^2+x2^2+x3^2+...+xn^2)-n*x_^2

第三:计算b:b=分子/分母

用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零,得方程组解为

其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差。

先求x,y的平均值X,Y

再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)

后把x,y的平均数X,Y代入a=Y-bX

求出a并代入总的公式y=bx+a得到线性回归方程

(X为xi的平均数,Y为yi的平均数)

非线性回归方程为什么不过样本中心?

非线性回归是指在因变量与一系列自变量之间建立非线性模型。线性与非线性并不是说因变量与自变量间是直线或曲线关系,而是说因变量是否能用自变量的线性组合来表示。如果经过变量转换,两个变量可以用线性来表达去关系,那么可以用之前章节中介绍的方法进行拟合回归方程。但经过变量变化后,两个变量关系仍然不能用线性形式来表达,则就会用到本节介绍的非线性回归分析方法。

非线性回归模型一般可以表示为:

其中:f(x, θ)为期望函数。该模型结构和线性回归函数非常相似,所不同的是期望函数可能为任意形式,甚至在有的情况下没有显式关系式,回归方程中的参数估计是通过迭代方法获得的。

SPSS采用两种迭代方法:Levenberg-Marquardt法和序列二次规划法。

Levenberg-Marquardt法又叫做阻尼最小二乘法,是对Gauss-Newton法的改进。它有一个阻尼因子λ,用λ可以控制搜索步长和方向。当λ=0时,即为Gauss-Newton法;当λ--∞,趋于零向量,即为最速下降法。Levenberg-Marquardt法的优势在于对影响Gausss-Newton法有效性的病态二次项,也可以通过阻尼因子来控制。

序列二次规划法主要思路是:形成基于拉格朗日函数二次近似的二次规划子问题,而这些问题可以用任意一种二次规划算法求解,求得的解用来形成新的迭代公式,作为下一次搜索的依据。用序列二次回归算法求解非线性有约束问题时的迭代次数常比求解无约束问题时少,因为在搜索区域内,序列二次规划算法可以获得最大的搜索步长和方向信息

回归直线方程必过定点为什么是x和y的平均数?

呵呵!计算【b】和【a】的时候怎么计算的?忘了没有?重视了没有?

用那个【复杂的】公式算出 b 后,计算a时,是这样计算的:a=y平均-b*x平均

这样,那个《回归方程》自然是 y^=b*x^+(y平均-b*x平均) 了

所以,在这个式子中,若 x^=x平均 的时候,一定有 y^=b*x平均+y平均-b*x平均=y平均

即,回归方程一定过 (x平均 , y平均)点。

【至于 为什么 必须那样计算《回归方程》,那涉及到《高等数学》中的《偏导数》分析 最小误差理论,不是应用者必须掌握的知识。劝你还是不要太执着。(当然,将来若你有机会步入数学专业的理科学习,这也只是“小菜一碟”了!)】

怎么用平均值法求工作曲线的回归方程?

算数平均值法求工作曲线,方法简单、实用。

方法是:

1、设定:回归方程 Y = a X + b;

2、分别将工作曲线的自变量X、因变量Y的数据,代入回归方程式,可以得到多个方程;

3、将多个方程分为两组,分别加和,成为两组方程,在联立,就可以求出a、b值;

4、将求出的 a、b值,代入 Y = a X + b,就得到算数平均值法求工作曲线的回归方程。

能不能告诉我 为什么回归直线必经过点(x的平均值,y的平均值) 拜托>_<~

因为平均值点是作为唯一的准点 其他点都基本是散落在回归直线的两侧

非线性回归方程怎么进行检验

比较简单的方法,加入方程是y=ax^3+bx^2+cx+d,使用变量替换x3=x^3,x2=x^2转换为线性方程,就可以通过R的平方以及F值来检验回归方程的整体解释力和显著程度了。

为什么回归方程必过平均数点

因为在计算回归方程的时候用平均数点算了参数K和B.不懂再问,希望采纳。

spss非线性回归分析步骤

概述

按照自变量和因变量之间的关系类型,回归分析可分为线性回归分析和非线性回归分析。非线性回归的回归参数不是线性的,也不能通过转换的方法将其变为线性。

原理

非线性回归是用来建立因变量与一系列自变量之间的非线性关系,与估计线性模型的线性回归不同,通过使用迭代估计算法,非线性回归可估计自变量和因变量之间具有任意关系的模型。

对于看起来是非线性的模型,但是可以通过变量转换化成线性的模型,称之为本质线性模型。

操作方法

01

本节内容主要介绍如何确定并建立线性回归方程。包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。

一、一元线性回归分析

用SPSS进行回归分析,实例操作如下:

02

单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9所示。从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。具体如下图所示:

03

请单击Statistics…按钮,可以选择需要输出的一些统计量。如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。Model fit项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。上述两项为默认选项,请注意保持选中。设置如图7-10所示。设置完成后点击Continue返回主对话框。

回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。由于此部分内容较复杂而且理论性较强,所以不在此详细介绍,读者如有兴趣,可参阅有关资料。

04

用户在进行回归分析时,还可以选择是否输出方程常数。单击Options…按钮,打开它的对话框,可以看到中间有一项Include constant in equation可选项。选中该项可输出对常数的检验。在Options对话框中,还可以定义处理缺失值的方法和设置多元逐步回归中变量进入和排除方程的准则,这里我们采用系统的默认设置,如图7-11所示。设置完成后点击Continue返回主对话框。

非线性回归的应用

对实际科学研究中常遇到不可线性处理的非线性回归问题,提出了一种新的解决方法。该方法是基于回归问题的最小二乘法,在求误差平方和最小的极值问题上,应用了最优化方法中对无约束极值问题的一种数学解法——单纯形法。应用结果证明,这种非线性回归的方法算法比较简单,收敛效果和收敛速度都比较理想。

回归方程的建立

对于上述这些可化为线性模型的回归问题,一般先将其化为线性模型,然后再用最小二乘法求出参数的估计值,最后再经过适当的变换,得到所求回归曲线。

在熟练掌握最小二乘法的情况下,解决上述问题的关键是确定曲线类型和怎样将其转化为线性模型。确定曲线类型一般从两个方面考虑:一是根据专业知识,从理论上推导或凭经验推测、二是在专业知识为力的情况下,通过绘制和观测散点图确定曲线大体类型。

举例:

1 1790-1960某国人口变化数据:注意:即便线性方程对对观测数据拟合相当好,但有关误差项的性和方差假设有可能被破坏。原因是时间序列的数据误差项往往不,误差项大小有可能根据数据总体的大小而变化,意思就是,即便适合这个样本的观测量的方程,但是,不适合总体。根据经验,人口增长模型不能被转化为线性模型,所以,可以利用曲线回归或者非线性回归。进一步比较究竟是曲线回归好还是非线性回归好,需要建立新的残差变量,这一步并不难,就是在spss中,相应分析的保存子对话框中建立新的对应模型的变量。其实,有一个万能公式:spss中,所有的“保存”对话框的功能都是,在二维表窗口也就是spss的盛放数据窗口中建立新变量,这个新变量有默认名,是相应分析的重要结果。保存新变量以后,需要根据残差的序列图进行判断:最平稳的就是最合适的。

例2:血中药物浓度和时间曲线呈非线性关系。

这个是根据专业背景知识而判断。药物不可能马上见效,也许在血液中逐步或者突然见效。

例3:身高和体重,在青少年中,是呈直线关系,因为,青少年在不断成长,但是,对于整个人的生命周期,确是曲线关系 因为,成年人的身高一般是确定的。

像这样的例子根本用直线回归拟合不了,也称为非本质线性模型。对于这种实际情况,可以使用非线性回归的分段模型。最终目的是使残差平方和最小。也就是在图形中跟大多数散点接近。

spss操作注意:

1 初始值确定:

①利用简单假设确定,例如,如果在所有变量中最大的一个个案值为178万,就需要选择200为初始值,再根据方程估计参数值。

②利用图形或者图形辅助,数据转换

如果参数没有初始值,也不能简单的设置为0,最好是将它们设置为预计要改变的值大小。总之,就是想办法找到一个比较合适的值,多设几个,然后比较。也可以根据专业背景和重点,来设值。这个还可以根据数学计算,例如,方程二边同时取对数。需要具体问题具体分析。

2 迭代和收敛:迭代是计算机自动计算的,例如将迭代设置为1000,意思就是计算机算了1000次,每一次都是根据上一次的结果的基础进行再运算。当然,人工笔算需要算1000年。迭代不会永无止境的计算下去,而是收敛标准或者称作最大迭代的设置后,不论得没有得到结果,是否达到目标,都会停止。在结果输出表格中有迭代的历史记录。这个表格就是过程表,每一步怎样算的,都可以找到。因为迭代是计算机自动计算,例如,烧水,如果开了不断电,水烧干了就会起火,所以,机器需要人控制,它本身没有情感。

spss操作:不论“计算变量”对话框或者“非线性回归”,和非线性回归的“损失函数”对话框都是很像的,有一个计算器算盘,函数组,函数和特殊变量。各种元素组合在一起,构成一个表达式,这个表达式构成一个新变量。只要用鼠标将对应的元素加入到表达式中,然后检查,或者事先在本上写有表达式,对应好,基本就没有问题。其实,spss许多操作根据文字可以猜出个大概。

3 损失函数:“非线性回归”对话框是对整个因变量的运算法则,但是,损失函数是对某一个统计量的运算法则,spss默认是使用最小残差平方和找出非线性模型,也可以自己设置。在相应对话框中都有设置。可以这样以为:损失函数就是估计误差的函数,它是一个负面指标,越小越好。

4 参数约束:多数非线性模型中,参数必须在有意义的区间内。指的是在迭代过程中对参数的。分为线性约束和非线性约束。线性约束中将参数乘以常数 但这个常数不能为其他参数或者自身。非线性约束中至少有一个参数和其他参数相乘或者相除或者进行幂运算。

结果:

1 估计参数的渐进相关矩阵:如果出现非常大的正值或者负值,可能因为模型中参数过多,也说明观测量数目不足,但是不说明模型不拟合。

2 95%置信区间:如果95%置信区间不包括零,表明这个参数具有统计学意义。如果离零比较接近,下结论时候应慎重。

3 曲线拟合中计算出来的决定系数实际上是曲线直线化直线方程的决定系数,不一定代表变换前的变异解释程度。也就是说二个模型的决定系数有可能不具有可比性。

引申:

1 曲线回归最好的模型和非线性回归最好的模型进行比较。从中挑选最合适的模型。通过保存残差变量然后绘制序列图实现。

2 有很多时候,线性模型根本解决不了问题,因为,即便费了很大力气转化为线性模型,但是,却扭曲了数据。例如不仅改变原来数据的正态性,还改变数据的方差齐性,性。并且,在精度要求比较高或者模型比较复杂时候,曲线回归也不能应用。所以这时候最好应用非线性回归模型。

为什么线性回归方程必经(x的平均值,y的平

线性回归方程 ^Y=bx+a 必过 (X的平均值,Y的平均值) 为什么啊?????

因为算得的回归直线结果中,y=bx+a

b的分子为:(x1y1+x2y2+...xnyn)-nx'y' , x', y'分别为xi, yi的平均值

b的分母为:(x1^2+x2^2+...xn^2)-n(x')^2

a=y'-bx'

即得到的a, b满足方程y'=bx'+a, 这里x', y'分别为平均值。也即(x',y')满足直线y=bx+a, 所以是回归直线上的一点。

  • 文章版权属于文章作者所有,转载请注明 https://dongkepu.com/zonghezhishi/7vknrx.html