如何用spss做probit回归和非线性回归?

来自:    更新日期:早些时候
如何用spss做probit回归和非线性回归~

Probit回归:
Probit回归全称probability unit,翻译过来叫做概率单位法,蛮拗口的一个名字。这个回归主要用于研究半数效量用的。直白一点说,就是比方你拿一种药去药蟑螂,你想知道你用多少药能药死多少蟑螂,那你就可以用probit回归来估计这个数。Probit回归经常拿来和logistic回归作比较,通常对于二分类变量来说,这两个回归计算出来的概率是非常相似的。(虽然logistic回归最后判断的是是或否,但是它也需要计算一个概率来判断这个结果倒是是还是否。)而且如果有一点数学基础的话,会知道,这两个回归画出来的图也非常像,只是logistic回归画出来的Z型稍微平缓一些。
那么这两个回归到底有什么区别呢?通常来说区别不大。最重要的一个区别在于probit回归适用于呈正态分布的数据,logistic回归适用于呈logistic分布的数据。不过这个区别也蛮微妙的,因为正态分布和logistic分布还蛮像的。所以大概来讲,到底是选择哪个分布更多的还是一种个人喜好。
但是大家都知道啊,logistic分布比probit分布可有名多了。如果说十个从事大数据的人里边有五个人知道logistic回归,那么有三个知道probit回归就不错了。在我们ppv课网站的spss视频教学里边,绝大部分都会讲到logistic回归,但是probit回归就不见得有人讲了。(顺便说一句,我个人最喜欢spss从入门到精通这套课程,刚入门的时候就是听得这套课。强烈推荐大家去听一听)。
那么这是什么原因呢?这绝不是probit不好用的原因。主要原因有两个,第一,logistic回归形式比较多。二分类,有序多分类,无序多分类,这些logistic回归都可以做。这就好像我们ppv课网站提供了spss,sas,r,matlab,hadoop等等视频,你可以从零基础学到精通级别,肯定比较受欢迎哈。第二,则归功于logistic回归的易解释性。Logistic回归提供了一个很重要的参数,OR值,这个值很直接的告诉你处于某个状态比处于另一个状态时因变量发生的概率增加了多少倍。这当然是一个很重要很直观的参数啦。就好像你每学一段时间以后,我们ppv课网站告诉你你的知识积累比之前增加了多少倍多少倍,这个肯定很重要撒。
因此呢,logistic回归就比probit回归应用的广泛了。不过这并不是说logistic回归就比probit回归好。实际上,两种回归拟合的方程几乎一样好。不过,再怎么几乎一样,那也肯定是有所不同的。可惜这种不同用你的肉眼一般是看不出来的,至于怎么看,下边在讲。
好了,现在大概就介绍完probit回归的背景知识了(绝对没有凑字数)。现在我们开始操作。
首先假设一个情景,假设我们ppv课网站打算增加一定的课程,达到收视率增加百分之二十的目的,我们就有了三个变量,课程增加的数目(假设分为3,6,9三个水平),各个增加水平的课程数(比方加3节课,6节课,9节课的都是十个课程),各个水平的课程的收视率增加达到百分之二十的课程数(假设分别是3,5,6)。(这段真的有点绕,最好读两遍保证能看懂哪个变量是表示的什么意思)。
那么我们就有了一个3*3的数据集,选择菜单分析——回归——probit,打开主面板,响应频率里选我们各个水平收视率增加达到百分之二十的课程数(也就是我们做实验的课程里边有多少课程成功达到了收视率增加的目标),观测值汇总里边选择各个增加水平的总课程数,再下边有一个因子,一个协变量。我们的自变量课程增加的水平是三节课一个台阶,所以我们要选到协变量里边去哈。(如果你的自变量是连续型变量,那你就得在因子下边的那个定义范围里边选好范围。)此外协变量下边有一个转换下拉菜单,这个菜单有三种方法,除了“无”以外,还有两种对数转换,你可以试试,你的数据到底怎么转换效果最好。完了以后,在左下边还有一个模型:概率/logit,这个单选框里默认的是概率。也就是默认数据分布是正态的。这个也不用管它。
然后点开选项,勾选频率,信仰置信区间,继续,确定。
然后就可以看结果了。参数值和卡方检验这两个表会告诉你这个模型有没有意义,适不适合用probit回归(如果想和logistic回归作比较,就可以用这里的拟合度检验检测)。此外置信限度这个很大的表会告诉你假如你想要你的课程收视率增加的概率是百分之八十的时候,你的课程要增加多少节课这么个数据。它大概是以百分之五为精度的。那如果我想知道增加百分之八十三,需要加多少节课的话,那么我们就要用参数估计值里的参数进行计算了。
非线性回归
自然界中既然有线性回归,那么理所当然的,也会有非线性回归。不过,人类对于非线性回归的研究远远不如对线性回归的研究来的深刻,广泛。不信你看一看你的spss教科书,线性回归的内容可以洋洋洒洒写一章,非线性回归确占一小节,还往往是比较薄的一节。
线性回归指的是y=a+a1*x1+a2*x2…这种形式的方程,非线性回归包含的方程类型就多得多了。常见的有,幂函数,指数函数,双曲函数,对数函数等等。我们先举个例子。假设想拟合ppv课授课老师的数目和网站受欢迎程度的关系。选择分析——回归——非线性。打开主对话框。因变量选择网站受欢迎程度,模型表达式需要自己编辑。(我就挺怵这个的),首先我们知道,我们肯定不可能看一眼就看出我们的数据是什么样子的模型,我们可以通过图形——图表构建程序里边,画出散点图,通过散点图大致判断我们的模型符合什么样的方程,然后在进一步使用(或者直接使用)参数估计法(前面讲过的),估计出它的表达式。
估计出表达式以后,就可以编辑模型表达式了。编辑好以后看左下角的参数那一栏。你的模型里边的参数是需要首先定义一个初始值的。这个初始值要尽量靠近真实值,如果离真实值太远的话,也会影响到模型的准确度。看到这里,可能你要发脾气了,这是个什么模型?怎么这么麻烦?!!要是我知道模型,知道初始值,那我还需要做分析吗啊?!!唉,我也没办法,非线性回归就是这么个玩意,总之你还是拿起你的笔,根据你的模型代几组数据算一算大概的初始值吧。毕竟为了最后的精度嘛。
输好初始值以后,打开保存对话框,勾选预测值,残差。继续,其他的默认就可以。点确定。
输出的参数估计值会给出参数,套到你的模型里就可以。注意看方差分析表下边的标注,里边会给出决定系数R^2,这个R^2通常比参数估计法里的大,也就是说,非线性回归的精度往往比参数估计法的大,模型拟合的好。(废话,要是非线性回归一点优势也没有,还有谁肯研究啊。)
上边只是简单介绍了一点非线性回归的方法。实际生活中,非线性回归比线性回归远远复杂的多,不是一句两句就能说清楚的,此外,还有一种很普遍的办法是通过数学公式把非线性方程转化成线性方程。这样就能大大降低方程的复杂性。在这里,给大家总结了几个常见的公式。

Probit回归:
Probit回归全称probability unit,翻译过来叫做概率单位法,蛮拗口的一个名字。这个回归主要用于研究半数效量用的。直白一点说,就是比方你拿一种药去药蟑螂,你想知道你用多少药能药死多少蟑螂,那你就可以用probit回归来估计这个数。Probit回归经常拿来和logistic回归作比较,通常对于二分类变量来说,这两个回归计算出来的概率是非常相似的。(虽然logistic回归最后判断的是是或否,但是它也需要计算一个概率来判断这个结果倒是是还是否。)而且如果有一点数学基础的话,会知道,这两个回归画出来的图也非常像,只是logistic回归画出来的Z型稍微平缓一些。
那么这两个回归到底有什么区别呢?通常来说区别不大。最重要的一个区别在于probit回归适用于呈正态分布的数据,logistic回归适用于呈logistic分布的数据。不过这个区别也蛮微妙的,因为正态分布和logistic分布还蛮像的。所以大概来讲,到底是选择哪个分布更多的还是一种个人喜好。
但是大家都知道啊,logistic分布比probit分布可有名多了。如果说十个从事大数据的人里边有五个人知道logistic回归,那么有三个知道probit回归就不错了。在我们ppv课网站的spss视频教学里边,绝大部分都会讲到logistic回归,但是probit回归就不见得有人讲了。(顺便说一句,我个人最喜欢spss从入门到精通这套课程,刚入门的时候就是听得这套课。强烈推荐大家去听一听)。
那么这是什么原因呢?这绝不是probit不好用的原因。主要原因有两个,第一,logistic回归形式比较多。二分类,有序多分类,无序多分类,这些logistic回归都可以做。这就好像我们ppv课网站提供了spss,sas,r,matlab,hadoop等等视频,你可以从零基础学到精通级别,肯定比较受欢迎哈。第二,则归功于logistic回归的易解释性。Logistic回归提供了一个很重要的参数,OR值,这个值很直接的告诉你处于某个状态比处于另一个状态时因变量发生的概率增加了多少倍。这当然是一个很重要很直观的参数啦。就好像你每学一段时间以后,我们ppv课网站告诉你你的知识积累比之前增加了多少倍多少倍,这个肯定很重要撒。
因此呢,logistic回归就比probit回归应用的广泛了。不过这并不是说logistic回归就比probit回归好。实际上,两种回归拟合的方程几乎一样好。不过,再怎么几乎一样,那也肯定是有所不同的。可惜这种不同用你的肉眼一般是看不出来的,至于怎么看,下边在讲。
好了,现在大概就介绍完probit回归的背景知识了(绝对没有凑字数)。现在我们开始操作。
首先假设一个情景,假设我们ppv课网站打算增加一定的课程,达到收视率增加百分之二十的目的,我们就有了三个变量,课程增加的数目(假设分为3,6,9三个水平),各个增加水平的课程数(比方加3节课,6节课,9节课的都是十个课程),各个水平的课程的收视率增加达到百分之二十的课程数(假设分别是3,5,6)。(这段真的有点绕,最好读两遍保证能看懂哪个变量是表示的什么意思)。
那么我们就有了一个3*3的数据集,选择菜单分析——回归——probit,打开主面板,响应频率里选我们各个水平收视率增加达到百分之二十的课程数(也就是我们做实验的课程里边有多少课程成功达到了收视率增加的目标),观测值汇总里边选择各个增加水平的总课程数,再下边有一个因子,一个协变量。我们的自变量课程增加的水平是三节课一个台阶,所以我们要选到协变量里边去哈。(如果你的自变量是连续型变量,那你就得在因子下边的那个定义范围里边选好范围。)此外协变量下边有一个转换下拉菜单,这个菜单有三种方法,除了“无”以外,还有两种对数转换,你可以试试,你的数据到底怎么转换效果最好。完了以后,在左下边还有一个模型:概率/logit,这个单选框里默认的是概率。也就是默认数据分布是正态的。这个也不用管它。
然后点开选项,勾选频率,信仰置信区间,继续,确定。
然后就可以看结果了。参数值和卡方检验这两个表会告诉你这个模型有没有意义,适不适合用probit回归(如果想和logistic回归作比较,就可以用这里的拟合度检验检测)。此外置信限度这个很大的表会告诉你假如你想要你的课程收视率增加的概率是百分之八十的时候,你的课程要增加多少节课这么个数据。它大概是以百分之五为精度的。那如果我想知道增加百分之八十三,需要加多少节课的话,那么我们就要用参数估计值里的参数进行计算了。
非线性回归
自然界中既然有线性回归,那么理所当然的,也会有非线性回归。不过,人类对于非线性回归的研究远远不如对线性回归的研究来的深刻,广泛。不信你看一看你的spss教科书,线性回归的内容可以洋洋洒洒写一章,非线性回归确占一小节,还往往是比较薄的一节。
线性回归指的是y=a+a1*x1+a2*x2…这种形式的方程,非线性回归包含的方程类型就多得多了。常见的有,幂函数,指数函数,双曲函数,对数函数等等。我们先举个例子。假设想拟合ppv课授课老师的数目和网站受欢迎程度的关系。选择分析——回归——非线性。打开主对话框。因变量选择网站受欢迎程度,模型表达式需要自己编辑。(我就挺怵这个的),首先我们知道,我们肯定不可能看一眼就看出我们的数据是什么样子的模型,我们可以通过图形——图表构建程序里边,画出散点图,通过散点图大致判断我们的模型符合什么样的方程,然后在进一步使用(或者直接使用)参数估计法(前面讲过的),估计出它的表达式。
估计出表达式以后,就可以编辑模型表达式了。编辑好以后看左下角的参数那一栏。你的模型里边的参数是需要首先定义一个初始值的。这个初始值要尽量靠近真实值,如果离真实值太远的话,也会影响到模型的准确度。看到这里,可能你要发脾气了,这是个什么模型?怎么这么麻烦?!!要是我知道模型,知道初始值,那我还需要做分析吗啊?!!唉,我也没办法,非线性回归就是这么个玩意,总之你还是拿起你的笔,根据你的模型代几组数据算一算大概的初始值吧。毕竟为了最后的精度嘛。
输好初始值以后,打开保存对话框,勾选预测值,残差。继续,其他的默认就可以。点确定。
输出的参数估计值会给出参数,套到你的模型里就可以。注意看方差分析表下边的标注,里边会给出决定系数R^2,这个R^2通常比参数估计法里的大,也就是说,非线性回归的精度往往比参数估计法的大,模型拟合的好。(废话,要是非线性回归一点优势也没有,还有谁肯研究啊。)
上边只是简单介绍了一点非线性回归的方法。实际生活中,非线性回归比线性回归远远复杂的多,不是一句两句就能说清楚的,此外,还有一种很普遍的办法是通过数学公式把非线性方程转化成线性方程。这样就能大大降低方程的复杂性。在这里,给大家总结了几个常见的公式。

Probit回归:
Probit回归全称probability unit,翻译过来叫做概率单位法,蛮拗口的一个名字。这个回归主要用于研究半数效量用的。直白一点说,就是比方你拿一种药去药蟑螂,你想知道你用多少药能药死多少蟑螂,那你就可以用probit回归来估计这个数。Probit回归经常拿来和logistic回归作比较,通常对于二分类变量来说,这两个回归计算出来的概率是非常相似的。(虽然logistic回归最后判断的是是或否,但是它也需要计算一个概率来判断这个结果倒是是还是否。)而且如果有一点数学基础的话,会知道,这两个回归画出来的图也非常像,只是logistic回归画出来的Z型稍微平缓一些。
那么这两个回归到底有什么区别呢?通常来说区别不大。最重要的一个区别在于probit回归适用于呈正态分布的数据,logistic回归适用于呈logistic分布的数据。不过这个区别也蛮微妙的,因为正态分布和logistic分布还蛮像的。所以大概来讲,到底是选择哪个分布更多的还是一种个人喜好。
但是大家都知道啊,logistic分布比probit分布可有名多了。如果说十个从事大数据的人里边有五个人知道logistic回归,那么有三个知道probit回归就不错了。在我们ppv课网站的spss视频教学里边,绝大部分都会讲到logistic回归,但是probit回归就不见得有人讲了。(顺便说一句,我个人最喜欢spss从入门到精通这套课程,刚入门的时候就是听得这套课。强烈推荐大家去听一听)。
那么这是什么原因呢?这绝不是probit不好用的原因。主要原因有两个,第一,logistic回归形式比较多。二分类,有序多分类,无序多分类,这些logistic回归都可以做。这就好像我们ppv课网站提供了spss,sas,r,matlab,hadoop等等视频,你可以从零基础学到精通级别,肯定比较受欢迎哈。第二,则归功于logistic回归的易解释性。Logistic回归提供了一个很重要的参数,OR值,这个值很直接的告诉你处于某个状态比处于另一个状态时因变量发生的概率增加了多少倍。这当然是一个很重要很直观的参数啦。就好像你每学一段时间以后,我们ppv课网站告诉你你的知识积累比之前增加了多少倍多少倍,这个肯定很重要撒。
因此呢,logistic回归就比probit回归应用的广泛了。不过这并不是说logistic回归就比probit回归好。实际上,两种回归拟合的方程几乎一样好。不过,再怎么几乎一样,那也肯定是有所不同的。可惜这种不同用你的肉眼一般是看不出来的,至于怎么看,下边在讲。
好了,现在大概就介绍完probit回归的背景知识了(绝对没有凑字数)。现在我们开始操作。
首先假设一个情景,假设我们ppv课网站打算增加一定的课程,达到收视率增加百分之二十的目的,我们就有了三个变量,课程增加的数目(假设分为3,6,9三个水平),各个增加水平的课程数(比方加3节课,6节课,9节课的都是十个课程),各个水平的课程的收视率增加达到百分之二十的课程数(假设分别是3,5,6)。(这段真的有点绕,最好读两遍保证能看懂哪个变量是表示的什么意思)。
那么我们就有了一个3*3的数据集,选择菜单分析——回归——probit,打开主面板,响应频率里选我们各个水平收视率增加达到百分之二十的课程数(也就是我们做实验的课程里边有多少课程成功达到了收视率增加的目标),观测值汇总里边选择各个增加水平的总课程数,再下边有一个因子,一个协变量。我们的自变量课程增加的水平是三节课一个台阶,所以我们要选到协变量里边去哈。(如果你的自变量是连续型变量,那你就得在因子下边的那个定义范围里边选好范围。)此外协变量下边有一个转换下拉菜单,这个菜单有三种方法,除了“无”以外,还有两种对数转换,你可以试试,你的数据到底怎么转换效果最好。完了以后,在左下边还有一个模型:概率/logit,这个单选框里默认的是概率。也就是默认数据分布是正态的。这个也不用管它。
然后点开选项,勾选频率,信仰置信区间,继续,确定。
然后就可以看结果了。参数值和卡方检验这两个表会告诉你这个模型有没有意义,适不适合用probit回归(如果想和logistic回归作比较,就可以用这里的拟合度检验检测)。此外置信限度这个很大的表会告诉你假如你想要你的课程收视率增加的概率是百分之八十的时候,你的课程要增加多少节课这么个数据。它大概是以百分之五为精度的。那如果我想知道增加百分之八十三,需要加多少节课的话,那么我们就要用参数估计值里的参数进行计算了。
非线性回归
自然界中既然有线性回归,那么理所当然的,也会有非线性回归。不过,人类对于非线性回归的研究远远不如对线性回归的研究来的深刻,广泛。不信你看一看你的spss教科书,线性回归的内容可以洋洋洒洒写一章,非线性回归确占一小节,还往往是比较薄的一节。
线性回归指的是y=a+a1*x1+a2*x2…这种形式的方程,非线性回归包含的方程类型就多得多了。常见的有,幂函数,指数函数,双曲函数,对数函数等等。我们先举个例子。假设想拟合ppv课授课老师的数目和网站受欢迎程度的关系。选择分析——回归——非线性。打开主对话框。因变量选择网站受欢迎程度,模型表达式需要自己编辑。(我就挺怵这个的),首先我们知道,我们肯定不可能看一眼就看出我们的数据是什么样子的模型,我们可以通过图形——图表构建程序里边,画出散点图,通过散点图大致判断我们的模型符合什么样的方程,然后在进一步使用(或者直接使用)参数估计法(前面讲过的),估计出它的表达式。
估计出表达式以后,就可以编辑模型表达式了。编辑好以后看左下角的参数那一栏。你的模型里边的参数是需要首先定义一个初始值的。这个初始值要尽量靠近真实值,如果离真实值太远的话,也会影响到模型的准确度。看到这里,可能你要发脾气了,这是个什么模型?怎么这么麻烦?!!要是我知道模型,知道初始值,那我还需要做分析吗啊?!!唉,我也没办法,非线性回归就是这么个玩意,总之你还是拿起你的笔,根据你的模型代几组数据算一算大概的初始值吧。毕竟为了最后的精度嘛。
输好初始值以后,打开保存对话框,勾选预测值,残差。继续,其他的默认就可以。点确定。
输出的参数估计值会给出参数,套到你的模型里就可以。注意看方差分析表下边的标注,里边会给出决定系数R^2,这个R^2通常比参数估计法里的大,也就是说,非线性回归的精度往往比参数估计法的大,模型拟合的好。(废话,要是非线性回归一点优势也没有,还有谁肯研究啊。)
上边只是简单介绍了一点非线性回归的方法。实际生活中,非线性回归比线性回归远远复杂的多,不是一句两句就能说清楚的,此外,还有一种很普遍的办法是通过数学公式把非线性方程转化成线性方程。这样就能大大降低方程的复杂性。在这里,给大家总结了几个常见的公式。


如何用spss做probit回归和非线性回归?视频

相关评论:
  • 13083192536如何用spss计算毒理中的loec和noec
    邬储伦其实就是做回归,用不同的回归去拟合,看哪个效果好 比如probit就是最常用的

  • 13083192536如何用spss进行数据分析
    邬储伦录入完数据后,你可以先进行基础的数据统计--描述性统计。然后根据你的数据结果再看是否需要相关回归或者其他分析。spss里面的描述统计主要在analyze——descriptive里面,其中有描述统计、频数统计、交叉分析。 描述性统计分析是统计分析的第一步,先选择analyze,你就能看到descriptive,然后鼠标再选Descriptive...

  • 13083192536...在spss中用probit做回归,pearson卡方检验结果怎么解释?
    邬储伦不符合正态分布或者方差不齐的情况下,可以做转换,是不是用对数转换,要根据你的数据特点来判断 转换之后自然是不一样的 我替别人做这类的数据分析蛮多的。

  • 13083192536用spss做probit回归时怎么计算R方?
    邬储伦用Eviews软件做回归比较好,不管是最小二乘和还是你这种Probit回归。

  • 13083192536用spss对数据进行回归分析,但不知选哪一种回归类型,怎么办?请教高手...
    邬储伦回归有很多种,回归研究X对于Y的影响,至于回归方法的选择上,关键在于因变量Y的数据类型,如果Y是离散数据,则统一应该使用logistic回归,但具体logistic回归又分成三种类型。如果因变量Y提连续数据(通常也说Y是正态分布时),则应该使用线性回归(有时也称OLS最小二乘法回归)。还有一种较为特殊而且使用...

  • 13083192536spss软件怎么用?
    邬储伦当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以spss为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:定义变量、数据录入、统计分析和结果保存.下面将从这四个方面来对问卷的处理做详细的介绍.Spss处理:第一步:定义变量大多数情况下...

  • 13083192536在spss中用probit做回归,pearson卡方检验结果中sig.值是越小越好还是...
    邬储伦在spss中用probit做回归,pearson卡方检验结果中sig.值是越小越好还是越大越好  我来答 分享 微信扫一扫 网络繁忙请稍后重试 新浪微博 QQ空间 举报 浏览4 次 可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。 pears 卡方检验 spss probit 回归 搜索资料 本地图片 图片...

  • 13083192536SPSS回归分析中,将0、1变量和连续变量一起做回归,这样可行吗?_百度...
    邬储伦虚拟变量当然可以加入回归模型中 比如说你要研究影响收入的因素,因变量工资肯定是连续的 自变量比如说受教育年限和年龄这些指标肯定也是连续的,但是像性别,婚否,有无子女这些指标就是用0和1来表示的 这种回归是完全可行的 虚拟变量也可以作为自变量,logit和probit两种模型就是把虚拟变量作为自变量的 ...

  • 13083192536SPSS如何计算峰态系数和偏态系数
    邬储伦分析—描述统计—频率,里面就可以选择均值方差和峰态系数和偏态系数。数据管理在10版以后,SPSS的每个新增版本都会对数据管理功能作一些改进,以使用户的使用更为方便。13版中的改进可能主要有以下几个方面:1)超长变量名:在12版中,变量名已经最多可以为64个字符长度,13版中可能还要大大放宽这一限制...

  • 13083192536spss能做比率的差异性t检验吗?
    邬储伦时间序列分析、多重响应等几大类,每类中又分好几个统计过程。比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。

  • 相关主题精彩

    版权声明:本网站为非赢利性站点,内容来自于网络投稿和网络,若有相关事宜,请联系管理员

    Copyright © 喜物网