㈠ 在统计学中为什么要对变量取对数
原因是
(1) 时间序列和面板数据, 都要做平稳的单位根检验, 取对数一般能使序列平稳(stationary), 不然就取差分进行平稳.
(2) 能使模型的残差呈现随机的特性, 而不是趋势或者截距.
(3) 减少共线性和异方差(heteroscedasticity)出现的概率
(4) 有经济学意义上, 比如增长率, 变化率和弹性.
(5) 统计学认为变量具有内在的指数增长的趋势, 取对数可以让联合分布 (对应的F-statistics)呈现正态, level形式的数据, 特别是时间序列, 最好做Lavene检验
(6) Log-linearization 取对数方便最小二乘的线性拟合, 乘积运算用对数就变成了求和.
㈡ 为什么回归分析把解释变量取对数,有什么好处
对取对数以后的数据进行线性回归,其前面的参数表示的就是百分比变化率(dlnx=dx/x),也就是弹性,这是一个很好的性质哦。
进行回归分析时,是先把数据标准化再取对数还是取对数后再标准化?谢谢。。我来回答
就回归分析而言,标准化不是必要的,因为标准化是数据的线性变换,不影响估计的显着性。
计量模型一般不进行标准化,保持变量的原汁原味,方便估计结果的解释。多元统计里经常要标准化,如主成份分析,因子分析等。
对数变换的主要目的:(1)估计的系数可以解释成弹性,一般用在经济学模型里;(2)可以降低样本异方差程度;(3)减少变量的波动,与其他变量的波动水平相适应。
对数变换要求原始变量为正,如果先标准化可能会出现负值,对数变换就不行了。只能对正取值的变量先取对数,再标准化。
在统计学中为什么要对变量取对数我来回答
(1)减弱模型中数据的异方差性,只能是减弱,并不能彻底消除
(2)模型形式的需要,利用线性回归模型的前提是解释变量和被解释变量之间的线性关系,但是在实际中这一点很难满足,很多的时候需要对多个变量或者是单一变量做对数变换,让模型的形式变为线性
(3)取对数,再配合差分变化,把绝对数变成相对数,这样,数据更能表示变动的相关性.
(4)对取对数以后的经济数据进行线性回归,其前面的参数表示的就是百分比变化率(dlnx=dx/x),也就是弹性
(5)有时候变量不符合正态分布的假定,取了对数可以渐近正态分布
等等。
计量模型中变量是比例形式,取对数还有意义吗 我来回答
如果数据数值比较庞大,与其他相关的变量很难比较方便地看出关系,可以通过取对数对数值较大的数据进行平滑。宏观计量经济分析中较常用。
如果变量关系x和y本身不是线性关系,比如y=x1*x2 就取对数 取完对数好做线性回归。再比如原来是y=x^2 也取对数 好做线性回归。不知道对不对,还请大师们指出错误和不足吧。总之一句话 如果有足够的证据表明 y和x的关系比较像y=x1*x2/x3这种或者说比如形式如经济学里面的“万有引力定律”,那么我们就取对数 为了方便线性回归。
做回归分析时,什么时候要取对数,什么时候不取对数我来回答
变量不符合正态分布,可以考虑对数
在统计学中为什么要对变量取对数我来回答
我能想到的有两点
作用1: 对有些存在异常大的观测值的变量,取对数可以减小方差
作用2: 对只有取正值才有意义的变量,例如重量,如果直接进行线性回归,那么可能产生没有意义的负的预测值,所以有时会考虑对对数值进行回归分析而不是原始的观测值,这样就不会产生没有意义的预测值。
在对变量取对数后,变量的变化变成了百分比,为什么?我来回答
有很多原因啊.(1)减弱模型中数据的异方差性,只能是减弱,并不能彻底消除(2)模型形式的需要,利用线性回归模型的前提是解释变量和被解释变量之间的线性关系,但是在实际中这一点很难满足,很多的时候需要对多个变量或者是单一变量做对数变换,让模型的形式变为线性(3)取对数,再配合差分变化,把绝对数变成相对数,这样,数据更能表示变动的相关性.(4)对取对数以后的经济数据进行线性回归,其前面的参数表示的就是百分比变化率(dlnx=dx/x),也就是弹性(5)有时候变量不符合正态分布的假定,取了对数可以渐近正态分布………………
stata什么时候取对数我来回答
序列分析中,常常还有会序列相关的问题,这样直接进行参数估计,估计量是无效的,取对数可以有效的改善自相关的问题,
有时候用来降幂,把非线性的变换为线性、
还有就是做宏观经济分析,参数过大,取对数,把值变小,提高显着水平。
取对数是一种常用方法,宏观经济分析中做时间序列的主要是出于第一种和第三种问题。可以说是一种万金油的方法,对自相关、异方等常见问题都有效,但不是绝对的解决
㈢ 为什么要对原始数据取对数
首先根据原始数据画出草图来,看草图的形状先大致猜测函数的类型
如果看到图中曲线上升很快,类似于y=ax^b的函数形式
取对数(适当的底数)lny=lna+blnx
这样将指数函数化成一次线性函数,更方便画图和处理数据
㈣ 在统计学中为什么要对变量取对数
对数据做一些变换的目的是它能够让它符合我们所做的假设,使我们能够在已有理论上对其分析。
对数变换(log transformation)是特殊的一种数据变换方式,它可以将一类我们理论上未解决的模型问题转化为已经解决的问题。我将说两类比较有代表性的模型。
理论上:随着自变量的增加,因变量的方差也增大的模型。
先给个很经典的例子,如分析美国每月电力生产数。
from:http://www.hu.com/question/22012482
㈤ 在统计学中为什么要对变量取对数
对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:
1.
缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。
2.
取对数后,可以将乘法计算转换称加法计算。
3.
某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。例如,中文分词的mmseg算法,计算语素自由度时候就取了对数,这是因为,如果某两个字的频率分别都是500,频率和为1000,另外两个字的频率分别为200和800,如果单纯比较频率和都是相等的,但是取对数后,log500=2.69897,
log200=2.30103,
log800=2.90308
这时候前者为2log500=5.39794,
后者为log200+log800=5.20411,这时前者的和更大,取前者。因为前面两个词频率都是500,可见都比较常见。后面有个词频是200,说明不太常见,所以选择前者。从log函数的图像可以看到,自变量x的值越小,函数值y的变化越快,还是前面的例子,同样是相差了300,但log500-log200>log800-log500,因为前面一对的比后面一对更小。对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。
4.
取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度,例如800/200=4,
但log800/log200=1.2616,数据更加平稳,也消弱了模型的共线性、异方差性等。
5.
所得到的数据易消除异方差问题。
6.
在经济学中,常取自然对数再做回归,这时回归方程为
lnY=a
lnX+b
,两边同时对X求导,1/Y*(DY/DX)=a*1/X,
b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X)
这正好是弹性的定义。
当然,如果数据集中有负数当然就不能取对数了。实践中,取对数的一般是水平量,而不是比例数据,例如变化率等。
㈥ 在统计学中为什么要对变量取对数
目的在于使数据的呈现方式接近我们所希望的前提假设,从而更好的进行统计推断。
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。
任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。
计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。近几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。
计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。
如今,计算机科学已经成为统计科学不可分割组成部分。随着科学技术的发展,统计理论和实践深度和广度方面也不断发展。
㈦ 论文中相对数指标变量为什么要取对数
论文中相对数指标变量要取对数的原因:平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系。
缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。
适用性
是乘积形式、商的形式、根式、幂的形式、指数形式或幂指函数形式的情况,求导时比较适用对数求导法,这是因为:取对数可将乘法运算或除法运算降格为加法或减法运算,取对数的运算可将根式、幂函数、指数函数及幂指函数运算降格成为乘除运算。
㈧ 在统计学中为什么要对变量取对数
有很多原因啊.
(1)减弱模型中数据的异方差性,只能是减弱,并不能彻底消除
(2)模型形式的需要,利用线性回归模型的前提是解释变量和被解释变量之间的线性关系,但是在实际中这一点很难满足,很多的时候需要对多个变量或者是单一变量做对数变换,让模型的形式变为线性
(3)取对数,再配合差分变化,把绝对数变成相对数,这样,数据更能表示变动的相关性.
(4)对取对数以后的经济数据进行线性回归,其前面的参数表示的就是百分比变化率(dlnx=dx/x),也就是弹性
(5)有时候变量不符合正态分布的假定,取了对数可以渐近正态分布………………
㈨ 在统计学中为什么要对变量取对数
对数变换是数据变换的一种常用方式,数据变换的目的在于使数据的呈现方式接近我们所希望的前提假设,从而更好的进行统计推断。但需要注意的是,数据是离散变量时进行对数变换要额外小心!
(Why)为什么需要做数据变换?
从直观上讲,是为了更便捷的发现数据之间的关系(可以理解为更好的数据可视化)。举个栗子,下图的左图是各国人均GDP和城市人口数量的关系,可以发现人均GDP是严重左偏的,并且可以预知在回归方程中存在明显的异方差性,但如果对GDP进行对数变换后,可以发现较明显的线性关系。为什么呢?因为我们度量相关性时使用的Pearson相关系数检验的是变量间的线性关系,只有两变量服从不相关的二元正态分布时,Pearson相关系数才会服从标准的t-分布,但如果变量间的关系是非线性的,则两个不独立的变量之间的Pearson相关系数也可以为0.
所以,数据变换后可以更便捷的进行统计推断(t检验、ANOVA或者线性回归分析)。例如通常构造估计量的置信区间时是使用样本均值加减两倍标准差的方式,而这就要求样本均值的分布是渐近正态分布,如果数据呈现出明显的偏度,则此时使用上述统计推断方式就是不适用的;另外,最经典的例子就是回归分析中的异方差性,误差项的方差随着自变量的变化而变化,如果直接进行回归估计残差的方差会随着自变量的变化而变化,如果对变量进行适当变换,此时残差服从同一个正态分布。