㈠ 在統計學中為什麼要對變數取對數
原因是
(1) 時間序列和面板數據, 都要做平穩的單位根檢驗, 取對數一般能使序列平穩(stationary), 不然就取差分進行平穩.
(2) 能使模型的殘差呈現隨機的特性, 而不是趨勢或者截距.
(3) 減少共線性和異方差(heteroscedasticity)出現的概率
(4) 有經濟學意義上, 比如增長率, 變化率和彈性.
(5) 統計學認為變數具有內在的指數增長的趨勢, 取對數可以讓聯合分布 (對應的F-statistics)呈現正態, level形式的數據, 特別是時間序列, 最好做Lavene檢驗
(6) Log-linearization 取對數方便最小二乘的線性擬合, 乘積運算用對數就變成了求和.
㈡ 為什麼回歸分析把解釋變數取對數,有什麼好處
對取對數以後的數據進行線性回歸,其前面的參數表示的就是百分比變化率(dlnx=dx/x),也就是彈性,這是一個很好的性質哦。
進行回歸分析時,是先把數據標准化再取對數還是取對數後再標准化?謝謝。。我來回答
就回歸分析而言,標准化不是必要的,因為標准化是數據的線性變換,不影響估計的顯著性。
計量模型一般不進行標准化,保持變數的原汁原味,方便估計結果的解釋。多元統計里經常要標准化,如主成份分析,因子分析等。
對數變換的主要目的:(1)估計的系數可以解釋成彈性,一般用在經濟學模型里;(2)可以降低樣本異方差程度;(3)減少變數的波動,與其他變數的波動水平相適應。
對數變換要求原始變數為正,如果先標准化可能會出現負值,對數變換就不行了。只能對正取值的變數先取對數,再標准化。
在統計學中為什麼要對變數取對數我來回答
(1)減弱模型中數據的異方差性,只能是減弱,並不能徹底消除
(2)模型形式的需要,利用線性回歸模型的前提是解釋變數和被解釋變數之間的線性關系,但是在實際中這一點很難滿足,很多的時候需要對多個變數或者是單一變數做對數變換,讓模型的形式變為線性
(3)取對數,再配合差分變化,把絕對數變成相對數,這樣,數據更能表示變動的相關性.
(4)對取對數以後的經濟數據進行線性回歸,其前面的參數表示的就是百分比變化率(dlnx=dx/x),也就是彈性
(5)有時候變數不符合正態分布的假定,取了對數可以漸近正態分布
等等。
計量模型中變數是比例形式,取對數還有意義嗎 我來回答
如果數據數值比較龐大,與其他相關的變數很難比較方便地看出關系,可以通過取對數對數值較大的數據進行平滑。宏觀計量經濟分析中較常用。
如果變數關系x和y本身不是線性關系,比如y=x1*x2 就取對數 取完對數好做線性回歸。再比如原來是y=x^2 也取對數 好做線性回歸。不知道對不對,還請大師們指出錯誤和不足吧。總之一句話 如果有足夠的證據表明 y和x的關系比較像y=x1*x2/x3這種或者說比如形式如經濟學裡面的「萬有引力定律」,那麼我們就取對數 為了方便線性回歸。
做回歸分析時,什麼時候要取對數,什麼時候不取對數我來回答
變數不符合正態分布,可以考慮對數
在統計學中為什麼要對變數取對數我來回答
我能想到的有兩點
作用1: 對有些存在異常大的觀測值的變數,取對數可以減小方差
作用2: 對只有取正值才有意義的變數,例如重量,如果直接進行線性回歸,那麼可能產生沒有意義的負的預測值,所以有時會考慮對對數值進行回歸分析而不是原始的觀測值,這樣就不會產生沒有意義的預測值。
在對變數取對數後,變數的變化變成了百分比,為什麼?我來回答
有很多原因啊.(1)減弱模型中數據的異方差性,只能是減弱,並不能徹底消除(2)模型形式的需要,利用線性回歸模型的前提是解釋變數和被解釋變數之間的線性關系,但是在實際中這一點很難滿足,很多的時候需要對多個變數或者是單一變數做對數變換,讓模型的形式變為線性(3)取對數,再配合差分變化,把絕對數變成相對數,這樣,數據更能表示變動的相關性.(4)對取對數以後的經濟數據進行線性回歸,其前面的參數表示的就是百分比變化率(dlnx=dx/x),也就是彈性(5)有時候變數不符合正態分布的假定,取了對數可以漸近正態分布………………
stata什麼時候取對數我來回答
序列分析中,常常還有會序列相關的問題,這樣直接進行參數估計,估計量是無效的,取對數可以有效的改善自相關的問題,
有時候用來降冪,把非線性的變換為線性、
還有就是做宏觀經濟分析,參數過大,取對數,把值變小,提高顯著水平。
取對數是一種常用方法,宏觀經濟分析中做時間序列的主要是出於第一種和第三種問題。可以說是一種萬金油的方法,對自相關、異方等常見問題都有效,但不是絕對的解決
㈢ 為什麼要對原始數據取對數
首先根據原始數據畫出草圖來,看草圖的形狀先大致猜測函數的類型
如果看到圖中曲線上升很快,類似於y=ax^b的函數形式
取對數(適當的底數)lny=lna+blnx
這樣將指數函數化成一次線性函數,更方便畫圖和處理數據
㈣ 在統計學中為什麼要對變數取對數
對數據做一些變換的目的是它能夠讓它符合我們所做的假設,使我們能夠在已有理論上對其分析。
對數變換(log transformation)是特殊的一種數據變換方式,它可以將一類我們理論上未解決的模型問題轉化為已經解決的問題。我將說兩類比較有代表性的模型。
理論上:隨著自變數的增加,因變數的方差也增大的模型。
先給個很經典的例子,如分析美國每月電力生產數。
from:http://www.hu.com/question/22012482
㈤ 在統計學中為什麼要對變數取對數
對數函數在其定義域內是單調增函數,取對數後不會改變數據的相對關系,取對數作用主要有:
1.
縮小數據的絕對數值,方便計算。例如,每個數據項的值都很大,許多這樣的值進行計算可能對超過常用數據類型的取值范圍,這時取對數,就把數值縮小了,例如TF-IDF計算時,由於在大規模語料庫中,很多詞的頻率是非常大的數字。
2.
取對數後,可以將乘法計算轉換稱加法計算。
3.
某些情況下,在數據的整個值域中的在不同區間的差異帶來的影響不同。例如,中文分詞的mmseg演算法,計算語素自由度時候就取了對數,這是因為,如果某兩個字的頻率分別都是500,頻率和為1000,另外兩個字的頻率分別為200和800,如果單純比較頻率和都是相等的,但是取對數後,log500=2.69897,
log200=2.30103,
log800=2.90308
這時候前者為2log500=5.39794,
後者為log200+log800=5.20411,這時前者的和更大,取前者。因為前面兩個詞頻率都是500,可見都比較常見。後面有個詞頻是200,說明不太常見,所以選擇前者。從log函數的圖像可以看到,自變數x的值越小,函數值y的變化越快,還是前面的例子,同樣是相差了300,但log500-log200>log800-log500,因為前面一對的比後面一對更小。對數值小的部分差異的敏感程度比數值大的部分的差異敏感程度更高。
4.
取對數之後不會改變數據的性質和相關關系,但壓縮了變數的尺度,例如800/200=4,
但log800/log200=1.2616,數據更加平穩,也消弱了模型的共線性、異方差性等。
5.
所得到的數據易消除異方差問題。
6.
在經濟學中,常取自然對數再做回歸,這時回歸方程為
lnY=a
lnX+b
,兩邊同時對X求導,1/Y*(DY/DX)=a*1/X,
b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X)
這正好是彈性的定義。
當然,如果數據集中有負數當然就不能取對數了。實踐中,取對數的一般是水平量,而不是比例數據,例如變化率等。
㈥ 在統計學中為什麼要對變數取對數
目的在於使數據的呈現方式接近我們所希望的前提假設,從而更好的進行統計推斷。
統計學是通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計學用到了大量的數學及其它學科的專業知識,其應用范圍幾乎覆蓋了社會科學和自然科學的各個領域。
任何統計方法是有效的只有當這個系統或是所討論的母體滿足方法論的基本假設。誤用統計學可能會導致描述面或是推論面嚴重的錯誤,這個錯誤可能會影響社會政策,醫療實踐以及橋梁或是核能發電計劃結構的可靠性。
計算技術和一系列新技術、新方法在統計領域不斷得到開發和應用。近幾十年間,計算機技術不斷發展,使統計數據的搜集、處理、分析、存貯、傳遞、印製等過程日益現代化,提高了統計工作的效能。
計算機技術的發展,日益擴大了傳統的和先進的統計技術的應用領域,促使統計科學和統計工作發生了革命性的變化。
如今,計算機科學已經成為統計科學不可分割組成部分。隨著科學技術的發展,統計理論和實踐深度和廣度方面也不斷發展。
㈦ 論文中相對數指標變數為什麼要取對數
論文中相對數指標變數要取對數的原因:平時在一些數據處理中,經常會把原始數據取對數後進一步處理。之所以這樣做是基於對數函數在其定義域內是單調增函數,取對數後不會改變數據的相對關系。
縮小數據的絕對數值,方便計算。例如,每個數據項的值都很大,許多這樣的值進行計算可能對超過常用數據類型的取值范圍,這時取對數,就把數值縮小了,例如TF-IDF計算時,由於在大規模語料庫中,很多詞的頻率是非常大的數字。
適用性
是乘積形式、商的形式、根式、冪的形式、指數形式或冪指函數形式的情況,求導時比較適用對數求導法,這是因為:取對數可將乘法運算或除法運算降格為加法或減法運算,取對數的運算可將根式、冪函數、指數函數及冪指函數運算降格成為乘除運算。
㈧ 在統計學中為什麼要對變數取對數
有很多原因啊.
(1)減弱模型中數據的異方差性,只能是減弱,並不能徹底消除
(2)模型形式的需要,利用線性回歸模型的前提是解釋變數和被解釋變數之間的線性關系,但是在實際中這一點很難滿足,很多的時候需要對多個變數或者是單一變數做對數變換,讓模型的形式變為線性
(3)取對數,再配合差分變化,把絕對數變成相對數,這樣,數據更能表示變動的相關性.
(4)對取對數以後的經濟數據進行線性回歸,其前面的參數表示的就是百分比變化率(dlnx=dx/x),也就是彈性
(5)有時候變數不符合正態分布的假定,取了對數可以漸近正態分布………………
㈨ 在統計學中為什麼要對變數取對數
對數變換是數據變換的一種常用方式,數據變換的目的在於使數據的呈現方式接近我們所希望的前提假設,從而更好的進行統計推斷。但需要注意的是,數據是離散變數時進行對數變換要額外小心!
(Why)為什麼需要做數據變換?
從直觀上講,是為了更便捷的發現數據之間的關系(可以理解為更好的數據可視化)。舉個栗子,下圖的左圖是各國人均GDP和城市人口數量的關系,可以發現人均GDP是嚴重左偏的,並且可以預知在回歸方程中存在明顯的異方差性,但如果對GDP進行對數變換後,可以發現較明顯的線性關系。為什麼呢?因為我們度量相關性時使用的Pearson相關系數檢驗的是變數間的線性關系,只有兩變數服從不相關的二元正態分布時,Pearson相關系數才會服從標準的t-分布,但如果變數間的關系是非線性的,則兩個不獨立的變數之間的Pearson相關系數也可以為0.
所以,數據變換後可以更便捷的進行統計推斷(t檢驗、ANOVA或者線性回歸分析)。例如通常構造估計量的置信區間時是使用樣本均值加減兩倍標准差的方式,而這就要求樣本均值的分布是漸近正態分布,如果數據呈現出明顯的偏度,則此時使用上述統計推斷方式就是不適用的;另外,最經典的例子就是回歸分析中的異方差性,誤差項的方差隨著自變數的變化而變化,如果直接進行回歸估計殘差的方差會隨著自變數的變化而變化,如果對變數進行適當變換,此時殘差服從同一個正態分布。