導航:首頁 > 數據處理 > 如何進行數據標准化

如何進行數據標准化

發布時間:2023-09-04 00:33:02

Ⅰ 幾種常用數據標准化方法

評價是現代社會各領域的一項經常性的工作,是科學做出管理決策的重要依據。隨著人們研究領域的不斷擴大,所面臨的評價對象日趨復雜,如果僅依據單一指標對事物進行評價往往不盡合理,必須全面地從整體的角度考慮問題,多指標綜合評價方法應運而生。所謂多指標綜合評價方法,就是把描述評價對象不同方面的多個指標的信息綜合起來,並得到一個綜合指標,由此對評價對象做一個整體上的評判,並進行橫向或縱向比較。

而在 多指標評價體系中,由於各評價指標的性質不同,通常具有不同的量綱和數量級。當各指標間的水平相差很大時,如果直接用原始指標值進行分析,就會突出數值較高的指標在綜合分析中的作用,相對削弱數值水平較低指標的作用。 因此,為了保證結果的可靠性,需要對原始指標數據進行標准化處理。

目前數據標准化方法有多種,歸結起來可以分為直線型方法(如極值法、標准差法)、折線型方法(如三折線法)、曲線型方法(如半正態性分布)。不同的標准化方法,對系統的評價結果會產生不同的影響,然而不幸的是, 在數據標准化方法的選擇上,還沒有通用的法則可以遵循。

數據的標准化(normalization)是將數據按比例縮放,使之落入一個小的特定區間。在某些比較和評價的指標處理中經常會用到,去除數據的單位限制,將其轉化為無量綱的純數值,便於不同單位或量級的指標能夠進行比較和加權。其中最典型的就是數據的歸一化處理,即將數據統一映射到[0,1]區間上,常見的數據歸一化的方法有:min-max標准化(Min-max normalization),log函數轉換,atan函數轉換,z-score標准化(zero-mena normalization,此方法最為常用),模糊量化法。本文只介紹min-max法(規范化方法),z-score法(正規化方法),比例法(名字叫啥不太清楚,歸一化方法)。

也叫離差標准化,是對原始數據的線性變換,使結果落到[0,1]區間,轉換函數如下:

通過以10為底的log函數轉換的方法同樣可以實現歸一下,具體方法看了下網上很多介紹都是 x =log10(x) ,其實是有問題的,這個結果並非一定落到[0,1]區間上, 應該還要除以log10(max) *,max為樣本數據最大值,並且所有的數據都要大於等於1。

用反正切函數也可以實現數據的歸一化,使用這個方法需要注意的是如果想映射的區間為[0,1],則 數據都應該大於等於0,小於0的數據將被映射到[-1,0]區間上。

而並非所有數據標准化的結果都映射到[0,1]區間上,其中最常見的標准化方法就是Z標准化;也是SPSS中最為常用的標准化方法,也叫 標准差標准化

Ⅱ 數據標准化的幾種方法

在某些比較和評價的指標處理中經常會用到,去除數據的單位限制,將其轉化為無量綱的純數值,便於不同單位或量級的指標能夠進行比較和加權。其中最典型的就是數據的歸一化處理,即將數據統一映射到[0,1]區間上,常見的數據歸一化的方法有:min-max標准化(Min-max
normalization)也叫離差標准化,是對原始數據的線性變換,使結果落到[0,1]區間,轉換函數如下:其中max為樣本數據的最大值,min為樣本數據的最小值。log函數轉換通過以10為底的log函數轉換的方法同樣可以實現歸一下,具體方法如下:看了下網上很多介紹都是x*=log10(x),其實是有問題的,這個結果並非一定落到[0,1]區間上,應該還要除以log10(max),max為樣本數據最大值,並且所有的數據都要大於等於1。而並非所有數據標准化的結果都映射到[0,1]區間上,其中最常見的標准化方法就是Z標准化,也是SPSS中最為常用的標准化方法:z-score
標准化(zero-mean
normalization)也叫標准差標准化,經過處理的數據符合標准正態分布,即均值為0,標准差為1,其轉化函數為:其中μ為所有樣本數據的均值,σ為所有樣本數據的標准差。

Ⅲ 數據標准化有幾種方法

方法一:規范化方法

也叫離差標准化,是對原始數據的線性變換,使結果映射到[0,1]區間。

方法二:正規化方法

這種方法基於原始數據的均值(mean)和標准差(standard deviation)進行數據的標准化。將A的原始值x使用z-score標准化到x』。
z-score標准化方法適用於屬性A的最大值和最小值未知的情況,或有超出取值范圍的離群數據的情況。
spss默認的標准化方法就是z-score標准化。
用Excel進行z-score標准化的方法:在Excel中沒有現成的函數,需要自己分步計算,其實標准化的公式很簡單。

步驟如下:
1.求出各變數(指標)的算術平均值(數學期望)xi和標准差si ;
2.進行標准化處理:
zij=(xij-xi)/si
其中:zij為標准化後的變數值;xij為實際變數值。
3.將逆指標前的正負號對調。
標准化後的變數值圍繞0上下波動,大於0說明高於平均水平,小於0說明低於平均水平。

閱讀全文

與如何進行數據標准化相關的資料

熱點內容
農民工報了工傷後程序怎麼走 瀏覽:538
農村工程與信息技術要學哪些專業 瀏覽:132
市場補貨怎麼掃碼 瀏覽:288
新手司機怎麼加強駕駛技術 瀏覽:915
網卡安裝程序哪個盤 瀏覽:297
怎麼關閉金融產品 瀏覽:818
蘭州大學市場營銷專業是哪個學院 瀏覽:346
電子產品怎麼防止員工偷盜 瀏覽:520
游戲廳里游戲幣如何交易 瀏覽:318
到村裡推銷產品如何舉報 瀏覽:274
如何編寫數量折扣程序 瀏覽:283
繽智儀表盤最右邊是哪些信息 瀏覽:646
如何去除手機程序的廣告 瀏覽:358
五一節去哪裡找工作招聘信息 瀏覽:515
中控考勤機如何讀取數據 瀏覽:298
怎麼微信里發布順風車信息 瀏覽:259
深圳石岩人才市場在哪裡 瀏覽:409
淘寶優酷檢測代理怎麼辦 瀏覽:624
如何摳產品圖裡面的字 瀏覽:485
學籍里教師信息怎麼添加 瀏覽:911