數據集怎麼打亂_如何處理不平衡數據（一）——欠采樣

Ⅰ 如何處理不平衡數據（一）——欠采樣

一、重采樣

1、欠采樣

欠采樣就是一個隨機刪除一部分多數類（數量多的類型）數據的過程

# Shuffle the Dataset. 進行一個數據集打亂的操作

shuffled_df = credit_df.sample(frac=1,random_state=4)

# Put all the fraud class in a separate dataset. 欺詐類就是數量少的類

fraud_df = shuffled_df.loc[shuffled_df['Class'] == 1]

#Randomly select 492 observations from the non-fraud (majority class) 選取過多的類進行一個抽取

non_fraud_df=shuffled_df.loc[shuffled_df['Class']== 0].sample(n=492,random_state=42)

# Concatenate both dataframes again 生成一個均衡類

normalized_df = pd.concat([fraud_df, non_fraud_df])

#plot the dataset after the undersampling 下面是畫圖操作

plt.figure(figsize=(8, 8))

sns.countplot('Class', data=normalized_df)

plt.title('Balanced Classes')

plt.show()

熱點內容

如何在微信里構建銷售體系小程序發布：2025-03-26 14:40:44 瀏覽：471

如何查看深股的交易漲跌情況發布：2025-03-26 14:35:02 瀏覽：675

如何代理銷售機發布：2025-03-26 14:34:59 瀏覽：838

網店交易稅多少發布：2025-03-26 14:34:58 瀏覽：73

華為watch3怎麼打開應用市場發布：2025-03-26 14:12:41 瀏覽：572

怎麼將同樣的產品合並計算發布：2025-03-26 14:10:23 瀏覽：851

怎麼可以代理快遞發布：2025-03-26 14:04:40 瀏覽：756

美團如何保護用戶信息發布：2025-03-26 14:01:50 瀏覽：940

為什麼我國海產品不多發布：2025-03-26 13:59:16 瀏覽：492

在農村趕集時如何銷售自己的產品發布：2025-03-26 13:53:22 瀏覽：689

什麼技術輕松又好學發布：2025-03-26 13:52:26 瀏覽：378

怎麼代理加盟紙尿褲發布：2025-03-26 13:52:18 瀏覽：407

中國數字積分交易中心在哪裡發布：2025-03-26 13:40:52 瀏覽：529

收款機如何導數據發布：2025-03-26 13:27:07 瀏覽：907

代理礦泉水店怎麼樣發布：2025-03-26 13:21:09 瀏覽：283

交易折扣包括哪些發布：2025-03-26 13:18:54 瀏覽：289

考車教練證需要什麼程序發布：2025-03-26 12:57:25 瀏覽：615

靠譜二手手機交易平台有哪些發布：2025-03-26 12:41:34 瀏覽：721

代理傳奇怎麼做賺錢發布：2025-03-26 12:37:03 瀏覽：416

市場買的年糕怎麼炒出來辣好吃發布：2025-03-26 12:34:37 瀏覽：847

導航:首頁 > 數據處理 > 數據集怎麼打亂

數據集怎麼打亂

與數據集怎麼打亂相關的資料