導航:首頁 > 數據處理 > 數據集怎麼打亂

數據集怎麼打亂

發布時間:2025-03-26 02:44:12

Ⅰ 如何處理不平衡數據(一)——欠采樣

一、重采樣

1、欠采樣

欠采樣就是一個隨機刪除一部分多數類(數量多的類型)數據的過程

# Shuffle the Dataset. 進行一個數據集打亂的操作

shuffled_df = credit_df.sample(frac=1,random_state=4)

# Put all the fraud class in a separate dataset. 欺詐類 就是數量少的類

fraud_df = shuffled_df.loc[shuffled_df['Class'] == 1]

#Randomly select 492 observations from the non-fraud (majority class)   選取過多的類進行一個抽取

non_fraud_df=shuffled_df.loc[shuffled_df['Class']== 0].sample(n=492,random_state=42)

# Concatenate both dataframes again  生成一個均衡類

normalized_df = pd.concat([fraud_df, non_fraud_df]) 

#plot the dataset after the undersampling   下面是畫圖操作

plt.figure(figsize=(8, 8))

sns.countplot('Class', data=normalized_df)

plt.title('Balanced Classes')

plt.show()

閱讀全文

與數據集怎麼打亂相關的資料

熱點內容
如何在微信里構建銷售體系小程序 瀏覽:471
如何查看深股的交易漲跌情況 瀏覽:675
如何代理銷售機 瀏覽:838
網店交易稅多少 瀏覽:73
華為watch3怎麼打開應用市場 瀏覽:572
怎麼將同樣的產品合並計算 瀏覽:851
怎麼可以代理快遞 瀏覽:756
美團如何保護用戶信息 瀏覽:940
為什麼我國海產品不多 瀏覽:492
在農村趕集時如何銷售自己的產品 瀏覽:689
什麼技術輕松又好學 瀏覽:378
怎麼代理加盟紙尿褲 瀏覽:407
中國數字積分交易中心在哪裡 瀏覽:529
收款機如何導數據 瀏覽:907
代理礦泉水店怎麼樣 瀏覽:283
交易折扣包括哪些 瀏覽:289
考車教練證需要什麼程序 瀏覽:615
靠譜二手手機交易平台有哪些 瀏覽:721
代理傳奇怎麼做賺錢 瀏覽:416
市場買的年糕怎麼炒出來辣好吃 瀏覽:847