导航:首页 > 数据处理 > 数据集怎么打乱

数据集怎么打乱

发布时间:2025-03-26 02:44:12

Ⅰ 如何处理不平衡数据(一)——欠采样

一、重采样

1、欠采样

欠采样就是一个随机删除一部分多数类(数量多的类型)数据的过程

# Shuffle the Dataset. 进行一个数据集打乱的操作

shuffled_df = credit_df.sample(frac=1,random_state=4)

# Put all the fraud class in a separate dataset. 欺诈类 就是数量少的类

fraud_df = shuffled_df.loc[shuffled_df['Class'] == 1]

#Randomly select 492 observations from the non-fraud (majority class)   选取过多的类进行一个抽取

non_fraud_df=shuffled_df.loc[shuffled_df['Class']== 0].sample(n=492,random_state=42)

# Concatenate both dataframes again  生成一个均衡类

normalized_df = pd.concat([fraud_df, non_fraud_df]) 

#plot the dataset after the undersampling   下面是画图操作

plt.figure(figsize=(8, 8))

sns.countplot('Class', data=normalized_df)

plt.title('Balanced Classes')

plt.show()

阅读全文

与数据集怎么打乱相关的资料

热点内容
硬盘以什么为单位存储数据 浏览:539
如何在微信里构建销售体系小程序 浏览:471
如何查看深股的交易涨跌情况 浏览:675
如何代理销售机 浏览:838
网店交易税多少 浏览:73
华为watch3怎么打开应用市场 浏览:572
怎么将同样的产品合并计算 浏览:851
怎么可以代理快递 浏览:756
美团如何保护用户信息 浏览:940
为什么我国海产品不多 浏览:492
在农村赶集时如何销售自己的产品 浏览:689
什么技术轻松又好学 浏览:378
怎么代理加盟纸尿裤 浏览:407
中国数字积分交易中心在哪里 浏览:529
收款机如何导数据 浏览:907
代理矿泉水店怎么样 浏览:283
交易折扣包括哪些 浏览:289
考车教练证需要什么程序 浏览:615
靠谱二手手机交易平台有哪些 浏览:721
代理传奇怎么做赚钱 浏览:416