导航:首页 > 数据处理 > 数据严重偏大是指多少倍

数据严重偏大是指多少倍

发布时间：2023-08-27 15:36:22

❶ 超大规模数据是指什么级的数据

所谓的“大规模数据集”，其实从不同的角度去审视可能含义都会不同。

比如说，对于一些打着“大数据”的旗号做宣传的公司或者个人来说，但凡数据规模到了一定的量级，他们就可以无视数据质量、数据内容等要素，宣称自己有了大规模数据集。这里的数据量级也不是定死的，可以是千亿百亿级，也可以是百万甚至十万级，全看当事人的解读。

所以我想题主想问的一定不是这种含义的大规模数据集。

如果从机器学习的角度来看，大规模数据集应该指的是能够为模型学习提供足够支撑的数据。高质量的训练数据如果足够多，模型的收敛和过拟合抑制都可以得到相当程度的保证。因此，我认为大规模数据集应该至少有两个维度的要求：一是规模，训练数据的规模应该与模型适配，例如在深度学习的语境下，数据的规模与模型参数的规模有比较强的数量关联（个人建议至少2到10倍于参数量）；二是质量，很难想象一个充满噪声甚至格式千差万别的数据集能够训练出什么好的模型来。因此，数据的提纯和清洗是非常关键的，也是数据挖掘和机器学习方向从业者必须首先具备的素质。

阅读全文

与数据严重偏大是指多少倍相关的资料

热点内容

公司上市总代理商有什么好处发布：2025-04-02 05:43:50 浏览：624

交易猫为什么一直要给钱发布：2025-04-02 04:14:39 浏览：412

uk里灯具产品属于什么赋码发布：2025-04-02 03:50:45 浏览：818

新手做批发去哪个市场拿货比较好发布：2025-04-02 03:39:56 浏览：653

代理提成机制怎么做发布：2025-04-02 02:47:06 浏览：428

车辆电话标牌需要哪些信息发布：2025-04-02 02:34:17 浏览：866

漳州哪里有粉彩交易发布：2025-04-02 01:00:41 浏览：342

如何更改数据线设置发布：2025-04-02 00:33:31 浏览：297

三个分段函数的程序如何编写发布：2025-04-02 00:23:54 浏览：262

族谱信息采集需要哪些信息发布：2025-04-01 23:47:15 浏览：739

太仓有什么旅游产品发布：2025-04-01 23:45:53 浏览：130

发什么信息可以让苹果系统崩溃发布：2025-04-01 23:28:39 浏览：88

网络商城是怎么采购产品发布：2025-04-01 23:27:07 浏览：753

南充软件技术学院怎么样发布：2025-04-01 23:25:32 浏览：549

高电压技术分压比是什么发布：2025-04-01 23:22:31 浏览：423

餐饮代理怎么营销发布：2025-04-01 22:56:49 浏览：366

冷冻复活技术要多少钱发布：2025-04-01 22:15:50 浏览：283

律师不做风险代理是什么原因发布：2025-04-01 22:10:32 浏览：238

苍山毛线市场在什么地方发布：2025-04-01 22:08:30 浏览：470

招标技术措施怎么写发布：2025-04-01 22:03:26 浏览：143