导航:首页 > 数据处理 > 算法的数据规模是什么

算法的数据规模是什么

发布时间:2023-02-09 03:43:45

A. 算法的时间复杂度是什么

算法的时间复杂度,是一个用于度量一个算法的运算时间的一个描述,本质是一个函数。

根据这个函数能在不用具体的测试数据来测试的情况下,粗略地估计算法的执行效率,换句话讲时间复杂度表示的只是代码执行时间随数据规模增长的变化趋势。

常用大O来表述,这个函数描述了算法执行所要时间的增长速度,记作f(n)。算法需要执行的运算次数(用函数表示)记作T(n)。存在常数 c 和函数 f(n),使得当 n >= c 时 T(n) <= f(n),记作 T(n) = O(f(n)),其中,n代表数据规模也就是输入的数据。

时间复杂度如何计算

1、常量阶:只要代码的执行时间不随 n 的增大而增长,这样代码的时间复杂度都记作 O(1)。或者说,一般情况下,只要算法中不存在循环语句、递归语句,即使有成千上万行的代码,其时间复杂度也是Ο(1)。

2、线性阶、n方阶:一般情况下,如果循环体内循环控制变量为线性增长,那么包含该循环的算法的时间复杂度为O(n),线性阶嵌套线性阶的算法时间复杂度为O(nⁿ),涉及下文乘法法则。

3、线性对数阶:当一个线性阶代码段法嵌套一个对数阶代码段,该算法的时间复杂度为O(nlogn)。

4、指数阶和阶乘阶:根据函数,随着n的增加,运行时间会无限急剧增加,因此效率非常低下。

B. 机器学习的算法和普通《算法导论》里的算法有什么本质上的异同

作者:董可人
链接:http://www.hu.com/question/24976006/answer/29682806
来源:知乎
着作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

算法导论里的算法本质上是对有精确解的问题,如何更有效率地求得这个解。这个效率可以是计算时间更短,也可以是计算过程所需要的空间更少。

一个简单的例子是,给定一个乱序数组,如何快速的将其按从小到大的顺序重新排列,或者找到其中的中位数。这些问题都有确定且唯一的答案,一般都会有一个笨方法(穷举或遍历),只要一步一步来就可以解,所谓算法只是如何精简步骤,更快更省事地找到这个解。这些算法处理的数据也都是结构简洁且干净的类型,比如数组,二叉树,图之类的数据结构。数据规模对于这些算法而言,影响的是计算所需的时间和空间,不会因为规模改变而影响算法本身的逻辑以及计算的结果。

机器学习要解决的问题一般没有精确解,也不能用穷举或遍历这种步骤明确的方法找到解,而且需要强调的是“学习”这个属性,即希望算法本身能够根据给定的数据或计算环境的改变而动态的发现新的规律,甚至改变算法程序的逻辑和行为。

举例来说,可以是把一千份文档归类到不同的几个类别里。最简单的可以是给定几个类别,比如新闻,小说,诗歌等,算法来根据文章内容自动划分到对应的类别里。这里可以看出这个问题即使让人做,也有很多模糊不能确定的地方,比如一篇法制晚报上的犯罪纪实是应该划到新闻,还是小说呢?或者说一篇长诗比如荷马史诗是应该归在小说还是诗歌呢?机器学习算法想要解决的,就是根据从文章内容里找到的规律,来自动的给出一个划分。而不同算法可以给出不同的解,这些解都可以是“正确”的,所以一般还需要人为设计一个评判标准来决定孰优孰劣。

也可以不事先给定类别,而是让算法自己去发现文章中的规律,把相似度高的文章划分到一起。这样不同的算法可能给出不同数量的类别划分,可能是三个,四个,或者五个,也都可以是“正确”的划分。甚至什么是“相似度”,不同算法也可以给出不同解释,可以是名词动词形容词的词频及比例,也可以是句子的语法结构等。

更进一步的,你可能还希望这个算法能够用来判断一份新的文档的类别。而输入的新文档越多,也会进一步扩大初始数据集的规模,规模变大以后,原来数据中不明显的规律可能就变明显了。比如说原来一千份文档中只有一篇议论文,可能大多算法都无法把它单独划出一个类别,但当你持续输入一百份议论文后,数据中议论文的比例就变成了101/1100,差不多10%,这时候算法就应该划分出单独的议论文类别。在这个意义上,数据本身也对算法有很大的影响,这也是和算法导论中的算法的一个本质区别。

技术上说,算法导论中的算法关注点在数据结构和计算复杂度,属于离散数学的一个分支,不涉及微积分等高等数学概念。机器学习的算法本身是基于概率,统计和优化(optimization)等理论和技术,从这个角度上说给人感觉更“数学”一点。

在具体的实现细节上,机器学习的算法会大量应用算法导论中的技术来改进计算效率。但需要强调这仅仅是对底层实现来说,在算法本身的逻辑上,二者没有太多联系。换句话说,算法导论中的技术可以帮助你写出更快的程序来运行机器学习算法,但是这对机器学习要解决的问题本身是没有什么帮助的。熟练使用二叉树散列表,准确估算一个图算法的复杂度,都没有任何可能帮助你猜到在女朋友过生日时送什么礼物最好(使用了机器学习算法的淘宝君却很可能知道!)。因此不要把它们看成是搭积木拼构件的关系。

最后,如果以上解释仍然让你费解,那么还有一个更通俗的解释:算法导论是教你如何数数,而机器学习基本上相当于星座算命。一个很机械,一个靠忽悠,差不多就是这样吧。
具体分析见链接:http://www.hu.com/question/24976006

C. 大数据是怎么定义的,大数据包括什么

大数据无疑是近些年来科技领域的一个重要概念,随着越来越多的企业开始逐渐参与到大数据产业链中,大数据自身的定义也在不断得到丰富和发展。
要想定义大数据,可以从以下三个方面来进行定义:
第一:大数据重新定义了数据的价值。大数据既代表了技术,同时也代表了一个产业,更代表了一个发展的趋势。大数据技术指的是围绕数据价值化的一系列相关技术,包括数据的采集、存储、安全、分析、呈现等等;大数据产业指的是以大数据技术为基础的产业生态,大数据的产业生态目前尚未完善,还有较大的发展空间;发展趋势指的是大数据将成为一个重要的创新领域。
第二:大数据为智能化社会奠定了基础。人工智能的发展需要三个基础,分别是数据、算力和算法,所以大数据对于人工智能的发展具有重要的意义。目前在人工智能领域之所以在应用效果上有较为明显的改善,一个重要的原因是目前有了大量的数据支撑,这会全面促进算法的训练过程和验证过程,从而提升算法的应用效果。
第三:大数据促进了社会资源的数据化进程。大数据的发展使得数据产生了更大的价值,这个过程会在很大程度上促进社会资源的数据化进程,而更多的社会资源实现数据化之后,大数据的功能边界也会得到不断的拓展,从而带动一系列基于大数据的创新。
最后,大数据之所以重要,一个重要的原因是大数据开辟了一个新的价值领域,大数据将逐渐成为一种重要的生产材料,甚至可以说大数据将是智能化社会的一种新兴能源。

D. 关于数据结构的问题规模和算法效率的疑问

1 都是n,i是随机的,在n的范围里面,当然和n有关~O(N)不是等于n,是n的一个倍数,是一个复杂度表示,不是确切的数。
2 第一个算法,两层FOR,是0(N^2)复杂度;第二个算法,当然两个操作都是基本操作,复杂度是O(N)。你如果还不理解,建议你还是好好吧大O表示法好好看一次。

E. 信息奥赛 数据规模 什么意思

说白了就是数据的多少呗。
比如在排序中待排序的数据的个数是100还是10000,这就是数据规模的不同,数据规模对于算法是很重要的。

F. 排序算法对数的多少有要求吗

排序算法的时间复杂度通常是以平方数量级来衡量的,即 O(n^2),其中 n 是要排序的数据的个数。对数数量级的排序算法,即 O(log n) 的算法,其时间复杂度随着数据规模的增长而线性增长,因此比起 O(n^2) 算法来说,它们的运行速度要快得多。
不过,并不是所有的排序算法都有这样的时间复杂度要求。例如,冒泡排序和选择排序都是 O(n^2) 的算法,它们在处理大规模数据时可能会变得非常慢,但在处理较小规模的数据时,它们的运行速度可能会比 O(log n) 算法快。因此,在实际应用中,需要根据实际情况来选择合适的排序算法。

G. 谁可以用简单易懂的话给我解释下数据结构里的 问题规模指的是什么还有时间复杂度, 最好举个例子!

问题规模指 解决问题需要的空间。
时间复杂度 是算法执行需要的时间
比如 对 1--n个无序的数 排序。
可以使用 比较排序法,只要一个哨兵的空间 chuck最小元素,时间复杂度是n^2

H. 算法里的输入规模是什么

输入规模决定算法

运算量 n! 2^n n^3 n^2 nlogn n
最大规模 11 26 464 10000 4.5*10^6 1000000000
速度扩大两倍 11 27 587 14142 8.6*10^6 2000000000
这个表给出了机器速度扩大两倍后,算法所能解决的规模的对比。可以看出,n!和2n不仅能解决的问题规模十分小,而且增长缓慢;最快的nlogn和n算法不仅解决问题
的规模大,而且增长快。我们把渐进时间复杂为多项式的算法称为多项式时间算法(polymonial-time algorithm),也称有效算法;而n!或者2^n这样低效算法称为指数时间算法(exponential-time algorithm).
尽管如此,考虑到目前主流机器的执行速度,多数算法竞赛所选取的数据规模基本符合此表。例如,一些指明n<=8的题目,可能n!的算法已经足够,n<=20的题目需要2^n的算法,而n<=300的题目可能就需要用至少n^3的多项式算法.

I. C++编程数据规模的30%的数据是什么意思

就是对于你的程序,如果你测试的时候选择30%的数据,判断输入数据的时候 要加上n,m<=100的判断,
100%类似

阅读全文

与算法的数据规模是什么相关的资料

热点内容
电商黑马技术有多少 浏览:963
三圣花乡花市场搬到哪里去了 浏览:294
口腔医学技术多少人学 浏览:312
权健产品什么时候重新上市 浏览:637
做电商怎么跑市场 浏览:338
双子冠军有哪些产品 浏览:327
沈阳菜市场都在哪个地方 浏览:983
焊接技术员可以赚多少钱 浏览:233
c语言程序表示一年有多少秒 浏览:872
红字发票信息表附在哪里 浏览:664
交易猫腾讯号已发货多久交易成功 浏览:324
中国基因技术如何 浏览:877
化妆品批发代理商需要什么资质 浏览:25
p城的技术怎么样 浏览:109
技术类体操的基础技术是什么 浏览:18
网络登不上了如何查询以前信息 浏览:898
陌陌如何设置拒绝接收信息 浏览:127
阳泉二手车市场哪个好 浏览:354
绿通网络预约通过哪个小程序 浏览:971
物流企业的信息反馈效率如何 浏览:877