导航:首页 > 数据处理 > 旷视数据标注干什么

旷视数据标注干什么

发布时间:2022-11-15 08:39:56

‘壹’ 旷视科技人脸识别门禁系统一般在哪些场所运用比较多

1、景区检票

使用景区人脸识别门禁检票系统,景区进出口免去了繁琐的人工检票,极大地提升检票效率,有效缓解游客排队拥堵的情况发生,同时有效杜绝了假票和一票多用的情况,保障景区的经济利益不受侵害。

2、小区安防

小区采用社区人脸识别门禁安防系统的授权方式,居民无需携带钥匙和门禁卡,刷脸即可实现快速通行,同时也防止了闲杂人等进入小区,更加便捷和安全。

3、公司考勤

在企业的日常考勤管理中,企业人脸识别门禁考勤系统由于采用人脸检测识别的认证方式,能够有效防止漏打卡和代打卡的情况发生,还可以对来访人员进行登记管理,进一步提升企业在人员管理方面的水平。

随着光学、物联网、人工智能和电子信息技术的发展,人脸识别门禁系统的应用范围将不断扩大,系统也将更加完善和智能,更好地融入到我们的日常生活当中。深圳市捷易科技有限公司作为人脸识别行业的领军品牌,将始终坚持研发创新,在人脸识别门禁系统的精确度、响应速度和活体识别方面不断寻求突破,为市场客户提供更好的人脸识别门禁系统解决方案。

‘贰’ 帮百度AI干脏活累活的公司,都死了

文 | 李夜

在接触数据采标行业过程中,黑智听到一个陆奇和河南标注工厂的故事。

据悉,大部分河南标注工厂用的是网络的标注工具,干的是网络的活。陆奇掌旗网络时,放出了大量采标需求。当时,活不难(准确率只有90%),标注的利润空间可以达到60%—70%。有些企业盲目扩张,一下子招了几百人;陆奇离开后,网络需求恰也减少。2018年下半年,准确率又普遍提高至95%-96%,活难干了。这些工厂只会网络的标注工具,很难接别家的业务,因此死了一批。没有死的工厂不得不裁员,目前处于艰难转型中。

当河南标注工厂艰难转型时,张三的标注公司却正式营业。公司初建,百事繁杂,前几天,黑智才在中午空闲时间,联系上他。他告诉黑智,两个年前的单子需要返工,一直在忙。对于初建公司,忙比闲好。如果有一天空闲下来,张三说他晚上都会睡不着觉,“一天没活干,几千块钱就打水漂了。一个月得支出15万(注:目前,公司有65名员工)。”

在他看来,标注行业是一个苦行业,“前半年,一定会赔钱的,你要做好一个人赔一万块钱的准备。”他笑着告诉黑智,“如果你和谁有仇,就劝他干标注吧。”这是标注圈有名的段子。标注圈说大不大,说小也不小,分了四个梯队。张三说,他的公司属于第三梯队。第一梯队,比如网络众测、京东众智等。第二梯队,比如龙猫数据、Testin云测、倍赛 BasicFinder、数据堂等。他将第二梯队和第三梯队的关系,比做小房地产开放商和搬砖工人。第三梯队之下,是数量巨大的小作坊,团队规模在3-5人之间。

标注行业又是一个有前景的新生行业。

新生意味着不确定与无限可能,“干标注就像将水倒进一个水桶里,每拉一个框就是添一碗水。目前,谁也不知道还能添多久,只有水溢出来时,才知道。”这并不妨碍张三设计未来,“第一步,现阶段先服务好第二梯队,以后搞一个平台,把公司做成第二梯队。”

300亿市场与转折点

数据采集、标注市场有多大?300亿元。

1984年前后,这个市场就出现了。欣博友的公司是众多公司中的一家。当时,这些公司更像一个“录入公司”——将纸质内容电子化,而不是标注公司。“录入”是一个劳动密集型的工作,一家公司需要雇佣很多人来做这件事。智联招聘显示,欣博友在公司人数项上,勾选的是“1000—9999”。

和欣博友不同,海天瑞声成立于1998年,做的是语音标注,自建了很多语音库,业内人士告诉i黑马&黑智,重复销售以前做的语音库是海天瑞声比较大一块业务。数据堂成立于2011年,通常外界对其最深印象是“它是国内最大的数据交易平台”。这和其起家业务相关。

2015年前后,随着以榜单中的人工智能公司TOP50的强势崛起,数据标注和采集需求逐渐多了起来。这个市场才真正意义上形成,也即前面提到的四个梯队。他们作为乙方,进入到这个日益扩大的市场,为估值超10亿美金的AI独角兽服务,教能够改变世界的人工智能产品学习。

1.得数据者得AI的天下

数据是AI公司的必需品。就像人每天需要一日三餐,而AI模型也每天需要数据的喂养。数据和AI模型的关系,倍赛 BasicFinder创始人兼CEO杜霖理解深刻。高中期间,他开始研究计算机视觉,高三发表了论文。大学期间,他也一直在做相关的研究。他知道数据对于AI模型的重要性,并得出“AI建模没有门槛,数据才是门槛”的结论。

在他看来,现阶段的人工智能是简单的认知智能。“认知智能就是帮你去识别、分类这个世界。分类器的构造是个数学问题,就是由数据堆起来的。”“深度学习本质上是个数学问题,是由大量的样本空间数据反向构造分类器的系数空间的过程。你要有很多样本,什么叫样本?知道正确答案的才叫样本。这跟我们小时候求多样式、求系数式是一个道理。我们要有很多空间中的已知点,才能拟合成一个多样式。同理,深度学习也是这个模式,也需要大量样本,也即标定好的数据。”

于是,杜霖认准了“在现阶段工业界的AI应用研发,标数据是一定跳不过去的,可能10年之内都要依赖于标数据。”数据对于AI的重要性如斯,但数据的标注和采集公司并没有学界、业界、资本甚至是媒体的认可,光环一开始便属于那些做模型研发的AI公司,比如商汤 科技 、旷视 科技 等。

“一个公司做成了很好的人工智能产品,大家都会说人工智能算法牛或者科学家牛,但从没见人说数据收集得好的。”Testin云测VP贾宇航说。贾宇航告诉i黑马&黑智,不但镁光灯照不到,数据采标还是个“苦活”。苦到没有人想去做。它很像移动互联网,产品好,没人想到军功章有APP测试者一份。一旦出了问题,第一个被责备的一定是做测试的部门。

2.300亿元数据采标市场

数据对于AI公司的重要性不言而喻。据悉,AI公司投入10%—15%的经费用于数据采标。也有人提到,这一比例为20%—30%。2018年,中国AI公司的总融资规模达到千亿元以上,数据采标的市场约为100亿元—300亿元。其中,有三分之一是AI公司内部的标注部门之间消化的,有一些会被商务流程外包公司瓜分,剩下的25%—33%流向专门做数据采标的第三方公司。目前,AI融资规模约以每年25%的速度在增长。

随着AI技术门槛的降低,越来越多的公司开源了自己的框架,把数据喂进去就能出来一个模型。越来越多的头部垂直公司开始建立AI部门,之前它们多会把业务交给做AI模型的公司来做,这两年,龙猫数据、Testin云测、倍赛 BasicFinder的很多客户不是来自AI行业的客户,而是传统公司的AI业务部门。龙猫数据创始人兼CEO昝智认为从这个角度来看,市场规模并不好算,BAT、小米、京东、TMD等互联网公司和传统行业里的传统企业,它们会拿出多少预算做AI,不得而知。唯一可以肯定的是,这两三年,数据采标的市场规模越来越大。

这两三年,AI模型对数据采标的复杂度和精细度要求也越来越高了。比如说,现在,做一个人脸拉框,人脸的拉框精度要求在五像素以内或者三像素以内;又或是,整批数据精确度需在97%或者99%以上。贾宇航认为,精度的提高是AI行业发展的必然结果。对于AI行业,有一句话叫 Garbage in, Garbage out,低精度的标注数据对于算法没有任何意义。只有能持续输出高精度采标数据,才是一个能持续保持竞争优势的服务商。

第二,更庞大、更多样的数据规模。庞大在于数据量会更大,以传感器为例,随着传感器成本下降,并被大量应用,将有更多大量的数据需要被标记;更多样指的是更丰富的数据维度,在今年的CES展上,松下推出的智能家居解决方案,不仅仅通过电视上的摄像头观测人脸的疲劳度,还通过椅子上的电容传感器,去检测人的心跳。而之前,疲劳检测只是通过摄像头捕捉人脸。将来,更多维度的数据将被收集,不单单是2D的图象、声音,3D的激光雷达以及心跳数据等也将被纳入到采标的范围内。

3.转折点

需求侧的变化,不可避免地在供给侧引起不小的地震。供给侧开始从密集劳动型行业向新产业、新模式——工具+众包转型。洗牌开始了,数据采标迎来了下半场。

受负面影响最大的第四梯队。无论是采标的复杂还是要求愈高的精度,对于它们来说都不是好消息。去年中旬以来,每天十几、二十几家小作坊要求挂靠在倍赛 BasicFinder旗下,这说明小作坊已经失去业务的来源。“他们靠低质量数据和低价抢市场的模式,已经不能持续了。因为AI工程师不能接受低质量的数据,也不能接受不靠谱的交期。”杜霖说。

张三认为,第四梯队坏了规矩。他们先靠低价四处抢单子,而后内测什么样的项目能够在单位时间内产出最多,再去做这个项目。其它项目,则被分包给更小的团队去做。质量难以保证。“他们不算房租、管理等,只核算人工费用。他们的逻辑是一个人一天50块钱,高于这个价就是赚的。于是他们就报100元的单价。而第三梯队需要承担房租,税收、管理费用以及每天的喝水吃饭等乱七八糟的消耗,至少报200元的单价,才可以做。”

早期,第四梯队靠着这种方式,赚了一些钱,回收了硬件成本,并有结余。但2018年初,第二梯队开始做店测,“看看你有多少人,看看你的场地。你不专业,行业正在慢慢把你淘汰掉。”淘汰,意味着没有业务来源,那么多人需要吃饭、拿工资,不专业的第四梯队危机便出现了。即便能够找到项目,采标项目的要求提高,比如准确度要达到95%甚至是99%以上,小作坊必须从团队中抽出一部分人脱产质检和最后的抽检,成本也会上升。

压力,对于行业中的每一个参与者都是同样的。对于龙猫数据、Testin云测、倍赛 BasicFinder等第二梯队公司来说,他们需要创业迭代,他们需要想清楚在这个过程中如何突破自我,不断创新,走出自己的舒适区。他们找到了一个抓手起步,需要思考的是未来怎么才能取得全胜。业界认为,第四梯队危机的出现,有利于实力强大的第二梯队靠着服务质量与效率抢占退出的小作坊留下的市场空白。

新阶段与新竞争

数据标注和采集是一个技术活。

需求来到,采标公司做两个方面的工作,一,调配和研发模块,二,进行试标,并尝试总结规则,并培训。做完了这两方面的工作,公司会向需求方报价,报价过程中,采标公司回去准备相关应标材料或者应答材料。

中标之后,采标公司开始传输数据,上传到平台上,并开始配置生产和标注业务。据悉,数据标注业务的配置是一个复杂的数学模型。比如,有些任务需要串并联的工作流,并联的工作流是多人协同的工作。串联的工作流是后一个结果是基于前一个结果进行处理的,串并联的工作流需要平台来实现业务工作流的配置。比如一些NLP型的文本标注作业,需要多个人来标,最后N选一或者投票。串并联配置涉及到底层数据流的分发等。

标注过程中,质量的协同管理和绩效的统计非常关键。平台需及时统计到每个人的准确率、稳定性以及效率。标注完了之后,客户验收前,采标公司还需要抽检。最后,公司按照与客户约定的格式进行交付,这又涉及到格式转化的问题。

以上过程包含了整个标注系统所有的技术核心点。标注和采集服务并不是堆人就能够干出来的。对于依靠人力的第三、第四梯队来说,贾宇航认为,如果它们想转型众包+工具的新生产方式,“局限性比较大”。理由有二:

一,数据行业的领头者会通过这3年的持续服务,在客户圈赢得口碑,品牌效应会给其带来一定的商业积累。一些更在意质量、更在意投入产出比的公司会逐渐向领头者们倾斜。二,技术优势。头部标记公司有资金去优化自己的工具和应对客户的定制化需求,并通过管理经验优化对应的服务体系和流程。而对于小团队想要快速建立已有工具和流程化体系去覆盖一个或多个行业是有局限性的。有两条路可供它们选择,第一,精简团队,专营一个或几个AI公司的业务,做一个小而美的生意;第二,与精英合作,使用精英提供的工具,做平台分配过来的任务。

对于尚未入场的后来者来说,如果后来者一开始便立志做一个众包+工具的平台,除了克服商务壁垒外,在众包方面,众包平台需要强运营能力,需要足够多的人在平台上。平台方需要考虑如何拉新,如何保留日活、月活等。在工具方面,只有一个可采标的APP也是不够的,没有便捷的沟通方式减少误差的传递,也是很难做成的。这就像木桶理论一样,缺一块板都装不了水。换言之,留给新进入者的窗口期逐渐关闭。

业内人士认为,采标市场将进入战国争霸期。实力强大的第二梯队之间不可避免地面临着一场混战。数据采标市场开始趋于统一。第一梯队注定不会成为争霸期的主角。因为行业竞争等方面的考量,采标需求方不会将数据交给网络、京东的众包平台来做。做人力资源外包的上市公司会在下半场拿到一定比例的市场份额,会对五家标采公司造成一定的威胁,但该威胁不大。

下半场,第二梯队将如何竞争?通过与第二梯队中的三家公司深入交流,黑智发现它们对未来和竞争理解各异,布局也不尽相同。这些差异在它们诞生的那一刻起,便被注定。

1.做轻还是做重?

在回答“做轻还是做重”这个问题上,龙猫数据、Testin云测、倍赛 BasicFinder给出了不同的答案。Testin云测、倍赛 BasicFinder都建有自己的标注团队,而龙猫数据则坚持用众包的形式来做标注。

不同选择的背后,是各家不同的基因。Testin云测成立于2011年,以App兼容性测试作为切入点,进入企业服务,后衍生出功能测试、自动化测试、安全测试、性能测试等服务,成为一站式测试平台。2017年,Testin云测积累了大量客户。一些AI公司找到云测,希望通过云测的众测平台做数据采集。这是Testin云测采标业务的起点。

Testin云测的采标业务做得很重,比如除了众包采集外,它还会做定制化场景采集,甚至和横店影视基地合作,利用横店群演资源,搭建专属场景,完成客户的定制化场景采集。在标注方面,Testin云测又自建标注基地,与房山市政府合作用于数据标注。贾宇航表示,Testin云测所做的一切都是为了客户需求,“通过工具研发驱动保障标注的效率、精度,以及安全性。并通过项目管理、风控管理等方式,确保标注精度达到客户标准,以满足客户对于准确度的要求。”

从倍赛BasicFinder的产品基因上来看,倍赛的工具偏向于团队模式的管理工具,而不是众包模式。2018年12月,倍赛并购了欣博友,前面提到欣博友是一家运营了30年的北京数据处理公司。该公司提需求,倍赛做技术支持。“我们迭代了很多次,每个工具、快捷键、每个设置的优化,都是我们在数据生产中磨合起来的。倍赛接业务比别的公司都晚,2016年基本没接业务,2017年才开始接。我们的工具做得很扎实。”

除了欣博友,倍赛BasicFinder一直在积极拓展产能,杜霖说,目前,倍赛BasicFinder又拓展了将近3000多个人的子工厂。“通过拓展自有产能,实现最专业的服务。”2018年9月,倍赛BasicFinder收购丁火智能100%股权。丁火智能旗下“荟萃APP”已积累数十万活跃众包用户。“我们搭建了一套自主采集系统,再搭配荟萃APP实现数据采集,完成更多样性的任务。”

和Testin云测、倍赛BasicFinder不同,龙猫数据没有自己的标注团队,工具偏向众包模式。昝智和联创,出身于互联网公司,他们更希望用互联网平台化的方式去做采标,而不是“做一个纯的数据工厂”。昝智既往经验告诉他,应该让系统做这些复杂的数据处理,而不是靠人对人的管理。因为人对人的管理非常低效。

据昝智介绍,龙猫数据是较早使用众包模式做数据采标的,“我们用众包把事情做成了,很多跟进者也开始用众包去做。”昝智认为,龙猫数据打造出了“倚天剑”。他不觉得学龙猫数据的人能够做好众包,“早进入这个行业的玩家,有一把宝刀,他们用这把宝刀获得了利益,然后看到别人拿了倚天剑获得了更大利益,为了造倚天剑,他不可能把宝刀丢了。刀丢了,他们可能啥都没了。但不丢刀,他们又很难造出倚天剑。因为人的精力是有限的,思维是局限的,他们不可能一边把精力放在宝刀上,又一边造倚天剑,而且造倚天剑还比我们造得好,这不科学。”

昝智认为,龙猫数据没有宝刀,“接到客户需求,我们只能优化系统,才能保证准确产出数据。对于他们来说,接到客户需求,他们还有退一步的路可以走,那就当场监督大家认真去干。他们是有退路的,我们也没有退路,我们必须把它搞定。有退路的时候,人一急了,就容易选退路了。”据了解,目前,龙猫众包平台有400多万用户,其中只有一千多是做标注的。龙猫数据的标注业务主要由一千多个渠道商团队承担。

2.建模还是不建模?

贾宇航提到数据标注的产业链可分为三个部分:人员、工具以及算法。而Testin云测坚持做好人员+工具,不做算法。“数据具有可复制性这一特点,如果采集标注公司会算法,这有点像一个算法公司找另一个算法公司做标注,这一份数据到底是否用于乙方的提升,这中间存在一定的争议。”“我们是在数据领域服务的企业,而不是卖算法的公司。我们只负责完成企业的数据采标需求就可以了,完成了交付,我们将彻底清除客户数据。”

杜霖或许不会同意贾宇航的观点,因为倍赛 BasicFinder正在打造一款傻瓜式建模系统——用户只需要输入数据,便可以得到一个AI模型。“如果客户想成立AI部门,只需要部署上倍赛的系统上,然后再找两三个AI工程师调参,就可以自己出模型了。如此,标注、采集、建模就会变成一个大闭环了,因为客户懂业务,他知道业务数据应该是什么样子。”杜霖说。

现在,倍赛BasicFinder避免直接建模,杜霖强调,“我们将我们自主研发的私有化标注系统及主流的深度学习框架,统一封装进倍赛的AI基础系统BasicAI,实现AI数据及模型的整个生命周期管理。倍赛不建模,我们只给客户提供一套底层工具,让客户自己去建模。”杜霖解释说,“Tensorflow、Keras及Pytorch这些深度学习库的出现,让建模没有门槛,未来甚至高中生都能够建模。”

如果一个 汽车 公司让倍赛BasicFinder帮忙做一个自动驾驶系统,杜霖表示做不了。但他也说,“我们的BasicAI实现从标注到建模的高效流程管理。客户在倍赛标数据,数据流到建模平台,客户在Tensorflow里调点参数,模型就出来了。” 今年,倍赛将推出3.0新版本,同时提供SaaS化标注工具服务,帮助客户实现数据标注管理。杜霖提到,为团队打造的采标及建模流程化工具,可以提高倍赛的业务延展性,提高竞争中的优势。

选择无优劣,但市场会给所有选择一个清晰的答案。而战国混战,或在接下来的几年见分晓。不过,客户并不希望一家独大,大树之下,寸草不生的局面。未来,数强并立的局面或将长期存在。

走向终局

一个场景,一个市场,一个产业,一个江湖。

熙熙攘攘被裹挟着进场的人,有的主动选择,有的则是被动,但一旦进入,市场和资本的逻辑发挥作用,他们你我都变成生产链上的生产要素,被挑选,被进步,亦或被淘汰。

各个产业参与者的位置,从诞生起或已被注定。从产生的那一刻起,它按着既有逻辑在走,从不以个人意志转移。上半场,草根英雄辈出,拼价格,下半场拼品牌、服务与效率。精英开始清场,草根离场或者重新站队。而资本,加速整个产业迭代。

现在,下半场刚开启,谈终局似乎有些为时过早。有太多的不确定将在接下来几年的竞争中,变得确定。但更多的不确定性,可能又会出现。城头变幻大王旗,只在一瞬之间。

黑智认为接下来几年,不确定性虽是主流,但仍有几件事是确定的:

1.下半场仍将是性价比之争。客户永远希望用最小的成本获得更高质量的数据。为了生存和在竞争中脱颖而出,供给侧不得不迎合性价比需求,他们不得不通过技术来获得降价空间和利润空间。贾宇航觉得,技术永远是最重要的。“通过技术的方式倒逼自己不要赚太多钱。如此,价格才能降下来,竞争力则提了上去。”

2.不要忽视传统公司的AI需求。毫无疑问,接下来几年,传统企业的AI需求将会出现井喷,如何抓住他们,并服务好他们,这是所有采标公司亟需思考的。当然,也不能忽视AI行业的新数据,比如3D的激光雷达以及心跳数据等。

3.不能忽视商务能力。不强的商务能力,或将成为采标公司的新短板。现阶段,它们的产品和商业模式已基本经过市场的验证。他们需要通过放大商务杠杆扩大产品的覆盖范围。

4.建立第二条增长曲线。接下来几年,有人离开,有人留下。每个人都有所归属,在产业链上,支配或者被支配。所有留下的公司都应该寻找第二条增长曲线,如此才能突破现有成本收益的限制。另外,张三的梦仍需要做,仍需要努力实现。梦想总是要有的,万一实现了呢。(注:张三为化名)

‘叁’ 旷视科技智能安防是干什么用的

智能安防
就是针对企业工作环境或者
公共区域
的安全配置所开发出了一种
智能服务

旷视科技
智能安防目前已经在
智慧城市
的诸多领域里面发挥重要的作用,例如交通、通行、公共安全等,这个
安防系统
不仅高效,而且安全。

‘肆’ 旷视科技股票代码

股票代码是000652。
旷视科技成立于2011年,是一家人工智能产品及解决方案公司。其产业领域包括三种物联网场景:个人联网、城市物联网和供应链物联网。匡时专注于智慧城市、建筑园区、消费电子、智能物流、工业自动化等核心产业,以深度学习为核心竞争力。
拓展资料
1.公司营业范围:技术开发、技术咨询、技术服务和技术转让;计算机系统服务;应用软件服务;基础软件服务;自主研发产品、机械设备、电子产品、五金电器设备、计算机、软件及辅助设备、日用百货的销售;业务管理;投资管理;资产管理;货物进出口、技术进出口、进出口代理。
2.企业依法自主选择经营项目,开展经营活动;依法应当批准的项目,经有关部门批准后,应当按照批准的内容开展经营活动;不得从事本市产业政策禁止和限制的项目的经营活动。 开放视觉的核心技术是与计算视觉和传感技术相关的人工智能算法,包括但不限于人脸识别、人体识别、手势识别、字符识别、证书识别、图像识别、物体识别、车牌识别、视频分析、三维重建、智能传感与控制等。匡时通过构建底层AI算法引擎和aiot操作系统实现技术商业化。
3.北京旷视科技有限公司的核心客户包括阿里巴巴、蚂蚁金融、新秀网络、富士康、中信银行、联想、华为、oppo、vivo、小米、凯德、华润集团、仙盛等。 核心产品 Face + +人工智能开放平台 Face + +人工智能开放平台是匡时面向全球开发者和行业用户推出的开放平台。它以API或SDK的形式为开发者提供人脸识别、字符识别、图像识别、物体识别、场景识别等数十种计算机视觉功能,旨在帮助开发者以一种简单的方式接触AI技术。
4.Faceid在线人脸识别认证平台:Faceid可以为用户提供丰富的端云认证服务,包括客户端app的活检SDK、人脸验证、license验证、Faceid服务器的多数据交叉验证等多种风控认证方式。通过金融人脸识别和证书识别技术,可以方便、安全地实现在线用户认证和用户证书验证,从而达到在线验证的效果,解决现有在线验证方法交叉验证的复杂问题,降低风险控制成本。Faceid可以帮助互联网金融企业快速安全地完成用户自身在实名验证、大额资金周转、个人借贷等业务中的操作验证,并可以根据场景和风险进行详细的参数配置和调整。

‘伍’ 旷视的“新生意”

作者 | 珍珍

出品 | 虎嗅大商业组

题图 | 旷视 科技

历经IPO风波与近期的数据隐私漩涡后,低调已久的旷视终于露面了,在这次露面还首次对外公布了旷视物流的新团队。

10月15日,在“旷视智慧物流战略暨‘AI+物流产业联盟’发布会”上,旷视正式宣布了智慧物流业务的定位与战略布局,并发布包括河图2.0版本、7款AI+智能物流硬件新品、发起成立人工智能物流产业联盟等智慧物流业务的全新进展。

这一系列软硬件产品的发布,加上人工智能物流产业联盟的组建、和重新搭建的新领导班子,都表明了旷视接下来要深耕物流行业的决心。

旷视联合创始人兼CTO唐文斌称,过去这段时间里,旷视在一个一个的做项目,“我们也不谈什么“Fancy”、“人工智能”等词语,关键就是做项目,为每个客户做好服务,做好价值交付。

简单来说,就是旷视开始沉下心来专心做生意了,毕竟旷视可对外、对资本讲的故事,屈指可数。

目前,AI的发展从资本的追捧已经走向理性,物流作为AI可以赋能的行业,与最佳落地场景,或许是旷视眼前比较好讲的故事与赚钱的救命稻草。

一方面,旷视在AI行业商业变现能力弱、并且亏损在不断加剧;另一方面,国内人工智能的甲方目前还是以政府机构为主,旷视作为AI企业也不例外,这一块旷视主攻的是城市物联网业务,但变现渠道较为狭窄。

据旷视2019年8月提交的招股书显示,在2016年-2019年上半年,旷视分别实现营收为6780万元、3.13亿元、14.27亿元、9.49亿元,营利还算不错。但从净利润来看,则亏损比较严重,仅2019年上半年就亏损52亿元。招股书显示,2016年-2019年上半年,旷视净利润分别为-3.43亿元、-7.59亿元、-33.51亿元、-52亿元。

因此,出海与供应链物联网,成为了旷视拓展市场的两个方向。供应链物联网主攻物流,在出海方面,据悉,旷视未来或将在日本、新加坡、泰国和中东成立合资企业或办事处,扩大市场占有率。

变现突破口

在现场,唐文斌自己调侃,很多人会问:旷视,你们不是做计算机视觉的吗?怎么做计算机视觉的公司跑来做物流这个方向?大家都很奇怪。

唐文斌认为这并不奇怪,因为旷视整个技术发展路线(旷视现在称之为CV+(计算机视觉+)),最早是从计算机视觉开始,依赖于深度学习,但旷视现在的计算机技术往计算机视觉层面做了演进。

往前如何让计算机视觉获得更好的图像和视频(旷视在做计算摄影学),往后计算机视觉之后,又怎么样呢?唐文斌说,它要动起来,只有动起来才能改造这个物理世界,创造更大价值,旷视叫这为视觉反馈的控制。

“我们通过赋予AGV设备更多的能力,如赋予设备智能调度能力、视觉能力、眼睛能力,能够让它们为场景创造价值,这是旷视从CV开始,通过CV+带来更多新的可能性。”

其实,在旷视进入物流行业之前,早先也做过几个不同行业的项目,如:在手机场景下提供人脸识别的服务,通过给摄像头赋能、给城市的IoT赋能,让这个城市变得更加智能。

在现在看来,前者属于个人物联网业务,后者属于城市物联网业务。

到2017年旷视坚定在供应链场景里深耕,要先从智慧物流开始,用AI的能力、用自动化的能力、用计算机视觉能力,通过这样的方式为物流场景带来降本增效的价值。

经过一段时间酝酿后,在2018年4月旷视公布全资收购艾瑞思机器人,正式进军智能机器人业务。

那时唐文斌表示,旷视收购机器人公司(艾瑞思),不是一件“突然”的事情,“之前印奇就提出过‘4+2+X’。”,“4”是指脸、人、车、文字;“2”是指机器人的手和腿;“X”是指通过Brain++这个平台快速做技术的定制,让场景真正地形成一个完整的产品链。

“4相当于是眼睛,旷视的核心是做视觉感知技术,有了数据之后,我们需要通过眼手联动、眼腿联动的方式去做动作,而机器人就是一个重要的行为载体,这是我们收购机器人公司背后的思考逻辑。”唐文斌说。

基于此,2019年1月中旬,旷视在旷视机器人战略发布会上公布了2大战略:第一,着重于打造AIoT系统;第二,推出智能机器人网络协作大脑——河图(Hetu)。

也是在这个时期,旷视将艾瑞思机器人融入内部业务板块。之后被称为供应链物联网业务,涵盖物流与机器人,作为旷视‘1+3’战略的一员,与个人物联网、城市物联网业务并驱。

从这也足以看出旷视对物流的重视程度。

所谓1+3战略指的是Brain++平台与个人物联网、城市物联网、供应链物联网。“Brain++”是旷视自主研发的“深度学习框架”,也是旷视最核心的竞争力。

唐文斌称,“供应链物联网是旷视‘1+3’战略的重要支柱,是支撑旷视实现持续增长的关键引擎。旷视将坚定进行长期投入,深耕智慧物流领域”。

旷视方面认为,AI赋能物流,是旷视独有的,因为这是同行们所不具备,在这个层面可以打出差异化产品、形成差异化服务。

早期旷视的业务并不以物联网相称,而为什么旷视的三大业务:个人物联网、城市物联网、供应链物联网,从2019年开始都冠以物联网后缀呢?

这主要是源于创始人印奇的看好,2019年1月确认战略升级后,印奇称,IoT时代来临,旷视就锚定了AIoT这个目标在努力。他认为,物联网在未来的5-10年,在中国是最好的发展机遇期。

新领导班子

在物流行业深耕的过程中,唐文斌自己有一个特别大的感受,他觉得这里面每个行业“水”都很深。

作为物流行业的新兵,虽然旷视团队的人员都非常擅长算法、软件,但对于物流项目的规划能力、实施能力,对建筑了解程度、机械了解程度及电器了解程度,其实远远不够,“我们需要行业经验”,唐文斌说,这个事情很关键,旷视要真正引入有经验的团队。

也就是说,要想在物流行业闯荡江湖,光有算法软件能力还不行,AI那一套并不顶用,缺乏行业经验还是空谈,就相当于底层逻辑有了,但缺乏上层建筑。

物流本身就是一个比较接地气的行业,空谈技术、落地能力不行,走不长久。旷视需要有行业经验的专家,来将旷视的技术与行业场景落地形成合力,做到技术和经验双轮驱动,只有这样旷视才可以走的更远。

唐文斌称,做好这些事,旷视会从两个维度去做,第一、要充分地尊重行业,一定要抱着卑微的心,坚定地做基本功的修炼;第二、旷视做的每件事,包括新技术、新产品等是在给客户创造最关键的价值,要坚持价值牵引,用技术创新赋能用户、赋能场景。

在以上背景下,从2019年10月开始至今,旷视陆续引进了3位具有行业经验的人,组建了新的物流领导班子(艾瑞思机器人创始人彭广平现在在城市物联网任职),他们分别是:

徐庆才担任旷视高级副总裁、物流业务事业部总经理,王宏玉担任旷视高级副总裁、机器人产品部(RPG)总经理,王银学担任旷视副总裁、物流业务事业部战略和规划发展中心负责人。他们3人在物流行业,都具备20年以上的行业经验。

事实上,在旷视内部,供应链物联网板块被划分为两个作战团队,一个是徐庆才团队,主要负责前台业务,在前面打仗;另一个是王宏玉团队,主要负责做机器人产品,是中台,主要为徐庆才团队提供“炮弹”。

为什么这样划分?

王宏玉解释,这主要是因为在以前的行业经验里,他发现,在前线打仗的作战团队,如果做产品,当项目越来越多时,没办法专心去做产品的研发、慢慢就搁置了。很多同行企业都有这样的经历,一旦前方战事紧张,后面粮草也就是研发工作就停下来了,从整体来看,对产品研发是不利的。

为了避免这个问题,旷视决定形成两个团队:一个是作战团队,一个是中台的产品团队。这样可以保证,在持续推动新产品落地过程中,不断给前方输送炮弹。

在此期间,旷视的7款机器人及智能物流装备、河图2.0版本,也是由王宏玉发布。

王宏玉认为,旷视一直在坚持软硬一体化产品布局,以加快AI商业落地,是最硬的AI公司,“因为旷视主要做的就是AI赋能的智能物流设备,而非在同质化产品上竞争”。

“底层AI算法是旷视进入物流行业的核心竞争力”徐庆才说,利用旷视底层AI算法为核心的技术力,打造的是具有差异化的智能机器人软硬一体的场景。

Brain++在中间起到了衔接作用,是实现技术向产品转化的连接。一方面,旷视在持续投入,让它变的更好,“因为这套系统确实是非常非常复杂,需要不断的迭代”;另外一方面,也会通过更加开放的方式,让这个场景不仅仅赋能于旷视的装备与系统。

旷视方面把2020年定义为AI+物流的元年,他们认为,随着行业技术的快速发展,会引导需求不断上升,这对整个行业来说是好事。

虎嗅获悉,目前,旷视基于AI、算法等核心技术,已经形成了北京、宁波、苏州三大物流基地,主要用于物流硬件的研发与生产,来加速自身移动机器人产品创新的速度,这也是旷视对于物流行业长期投入的一个决心。

物流AGV(AMR)好赚钱吗?

讲了那么多,物流行业好赚钱吗?这是很多人所关心的,但答案显然是不好赚(不多阐述,有些复杂),AGV移动机器人等智能硬件也同样如此,它是由这个市场的特点决定。

据《中国智能物流行业市场需求预测与投资战略规划分析报告》显示,2019年中国智能物流市场规模将达4890亿元,报告预测2020年市场规模将达5850亿元。

而在AGV市场销量方面,2014年我国AGV市场销量为0.34万台,同比增长33.3%。2015年我国AGV市场销量达到0.45万台,同比增长34.4%。截止至2017年我国AGV市场销量增长至1.35万台,同比增长101.6%。2018年我国AGV市场销量达1.89万台左右,同比增长39.5%。

另据中国移动机器人(AGV)产业联盟、新战略机器人产业研究所数据统计,2019年移动机器人所有品类产品新增量33400台,比2018年增长约12.8%。2019年中国移动机器人(AGV/AMR)市场规模达到61.75亿元,比2018年增长幅度为45.2%,其中营收超亿元的企业达到18家。

现在,中国移动机器人产业联盟中,零部件和整机公司有300多家,其中做整机的大概有80多家,但2019年整体移动机器人产业规模只有61.75亿,营收超亿元的企业仅18家。

所以从规模来看,这个市场的容量其实没有那么大,只是外表看着比较热闹,占2019年中国智能物流市场规模4890亿元非常小的一个比例。

在这不大的市场中,除了做AGV机器人的公司外,京东物流、苏宁物流、亚马逊、阿里菜鸟等电商巨头也对AGV等智能硬件进行大幅度加码布局。

如何实现自动化、如何通过移动机器人等的智能硬件降低物流成本,是众多企业最急切的需求。旷视也是看准了这一点,认为AI技术及算法相应软件可以在降本增效中起到非常关键的作用,可以作为物流大脑来去统筹调度仓库中的机器人等,如:今年迭代的河图2.0版本。

河图2.0版本不仅能调度旷视自己的设备,还可以调度第三方的设备,还可实现整个生产全流程的可视化、提前决策、自适应动态调度等,这些功能能更好地实现客户降低企业管理成本、提升运营的效率。

这个产品、想法出发点很好,包括他们发布的7款新产品与智能硬件等,但实施起来效果如何,能否帮助旷视打开市场、提供竞争力、巩固市场地位,这还需要一段时间、让子弹飞一会儿。

旷视认为自己的竞对是安防领域出身的海康威视旗下机器人子公司海康机器人,但在移动机器人市场中,Geek+、快仓、国自、灵动 科技 等近5年崛起的新厂商(他们也在加大AI投入力度),以及以新松、昆船、机科等为代表的老牌移动机器人厂商也不可忽视。

在移动机器人领域,Geek+与快仓属于这个行业的头部企业,旷视觉得自己处于前10以内的位置。

接下来,物流移动机器人行业可能会迎来一波洗牌,因为当一个产业发展到一定程度时,或者投资人投到一定的程度变得比较理性时,整个行业就会面临洗牌。

用巴菲特的话说就是:当潮水退去时,才会知道到底谁在裸泳!

本文源自虎嗅网

‘陆’ 《人工智能》李开复/王咏刚

我读该书最大的收获:

什么是深度学习? 李开复举得例子很通俗易懂、很形象

这一次人工智能复兴的最大特点是,AI在语音识别、机器视觉、数据挖掘等多个领域走进了业界的真实应用场景,与商业模式的紧密结合,开始在产业界发挥出真正的价值。

1 三次人工智能浪潮:

2 第三次人工浪潮的特点:

语音识别领域的三次跨越:

创新工场管理合伙人、资深投资人汪华认为,人工智能的商业化分为三个主要阶段:

第一阶段
AI会率先在那些在线化程度高的行业开始应用,在数据端、媒体端实现自动化。
这一过程会首先从线上“虚拟世界”开始,随着在线化的发展扩张到各个行业,帮助线上业务实现流程自动化、数据自动化和业务自动化。

拥有高质量线上大数据的行业会最早进入人工智能时代。
互联网和移动互联网的发展已经在许多领域为AI做好了业务流程和数据上的准备。例如:大家常说的金融行业是目前人工智能应用的热点,这正是因为金融行业特别是互联网金融已经做好了使用AI的准备。此外,美团等公司将餐饮服务与线上业务连接了起来,滴滴、摩拜单车等公司将交通出行与线上业务连接了起来。在这些拥有线上业务流程和高质量数据积累的地方,AI同样开始发挥作用,大幅提高线上业务的自动化程度。

第二阶段
随着感知技术、传感器和机器人技术的发展,AI会延伸到实体世界,并率先在专业领域、行业应用、生产力端实现线下业务的自动化。

可以感知实体世界信息的传感器和相关的感知技术会越来越成熟,越来越便宜。在线下业务中,计算机系统可以通过物理方式接收线下信息或帮助完成线下操作。这个转变意味着人工智能从线上的“虚拟世界”走进了线下的实体世界。这个阶段,人工智能的商业化会首先从生产力的角度切入,整个世界的生产制造会逐渐被AI渗透。工业机器人、仓储机器人、物流机器人等将在这个阶段实现大范围的普及。

第三阶段
当成本技术进一步成熟时,AI会延伸到个人场景,全面自动化的时代终将到来。

随着技术的日趋成熟,相关的智能产品价格大幅下降, AI终将从企业应用进入个人和家庭 。那时,每个人的工作和生活中,大量的应用场景都会因为AI的帮助而更加自动化、更有效率,人类的生活质量终将因AI的普及而大幅提升。这个阶段里,AI商业化的核心目标是创建全面自动化的人类生活方式

根据汪华的判断,我们目前正在进入A商业化的第一个阶段,也许只需要3年的时间,AI就可以在各种在线业务中得到普及。AI商业化的第二个阶段,要花5~7年的时间才能充分发展起来。而标志全面自动化的第三个阶段,需要十几年的时间。

清晰的领域界限
人工智能创业,要解决的领域问题一定要非常清晰,有明确的领域边界,因为这一类问题是今天以深度学习为代表的人工智能算法最善于解决的。例如,同样是做机器人,如果做一个借助视觉传感器更好地规划扫地线路、提高清洁效率的扫地机器人,将机器人的需求限定在一个有限的问题边界内,这样的解决方案就相对靠谱。
如果上来就要做一个长得像人一样、可以与人交流的人形机器人,那以今天的技术,做出来的多半不是人工智能,而是“人工智障”。

闭环的、自动标注的数据
针对要用AI解决的领域问题,最好有在这个领域内,有闭环的、自动标注的数据。例如,基于互联网平台的广告系统可以自动根据用户点击以及后续操作,收集到第一手转化率数据,而这个转化率数据反过来又可以作为关键特征,帮助AI系统进一步学习。 这种从应用本身收集数据,再用数据训练模型,用模型提高应用性能的闭环模式更加高效。 谷歌、网络等搜索引擎之所以拥有强大的人工智能潜力,就是因为它们的业务,比如搜索和广告本身就是一个闭环的系统,系统内部就可以自动完成数据收集、标注、训练、反馈的会
过程。

千万级的数据量
今天人工智能的代表算法是深度学习。而深度学习通常要求足够数量的训练数据。一般而言,拥有千万级的数据量是保证深度学习质量的前提。当然,这个“千万级”的定义过于宽泛。事实上,在不同的应用领域,深度学习对数据量的要求也不尽相同。 而且,也不能仅看数据记录的个数,还要看每个数据记录的特征维数,特征在相应空间中的分布情况,等等。

超大规模的计算能力
深度学习在进行模型训练时,对电脑的计算能力有着近乎“痴狂”的渴求。创新工场曾经给一个专注于研发深
学习技术的团队投资了1000万元人民币。结果,团队建设初期才两三个月时间,仅购买深度学习使用的计算服务器就花掉了700多万元,一个类型的深度学习任务,通常都要求在一台或多台安装有四块甚至8块高性能GPU芯片的计算机上运行。涉及图像、视频的深度学习任务,则更是需要数百块、数千块GPU芯片组成的大型计算群。在安装了大型计算集群的机房内,大量GPU在模型训练期间发出比普通服务器多数十倍的热量。许多机房的空调系统都不得不重新设计、安装。在一些空调马力不足的机房里,创业围队甚至购买了巨大的冰块来协助降温。

顶尖的AI科学家
今天的人工智能研发还相当依赖于算法工程师甚至是AI科学家的个人经验积累。水平最高的科学家与普通水平的算法工程师之间,生产力的差异不啻千百倍。人工智能创业公司对顶尖AI科学家的渴求直接造成了这个领域科学家、研究员的身价与日俱增。谷歌雇用杰弗里·辛顿、李飞飞,Facebook雇用扬·勒丘恩,据说都开出了教百万美元的年薪。国内AI创业公司如旷视科技,也用令人瞠目的高薪,将机器视觉领域的顶尖科学家孙剑“挖”了过来,把任公司的首州时科学家。

把握时机对创业和投资至关重要。创新工场根据技术成熟度和未来发展趋势,将人工智能各应用领域划分为现阶段已成熟、3到5年成熟、5到10年成熟、10年后成熟等不同类型,并分别设计相应的投资策略。

如图中所示,创新工场将人工智能领域的应用划分为大数据、感知、理解、机器人、自动驾驶等不同门类,每个门类中,按照人工智能技术的成熟度,将具体应用领域排列在时间维度上。

总体来说,人工智能在互联网、移动互联网领域的应用,如搜索引擎、广告推荐等方面已经非常成熟。在商业自动化、语音识别、机器视觉、手势识别、基础传感器、工业机器人等方面,人工智能可以立即应用,立即收效。

金融类人工智能的应用虽然已经起步,但尚需一段时间才能真正普及。智能教育、智能医疗、AR/VR中的人工智能、量产的传感器、商业用机器人等,预计会在3到5年成熟可用。

可以供普通技术人员乃至非技术人员使用的人工智能平台(包括计算架构、算法框架、传感平台、云服务等),会在3到5年后趋于成熟并拥有足够大的商业机会。

通用的自然语言对话工具、智能助手、普及型的家用机器人等,则至少需要10年甚至更长的时间,才有可能完成商业化。

另外,在自动驾驶领域,3到5年内,必将是第2级到第3级的辅助驾驶最先大规模商用,而且,鉴于安全考虑,这些自动驾驶应用也会是限定场景、限定道路等级的。真正意义上的“无人驾驶”,即第4级或第5级的自动驾驶,还需要5到10年才能上路运行。

我的理解:
跟着“数据”走,哪里有质量高的大数据,哪里就有金子。

‘柒’ 旷视的数据存到哪里

云端存储。
旷视科技是目前国内人脸识别最大的技术供应商,其人工智能核心在于数据,算法的形成最终取决于数据量的大小,可供参考的数据越多,算法也就越精确。早在2019年,旷视科技的云端人脸识别身份验证解决方案占市场份额逾60%,而在中国制造生产的配备身份验证功能的安卓智能手机中,已经70%使用了旷视科技提供的基于人脸识别的设备解锁方案。

‘捌’ 旷视科技的数据处理岗值得去吗

这种一般是去数据标注,数据清洗,工作比较枯燥

‘玖’ 规模化学习崛起,2020十大科技趋势预测,未来我们会与AI共处吗

12月24日,网络研究院发布2020十大科技趋势预测,从2019年科技的蓬勃发展中提前展望2020。作为2019年度最受关注的科技热词之一,“AI”自然成为了焦点。网络研究院也对AI产业给出了几点关键预测。其中一点就是,AI技术已发展到可大规模生产的工业化阶段,2020年将出现多家“AI工厂”。

图:网络研究院预测AutoML 的快速发展将大大降低机器学习的门槛

基于Brain++,旷视“AI工厂”初现。依托Brain++,旷视实现了云、端、芯的深度神经网络算法全面覆盖,并推出了多种高效的以人工智能驱动的物联网解决方案,并成功为个人物联网、城市物联网、供应链物联网等垂直领域的客户赋能,助力创造更多价值。

据IDC统计,2019年全球人工智能市场规模达到375亿美元,中国人工智能市场预计占全球的12%,成为了全球第二大人工智能单一市场,且市场规模保持高速增长。人工智能产业迭代的力量即将喷涌而出,但就像第一次工业革命的纺织工厂,第二次工业革命的汽车工厂,AI革命也需要打造一个智能时代的“AI工厂”,以应对即将来临的AI大生产时代的需求。这不仅是AI企业发展的必经之路,更是直接决定着整个国家的产业在这个新时代节点之中参与全球竞争的底气。以旷视Brain++为代表,它们作为中国AI企业极少数的自主可控的算法框架,无疑将在中国AI产业发展中留下浓墨重彩的一笔

阅读全文

与旷视数据标注干什么相关的资料

热点内容
产品合格证书怎么考 浏览:346
信息化给人类和企业带来哪些好处 浏览:855
露露核桃露怎么代理 浏览:308
如何获得发酵产品 浏览:814
东兴卖越南货的市场叫什么 浏览:97
新房在哪里交易比较好 浏览:901
电子焊接技术在哪里学 浏览:180
龙岗市批发市场在哪里 浏览:557
如何获得癌症发病数据 浏览:955
现在市场生猪什么价 浏览:503
图文信息处理技术专业怎么样 浏览:65
山西素肉技术培训多少钱 浏览:907
苹果手机微信怎么逐条回复信息 浏览:703
如何静止电脑程序开机自启 浏览:630
浙江金华交通技术学院有哪些专业 浏览:52
我的世界什么东西都可以交易 浏览:916
皇茶什么加盟代理 浏览:366
南宁龙屯农贸市场是哪个开发商的 浏览:809
如何查看会展信息 浏览:745
华港燃气公司客户信息怎么看 浏览:893