‘壹’ 工业大数据应用难点有哪些
工业大数据应用难点有:樱困如
一是大数据技术的运用困难,存在数据不足、数据信噪比低以及数据分析难度高等问题。
二是大数据给信息安全带来新挑战,如工业大数据加大了隐私泄露的风险,对现有存储和安全措施提出了更高要求,以及大数据正在被运用到新的攻击手段中。
目前,工业大数据在产品创新设计、产品故障诊断与预测、供应链的分析和优化、产品销售预测与大数据营销、生产计划与排程、产品质量管理与分析等场景有广泛的应用。“数据是工业互联网的血液。”何友如此描述大数据与工业互联网的互为动力。
不过,由于工业大数据数据价值密度高,数据类型繁多,多尺庆源异构的机构化数据和非结构化数据并存,数据处理实行性要求也非常高,数据关系和关联性异常复杂等特征,脊启企业如何从数据统计分析能力转变为大数据分析、预测和决策能力,促进传统工业升级改造和产业整合,是目前要解决的核心关键问题。
‘贰’ 工业大数据可视化的难点有哪些
随着工业互联网的不断深化,必然会造成MOM/MES、ERP等传统工业应用和系统的形态发生天翻地覆的改变。而制造业分析、生产分析正在成为发达国家争相进入的一个热门领域,当然,这里的“分析”是完全不同于传统工业场景下的“统计分析”、“故障分析”等,这是一种结合了物联网、大数据和人工智能等先进技术的新型的“大数据分析”。(内容转载自寄云科技)
工业大数据分析应用的独特之处如果细究其实是很多的,通过提供更具针对性和可操作性的见解,数据分析可以简化制造运营,从而帮助企业持续优化生产线。以下是在制造业中使用数据分析的六种场景,它们可以显着改善整个运营!
一、从被动式到主动式维修
制造系统往往在超负荷状态下运行,任何工作中断都可能导致螺旋式上升的损失。即便如此,大部分公司采用的解决停机问题的最佳方案只不过是等故障发生后再解决的方式。到目前为止,这种反应性系统还在被采用,是因为显然缺少更好的替代方案。通过整合大数据分析,企业可以开发能够持续衡量自身维修需求的制造系统。这种特性赋予了制造系统在许多情况下进行自我修复的能力,并为不太容易解决的情况提供早期警报。更重要的是,数据分析可以洞悉哪些组件最常发生故障,从而帮您从被动式维修提升为主动式维修。
二、提高机器利用率和有效性
制造商遇到的最大问题之一是进入低效运转的境况。虽然主观上他们希望构建高效的制造链,但由于安装不当、使用不当或仅缺乏停机时间协调,各种不同的因素都可能会成为降低生产线整体效率中的关键。
通过将现有的物联网系统与强大的制造业预测分析相结合,企业可以实时洞察其生产线在微观和宏观上的运行状况。追踪单台机器的停机时间如何影响整个制造链,或者探索不同的配置如何提高整体效率,这不是“痴人说梦”,而是必须要做到的。生成可操作的数据以使企业在整个制造过程中实现真正的改进,是将分析应用于制造业的主要优势。
三、更好地产品需求预测
每个制造商都知道他们不仅在为当前已有的订单生产产品,而且还在为不久的将来可能出现的需求订单生产产品。需求预测很重要,因为它们能够指导生产链,如果预测失误,可能产生“一边是强劲的销售量”,而“另一边却是工厂缺乏大量的相应配件库存,无法满足需求”。对于大多数公司而言,预测是基于前几年的历史数据价值,而不是基于更具可行性的前瞻性数据。但是,制造商可以将现有数据与预测分析相结合,以更精确地预测购买趋势。这些预测性见解不仅基于先前的销售,还基于流程以及生产线的运行状况,从而可以更明智地进行风险管理并减少生产浪费。
四质量预测提高良率
质检是对已经生产出来的产品的质量检测,一方面可以保障企业能够对外提供合格产品,另一方面也能通过质检反映生产过程的疏漏。质检出的残次品无论多少对企业都是损失,如果能够在产品产出之前就通过产线状态及相关生产数据分析预测出产品质量,并将生产流程调整为最佳产出状态以避免残次品,这就是质量预测。质量预测的场景在半导体等高端制造领域是刚需,属于虚拟量测的范畴。
虚拟量测依赖于完善的物联网系统及强大的数据接入、存储和分析等能力,以往囿于技术水平虚拟量测只能基于有限的统计分析手段,而现在有了大数据、物联网等先进技术的支持,基于大数据分析的虚拟量测已经成为现实。
五、全面掌控制造供应链
采购是大多数公司供应链的标准组成部分,但同时它也是一个很容易被忽略的地方,尤其当企业忙于改善其他方面时。从一个有问题的供应商或者每个配件贵几分钱的供应商开始检查,当然一个配件几分钱的差额可能看起来无足轻重,但是,如果企业每天生产数千种产品,那么这里或那里的一分钱可能在总账簿上积少成多会变成数千元。数据分析可以帮助制造企业了解生产生命晌银周期中每个组件的成本和效率,甚至可以追溯到企业供应商的运输车辆。通过可视化各种因素如何影响最终结果,高级分析可以芹唯帮助企业做出更好的决策。如果某些配件经常出现故障,或者没有完全满足生产需求,那么在这些不起眼的问题酿成严重后果之前,制造数宴首宴据分析将能够帮助企业发现它们。
六、更好地物流仓储管理
制造过程中另一个经常被忽视的方面是仓储。一旦产品准备好运输后,必须先放入仓库,然后再出发前往目的地。在这一阶段,可谓是分秒必争。尤其是在这个日益接受“刚刚好”和零库存模型的世界中。
管理仓库可不是简单地为等待运输的产品寻找空间。建立有效的仓储结构,更好的产品流程管理和最有效的补货程序可以改善运营效率实现盈利。先进的分析功能可以让企业更容易领会改善库存的方法进而更好地管理仓库。
生产分析软件的本质是收集和处理海量数据,并从中发现可用的见解。其通过自动化的手段对制造企业内外部各类数据进行采集、处理,同时,它的分析结果、可视化产出也是可以跨越多种企业架构,为上至公司首席执行官、下至车间经理提供符合各自权限的服务。而亿信华辰的数据分析软件ABI正好可以完美解决各种数据分析问题。
‘叁’ 大数据可视化能解决哪些问题
你好!很高兴为你解答:(1)数据规模大,已超越单机、外存模型甚至小型计算集群处理能力的极限,而当前软件和工具运行效率不高,需探索全新思路解决该问题;(2)在数据获取与分析处理过程中,易产生数据质量问题,需特别关注数据的不确定橘带腔性;(3)数据快速动态变化,常以流式数据形式存在圆衫,需要寻找流数据的实时分析与可视化方法;(4)面临复杂高维行拆数据,当前的软件系统以统计和基本分析为主,分析能力不足;(5)多来源数据的类型和结构各异,已有方法在非结构化、异构数据方面支持不足。
‘肆’ 智能制造:工业制造中的大数据分析
搞清出工业大数据分析,第一步我们应该如何定义制造业的大数据?这里我和大家通过大数据的三个特性,来经一步了解大数据的特性。
1
关注#1 -工业大数据数据来源
工业大数据的主要来源有两个,第一类数据来源与智能设备。普适计算有很大的空间,现代工人可以带一个普适感应器等设备来参加生产和管理。所以工业数据源是280亿左右大量设备之间的关联,这个是我们未来需要去采纳的数据源之一。
第二个数据来源于人类轨迹产生的数据,包括在现代工业制造链中,从采购,生产,物流与销售市场的内部流程以及外部互联网讯息等,都是此类大数据的战场。通过行为轨迹数据与设备数据的结合,大数据可以帮助我们实现客户的分析和挖掘,它的应用场景包括了实时核心,交易,服务,后台服务等。
2
关注#2 -数据的关系
数据必须要放到相应的环境中一起分析,这样才能了解数据之间的关系,可以分析出问题的根本原因(root cause)。譬如,每一款新机型在交付给航空公司之前都会接受一系列残酷的飞行测试。极端天气测试就是多项严酷的测试之一。该测试的目的是为了确保飞机的发动机、材料和控制系统能在极端天气条件下正常运行。
问题的处理关键在于找到产生问题的根源,而以知错误的消除,关键在于解决方案的可靠有效。一旦找到并确定了根本原因,同时产生了可接受的应急措施,就可把问题当成一个已知错误来处理。问题调查的过程一定需要收集所有可用,与事件相关的信息来确定并消除引起事件和问题的根本原因。数据采集与分析必须要事件/问题发生的环境数据结合。
3
关注#3 -数据的收益
对于数字化转型的其他方面而言,大数据不仅要关注实际数据量的多少,而最重要的是关注在大数据的处理方法在特定的场合的应用,让数据产生巨大的创新价值。如果离开了收益考虑或投资回报的设计,一味寻求大数据既无法落地也无法为企业创造价值。
工业大数据分析的定义
生产执行系统(MES)与飞机发动机 健康 管理系统如出一辙。我们可以从工厂的生产中,实时采集到海量的流程,变量,测量结果等数据。这些数据来源的原因都是因为在制造环境中,设备或资产连接后所产生的现象。然而基于大量数据集而生成的报表,或是基础统计的分析并不足以称之为制造业的大数据分析。
所以如果制造业大数据分析不仅仅意味着数据的量,作为一个行业,我们应该如何定义制造业的大数据分析?“大数据不仅仅是大量的数据”这句话里面包含了多重涵义。
当代大数据处理技术的价值在于技术进步,同时也是因为技术进步,使大数据成为商业中有价值的核心驱动因素。作为智能制造的三驾马车之一,工业大数据分析已经被多数的制造企业所认知并接受。许多制造业企业认为自己在生产运营方面也累积了大量的数据,是时候可以用到大数据了。
数据类型的多样性
大数据不仅仅是大量的数据的堆积。大数据的重要属性之一,便是,人们设法收集,并弄清楚,不断变化的数据类型。如果只是大量采集同一类型的数据的话,再大的数据量都不能称之为大数据。
数据必须包括高度可变性和种类多样性。制造工厂中存在无数的大数据应用,但并不包括简单地分类和展示一连串的流程测量结果,这些工作基本的统计展现就可以完成。一些大数据数据库或数据湖的构成部分数据类型也是文本信息、图像数据、地理或地质信息和非结构信息,例如,通过社交媒体或其他协作平台获得的数据类型。
制造业信息结构概括起来分为两层,一个是管理层,一个是自动化层。从经营管理,生产执行与控制三个纬度来实现决策支持、管理、生产执行、过程控制以及设备的连接与传感。制造业中大数据分析是指利用通用的数据模型,将管理层与自动化层的结构性系统数据与非结构性数据结合,进而通过先进的分析工具发现新的洞见。
大数据分析对生产的意义
制造业的创新的核心就是要依托大量的前沿 科技 。先进的技术是创新的手段。在新技术的支持下,可以通过一体化的制造运作管理系统MOM将企业管理应用系统,例如ERP,MES等系统与工业自动化的相关系统整合为一体。
从两化融合的角度来看,信息系统供应商要从企业的主信息系统提供商定位来做好规划、标准、功能设计、实施策略的统一性工作。协助企业做好风险控制,降低投资,降低操作维护成本,实现企业信息系统全集成。
‘伍’ 一文读懂工业大数据的脉络
一文读懂工业大数据的脉络
工业大数据不同于大数据,具有自己独特的特征。本文着重从工业大数据的定义与范畴、来源、特征、技术及应用领域、面临的问题等,全面剖析工业大数据的方方面面,让你一文读懂工业大数据的脉络!
工业大数据是指在工业领域中,围绕典型智能制造模式,从客户需求到销售、到订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命各个环节所产生的各类数据及相关技术和应用的总称,其以产品数据为核心,极大延展了传统工业数据范围,同时还包括工业大数据相关技术和应用。
——工业大数据来源——
我们所谈的工业大数据,不完全等同于企业信息化软件中流淌的数据,从业界的共识看,主要来源有三类,第一类是企业经营相关的业务数据,这类数据来自企业信息化范畴,包括企业资源计划(ERP)、产品生命周期管理(PLM)、供应链管理(SCM)、客户关系管理(CRM)和环境管理系统(EMS)等,此类数据是工业企业传统的数据资产。
第二类是机器设备互联数据,主要是指工业生产过程中,装备、物料及产品加工过程的工况状态、环境参数等运营情况数据,通过MES系统实时传递,目前在智能装备大量应用的情况下,此类数据量增长最快。
第三类是企业外部数据,这包括了工业企业产品售出之后的使用、运营情况的数据,同时还包括了大量客户、供应商、互联网等数据状态。
——工业大数据特征——
笔者曾就工业大数据特征及数据驱动工业价值创造等话题,专门采访过工业大数据领域知名专家——美孙好辩国科学基金会(NSF)智能维护系统(IMS)中心主任李杰教授,他表示:工业大数据与互联网大数据最大的区别在于工业大数据有非常强的目的性,而互联网大数据更多的是一种关联的挖掘,是更加发散的一种分析。
除此之外,两者在数据的特征和面临的问题方面也有不同。有别于互联网大数据,工业大数据的分析技术核心要解决“3B”问题:
1)Below Surface —— 隐匿性,即需要洞悉背后的意义
工业环境中的大数据与互联网大数据相比,最重要的不同在于对数据特征的提取上面,工业大数据注重特征背后的物理意义以及特征之间关联性的机理逻辑则缺,而互联网大数据则倾向于仅仅依赖统计学工具挖掘属性之间的相关性。
2)Broken —— 碎片化,即需要避免断续、注重时效性
相对于互联网大数据的量,工业大数据更注重数据的全,即面向应用要求具有尽可能全面的使用样本,以覆盖工业过程中的各类变化条件、保障从数据中能够提取以反映对象真实状态的信息全面性。因此,工业大数据一方面需要在后端的分析方法上克服数据碎片化带来的困难,利用特征提取等手段将这些数据转化为有用的信息,另一方面,更是需要从数据获取的前端设计中以价值需求为导向制定数据标准,进而在数据与信息流通的平台中构建统一的数据环境。
3)Bad Quality —— 低质性,即需要提高数据质量、满足低容错性
数据碎片化缺陷来源的另一方面也显示出对于数据质量的担忧,即数据的数量并无法保障数据的质量,这就可能导致数据的低可用率,因为低质量的数据可能直接影响到分析过程而导致结果无法利用,但互联网大数据则不同,其可以只针对数据本身做挖掘、关联而不考虑数据本身的意义,即挖掘到什么结果就是什么结果,最典型的就是经过超市购物习惯的数据挖掘后啤酒货架就可以摆放在尿不湿货架的对面,而不用考虑他们之间有什么机理性的逻辑关系;
换句话说,相比于互联网大数据通常并不要求有多么精准的结果推送,工业大数据对预测和分析结果的容错率远远比互联网大数据低的多。互联网大数据在进行预测和决策时,仅仅考虑的是两个属性之间的关联是否具有统计显着性,其中的噪声和个体之间的差异在样本量足够大时都可以被忽略,这样给出的预测结果的准确性就会大打折扣。比如当我觉得有70%的显着性应该给某个用户推荐A类电影,即使用户并非真正喜欢这类电影也不会造成太严重的后果。但是在工业环境中,如果仅仅通过统计的显着性给出分析结果,哪袜斗怕仅仅一次的失误都可能造成严重的后果。
——工业大数据技术:算法与模型——
有了工业数据的大量积累,但并不等于直接的商业收益,中间隔着一道非常关键的通道——工业大数据技术。近几年,很多大数据专家和行业专家也在争执:数据量重要还是大数据算法更重要,双方各执一词。比如Googole就认为数据量的多寡至关重要,甚至直言:更多的数据胜过更好的算法。这种观点与我们意识认知中的“信息越多,就越靠近真相”类似。
而如《The Signal and the Noise》(信号与噪声,作者NateSilver),这本书里面的一个观点是“更多的数据意味着更多的噪声。信号是真相,噪声却使我们离真相越来越远。”所以,人们需要构建有效的算法和模型,去识别和认知何为真相。
在这里暂不讨论到底是数据量重要还是算法模型更重要,但针对工业大数据的有效利用,肯定离不开工业大数据的分析技术。
——工业大数据应用领域(场景)——
一、研发设计:主要用于提高研发人员的研发创新能力,研发效率和质量,支持协同设计,具体体现在:(1)、基于模型和仿真的研发设计;(2)、基于产品生命周期的设计;(3)、融合消费者反馈的设计
二、在复杂生产过程优化的应用:(1)、工业物联网生产线;(2)、生产质量控制;(3)、生产计划与排程;
三、在产品需求预测中的应用
四、在工业供应链优化中的应用
——工业大数据应用发展存在的主要问题——
《工业大数据白皮书2017年版》指出,研究与应用工业大数据,产品大数据是核心,物联大数据是实现手段,集成贯通是基础(业务模式、商业和价值驱动、关键抽取和应用)。而在实践过程中,这三个方面都存在不同程度的难点。
《工业大数据白皮书2017年版》封面
1、产品大数据:产品大数据是工业大数据的根源与核心,但工业制造业领域涵盖十分广泛,行业种类繁多,产品种类数量庞大且仍在不断增长,如何规范产品大数据的定义与分类方法,建立规范的、属性明确的、可查询可追溯可定位的产品大数据,将是顺利应用工业大数据的前提。
2、物联接入设备:物联大数据是实现工业大数据畅通流动的必要手段,但在工业实际应用中,工业软件、高端物联设备不具备国产自主可控性,物联接入的高端设备的读写不开放,形成设备信息的孤岛,数据流通不畅,突破这种束缚是实现工业大数据的关键。
3、信息集成贯通:集成贯通的难点在于商业驱动、打通关键点和环节,掌控产品源和设备,持续优化。
‘陆’ 工业制造大数据分析
工业制造大数据分析
大数据不仅仅是大量的数据的堆积。大数据的重要属性之一,是人们设法收集并弄清楚不断变化的数据类型。如果只是大量采集同一类型的数据,再大的数据量都不能称之为大数据。
如何实现智能制造是大家都关心的问题。从哈佛商学院的迈克尔·波特到宾夕法尼亚大学沃顿商学院,有一个普遍的共识,即数字化转型是智能制造实现的途径。重要的是,这个共识也来自于众多的世界级制造业企业与企业家们。
这一共识是基于无数技术趋势的融合,例如,物联网、赛博系统(CPS)、工业物联网、移动技术、人工智能、云计算、虚拟/虚拟增强现实(VR/AR),以及大数据分析等。我们一定要保持清醒,不要简单地认为有了这些技术,未来五年就是制造业的黄金时期。道理很简单,这个新制造业文化的变革进程是相当复杂和艰难的,没有行业、企业与用户的融合推进,无法实现这次变革。数字化转型不仅仅意味着企业简单的数字化,而是把数字作为智能制造的核心驱动力,利用数据去整合产业链和价值链。
自工业革命以来,为了改进运营,制造商一直以来都在有意地采集并存储数据。随着时间的推移,数据在制造业分析的需求将越来越大。然而在过去的许多年间,利用数据的根本动因并没有改变,数据的复杂性增强,数据转化为情报的能力越来越大。
2012年高德纳给出大数据定义,其中特别强调大数据是多样化信息资产,不仅关注实际数据,更关注大数据处理方法。数据量大小本身并不是判断大数据价值的核心指标,而数据的实时性和多元性对大数据的定义和价值更具直接的影响。
在讨论工业大数据分析的时候,我注意到两种不同的观点:
第一种观点认为,制造业向来都有大数据。几十年来我们的企业一直在通过历史记录、MES、ERP、EAM等各种应用系统采集数据。在部分产业链环节,特别在市场营销方面,大数据算是一个新的热词。
第二种观点认为,从工业大数据角度看,制造业是一个尚未打开的市场或刚刚开启的市场。存在大量不同类型的数据,但如今它们还未被应用到分析之中。
考虑到这些观点,面对任何新的市场提法,包括名词解释、定义或分析框架,我们始终都应该保持适当的怀疑精神。这里我更多倾向于第二个观点。我们的制造业的确有“大量数据”,但这并不是我们大多数人从市场上所理解的“大数据”涵义。在搞清楚工业大数据分析之前,我们应该如何定义制造业的大数据?这里可以通过大数据的三个特性,进一步了解大数据的特性。
数据来源
工业大数据的主要来源有两个,第一是智能设备。普适计算有很大的空间,现代工人可以带一个普适感应器等设备来参加生产和管理。所以工业数据源是280亿左右大量设备之间的关联,这个是我们未来需要去采集的数据源之一。
第二个数据来源于人类轨迹产生的数据,包括在现代工业制造链中,从采购、生产、物流与销售内部流程以及外部互联网信息等。通过行为轨迹数据与设备数据的结合,大数据可以帮助我们实现对客户的分析和挖掘,它的应用场景包括了实时核心交易、服务、后台服务等。
数据关系
数据必须要放到相应的环境中分析,才能了解数据之间的关系。譬如,每一款新机型在交付给航空公司之前都会接受一系列残酷的飞行测试。极端天气测试就是测试之一。该测试的目的是为了确保飞机的发动机、材料和控制系统能在极端天气条件下正常运行。
问题的处理关键在于找到可能产生问题的根源,消除已知错误,并确保解决方案的可靠有效。一旦找到并确定了根本原因,同时具备了可接受的应急措施,就可把问题当成一个已知错误来处理。问题调查的过程一定需要收集所有可用、与事件相关的信息,以确定并消除引起事件和问题的根本原因。数据采集与分析必须要事件/问题发生的环境数据结合。
数据价值
对于数字化转型,大数据不仅要关注实际数据量的多少,最重要的是关注大数据的处理方法在特定场合的应用,让数据产生巨大的创新价值。如果离开了收益考虑或投资回报(ROI)的设计,一味寻求大数据,则大数据分析既无法落地也无法为企业创造价值。
工业大数据分析的定义
发动机是飞机的心脏,也是关乎航空安全,生命安全的重中之重。为了实时监控发动机的状况,现代民航大多安装了飞机发动机健康管理系统。通过传感器、发射系统、信号接收系统、信号分析系统等方式采集到的数据,会经由飞机通信寻址与报告系统,通过甚高频或者卫星通信传输出来,这就是为何GE的发动机监控系统每天会获取超过1PB数据的原因。
生产执行系统(MES)与飞机发动机健康管理系统如出一辙。我们可以从工厂的生产中,实时采集到海量的流程变量、测量结果等数据。基于大量数据集而生成的报表,或是基础统计的分析并不足以称为制造业的大数据分析。
数据类型的多样性是工业大数据分析的重要属性
大数据不仅仅是大量的数据的堆积。大数据的重要属性之一,是人们设法收集并弄清楚不断变化的数据类型。如果只是大量采集同一类型的数据,再大的数据量都不能称之为大数据。
例如,生产环境中收集的时间序列模拟流程变量,数据的类型是单一的,很容易建立索引,即使存在千千万万,也不足以成为大数据。
数据必须包括高度可变性和种类多样性。制造工厂中存在无数的大数据应用,但并不包括简单地分类和展示一连串的流程测量结果,对这些工作,基本的统计展现就可以完成。一些大数据的数据库或数据湖的构成部分也是文本信息、图像数据、地理或地质信息和非结构信息,例如,通过社交媒体或其他协作平台获得的数据类型。
制造业信息结构概括起来分为两层,一个是管理层,一个是自动化层。从经营管理、生产执行与控制三个纬度来实现决策支持、管理、生产执行、过程控制以及设备的连接与传感。制造业中大数据分析是指利用通用的数据模型,将管理层与自动化层的结构性系统数据与非结构性数据结合,进而通过先进的分析工具发现新的洞见。
大数据分析对企业生产智能的意义
制造业创新的核心就是要依托大量的前沿科技。先进的技术是创新的手段。在新技术的支持下,可以通过一体化的制造运作管理系统MOM将企业管理应用系统,例如ERP、EAM等系统与工业自动化的相关系统整合为一体。在一体化制造运作管理的基础上,我们可以实现集IT+MOM+MES+BI的一体化制造企业信息系统解决方案。
从两化融合的角度来看,信息系统供应商要从企业的主信息系统提供商(MIV,MainInformation systems Vendor )定位来做好规划、标准、功能设计、实施策略的统一性工作。协助企业做好风险控制,降低投资,降低操作维护成本,实现企业信息系统全集成。
特别需要注意的是,企业管理信息平台被普遍认为是制造企业管理的集成和仪表板工具。许多供应商既大量投资其与ERP和自动化系统专有的集成,也投资开放式集成,还投资仪表板和移动技术,希望随时随地为需要正确信息的决策者提供衡量标准。
制造业大数据分析的三种途径
途径一,利用开放技术与平台,将任何系统的数据移动到任何其他地方。
制造运作管理系统建设项目是系统工程,不仅仅是一套我们理解的传统软件系统,更多的是项目执行和服务的平台。这需要在项目管理与制造企业的策略“客户服务”上,体现出制造企业的综合管理能力与软实力。
整个平台要从前期、工程实施以及售后服务这三个大的阶段来架构。在前期规划中,要重视标准、设计与实施,特别是与管理一体化的信息系统形成统一的对接。有了前期统一规划的制定,工程实施的环节可把行业的经验、集成能力、实施能力、软件开发能力等融合。特别需要在组织上建立和形成超级团队的制度。而持续服务、长期经营,将物联网应用融入与“软件+云服务”的互联网+战略是后续服务的考虑重点。
在制造业大数据分析工作中,必须要加强通过物联网科技的应用对后续持续服务的支撑作业。通过工业物联网,实现的及时响应客户、物联网软硬件系统定期巡检、提供应急备件、提供易耗品、完善应用等功能来加强和锁定与企业的供应链企业之间的长期合作。通过管理平台与物联网数据,可以持续为客户提供有价值的服务。
途径二,投资工厂内外系统架构堆栈中能够处理结构性和非结构性数据的数据模型。
新技术是创新革命的核心,其中很重要一个特点就是集成,即制造运作管理系统MOM与ERP、EAM、OA、商业分析的集成,包括一键登录、界面集成、消息推送、工作流集成、主数据、应用集成总线与平台。
由于这些系统之间主数据全部统一,所有系统之间的数据交互依靠应用系统总线进行数据交互,整合了跨系统的业务流程、工作流、服务流程等之后即实现无缝集成和分析。对于企业管理者来说,一键登录后,可以根据不同的岗位,个性化制定并且显示与管理最相关的必要信息。这就是互联网所带给我们的分享思路。
途径三,通过时间序列、图像、视频、机器学习、地理空间、预测模型、优化、模拟和统计过程控制等先进的分析工具与制造业企业内的大数据平台结合分析,从而洞见尚未显现的情况。通过传感器、感应器、传输网络和应用软件等物联网数据,与管理应用软件结合起来,将是今后制造业大数据分析的一大方向。
培养企业内部大数据分析专家
作为一个行业,我们需要有机地发展行业特定的大数据分析工具集,这样才能让现在的行业专家,从足够的数据科学中实现数字化转型。为了推动转型,我们需要一大批优秀的企业利用这种方法,并向其他人或同行证明其价值。
‘柒’ 怎样用大数据解决生活中的问题
大数据是一种量大、增长速度快、品类多、价值密度低的数据。新一代信息系统架构和技术,用于对大量、分散的、各种格式的数据进行相关收集、存储和分析。
大数据的形式包括文字、图片、视频等,其多样化的形式可以帮助人们挖掘有价值的信息。
1、大数据解决生活中的问题——应用于能源
随着工业化进程的加快,大量温室气体的排放,全球气候发生了变化,因此推动低碳环保显得尤为重要。将大数据技术应用到能源领域可以为低碳做出巨大贡献。低碳能源大数据主要由能源信息采集、能源分布式运行、能源数据统计分析、能源调度四个模块组成。通过这四个模块,可以科学、自动、高效地实现能源生产和能源管理,实现节能。
2、大数据解决生活中的问题——医学应用
大数据在医疗领域的应用主要是通过收集和分析大数据进行疾病的预防和治疗。患者佩戴大数据设备后,该设备可以收集有意义的数据。通过大数据分析,可以监测患者的生理状态,从而帮助医生及时、准确、有效地治疗患者。据新华网报道,大数据分析可以让我们在几分钟内解码整个DNA,找到新的治疗方法,更好地理解和预测疾病模式。
3、大数据解决生活中的问题——对于金融业来说
大数据在金融业的主要应用是金融交易。许多股权交易都是使用大数据算法进行的,大数据算法可以快速决定是否出售商品,使交易更加简洁和准确。在这个大数据时代,把握市场机遇,快速实现大数据商业模式创新显得尤为重要。
4、大数据解决生活中的问题——应用于地理信息
地理信息系统(GIS)需要及时处理相关的空间信息,以及存储的大量数据和工作任务。将大数据技术合理地应用到地理信息系统中,不仅可以及时处理地理信息,而且可以提高处理结果的准确性。
5、大数据解决生活中的问题——应用于消费
为了在未来的市场中站稳脚跟,建立大数据库,充分利用大数据技术显得尤为重要。淘宝、京东等企业将通过大数据技术自动记录用户交易数据,对用户信用进行分析和记录,形成长期庞大的数据库,为后续金融业务布局提供征信和风控数据。
6、大数据解决生活中的问题——应用于制造业
大数据影响生产力,使机器设备在应用中更加智能化、自主化,使生产过程更加简洁、准确、安全,提高生产能力。此外,大数据技术可以帮助企业了解客户的偏好,从而生产出市场需要的产品。
你认为大数据已经在我们的生活中无处不在了吗?在不久的将来,大数据的应用将使我们的生活更美好。
如何用大数据解决生活中的问题?这几个应用才是大数据工程师关注的,大数据是一种量大、增长速度快、品类多、价值密度低的数据。存储和分析的新一代信息系统架构和技术,可以点击本站的其他文章进行学习。
‘捌’ 如何建设工业大数据可视化系统
1. 深圳市儿童医院成功部署IBM集成平台与商业智能分析系统
IBM利用其行业领先的大数据与分析技术,支持深圳市儿童医院搭建信息集成平台,整合原有分散在多系统中的海量数据,实现各部门的信息共享;同时通过商业智能分析对集成数据进行深入挖掘,为医院各部门人员的科学决策提供全面的辅助,提升医院的服务水平和管理能力。
2. Informatica帮助紫金农商银行深挖数据价值
紫金农商银行ODS数据仓库项目建设使用Informatica产品完成数据的加载、清洗、转换工作显得尤为简单,图形化、流程化设计使维护人员能够快速、顺畅的操作,即使数据源结构发生变化,也不会像以前必须修改大量的程序代码,只需要在PowerCenter中配置一下即可。
3. 华为大数据一体机服务于北大重点实验室
经过大量的前期调查,比较和分析准备工作,北大重点实验室选择了华为基于高性能服务器RH5885 V2的HANA数据处理平台。HANA提供的对大量实时业务数据进行快速查询和分析以及实时数据计算等功能,在很大程度上得益于华为RH5885 V2服务器的高可靠、高性能和高可用性的支撑。
4. IBM携手汉端科技为飞鹤乳业打造全产业链可追溯体系
IBM、汉端科技与中国飞鹤乳业联合宣布,通过利用IBM业界领先的全面大数据与分析能力,和汉端科技在商业智能领域丰富的行业经验,飞鹤乳业实现了产品的可追溯与食品安全的数字化管理,完成了系统数字化、透明化、服务化的升级。
5. 浪潮大数据平台大大提升了济南的警务工作能力
浪潮在帮助济南公安局在搭建云数据中心的基础上构建了大数据平台,以开展行为轨迹分析、社会关系分析、生物特征识别、音视频识别、银行电信诈骗行为分析、舆情分析等多种大数据研判手段的应用,为指挥决策、各警种情报分析、研判提供支持,做到围绕治安焦点能够快速精确定位、及时全面掌握信息、科学指挥调度警力和社会安保力量迅速解决问题。
6. 英特尔携杭州诚道科技构建智能交通
面对大数据挑战,杭州市和杭州诚道科技有限公司紧密合作,部署了基于英特尔大数据解决方案的诚道重点车辆动态监管系统,通过集中的数据中心将全市卡口、电子警察、视频监控、流量检测设备、信号机、诱导设备等有效地连接起来,从交通案件侦破能力、交通警察对机动车辆的监管能力到利用关联车辆的数据分析能力,都得到了极大提升。
7. 步步高集团借Oracle Exadata 大大提高了IT投资回报率
步步高集团采用 Oracle Exadata数据库云服务器搭建信息化平台,凭借Oracle Exadata数据库云服务器的高扩展性、安全性和冗余性,步步高集团得以在该基础架构上运行一系列Oracle零售行业以及Oracle的应用软件。此外,基于Oracle Exadata的步步高IT新架构比传统架构拥有更好的性价比,最大限度地增加了IT的投资回报率。
8. 华为Anti-DDoS助阿里巴巴检测DDoS变革
阿里巴巴现网多个数据中心出口都部署了华为的Anti-DDoS解决方案,平均每天防护的DDoS攻击次数超过100次,每年达数万次,峰值防护的DDoS攻击流量超过100Gbps。如今,DDoS攻击在阿里巴巴安全工程师眼里已经习以为常,由华为Anti-DDoS方案自动调度进行清洗防护即可。“双11”期间,华为Anti-DDoS方案一如既往地成功防护了多轮DDoS攻击事件,有力保障了阿里巴巴网络交易的顺畅平稳。
9. 华为大数据方案在福建移动的应用
为进一步提升外呼成功率,从2014年初开始,福建移动联合华为公司开展基于大数据的精准营销工作,采用大数据分析的方法选择外呼目标价值用户。基于大数据分析方法和传统外呼方法分别提供20万目标客户清单,在前台无感知下进行对比验证,确保对比效果不受人为因素影响,经过外呼验证,基于大数据分析方法较传统方法外呼成功率提升50%以上,有效支撑了福建移动4G用户发展战略。
10. 北京市人民政府“12345”便民电话中心选择Oracle Exadata 实现便携服务
为了进一步提升部门的调度能力、办理水平和群众满意度,北京市人民政府“12345”便民电话中心选择Oracle Exadata数据库云服务器,升级成为北京市非紧急救助服务综合受理调度平台,通过Oracle Exadata Database Machine支撑起新平台的数据库访问需求。升级后的平台能够整合全市的便民呼叫服务,支撑来自群众的各类诉求、求助、批评和建议,并可为公众提供方便、快捷的公共信息服务,真正成为全市的舆情中心、信息汇集中心和城市名片。
11. 民生银行借IBM BigInsights应对金融业的大数据挑战
IBM BigInsights大数据解决方案和企业级NoSQL数据库SequoiaDB合作,为民生银行搭建低成本、高性能、高可靠且水平扩张的数据平台,帮助民生银行通过大数据分析应对金融业的大数据挑战,完善交易流水查询分析系统,产业链金融管理系统,以及私人银行产品货架管理系统。
12. 中信银行信用卡实施EMC Greenplum 数据仓库解决方案
中信银行信用卡中心选择实施EMC Greenplum 数据仓库解决方案。Greenplum 数据仓库解决方案为中信银行信用卡中心提供了统一的客户视图,借助客户统一视图,中信银行信用卡中心可以更清楚地了解其客户价值体系,从而能够为客户提供更有针对性和相关性的营销活动。基于数据仓库,中信银行信用卡中心现在可以从交易、服务、风险、权益等多个层面分析数据。通过提供全面的客户数据,营销团队可以对客户按照低、中、高价值来进行分类,根据银行整体经营策略积极地提供相应的个性化服务。
13. 惠普助力雅昌集团掘金大数据
成立于1993年的雅昌集团首创“传统印刷+IT技术+文化艺术”的商业模式,形成环环相扣的文化产业链,为艺术市场提供全面、综合的一站式服务。基于企业内容数据管理体系,惠普为雅昌搭建了从数据采集、处理、管理到应用的全过程处理流程,使雅昌可以快速利用所需数据,缩短新品上线时间,快速响应市场变化。
14. 德国足球队采用SAP大数据方案迎战世界杯
德国足协和SAP公司通过联合创新引入SAP Match Insights解决方案,该方案基于SAP HANA平台运行处理海量数据,可以为球员和教练提供一个简明的用户界面,帮助双方开展互动性更强的对话,分析球队训练、备战和比赛情况,从而提升球员和球队的成绩。
15. 1号店借Oracle Exadata改善终端客户体验
1号店采用Oracle Exadata数据库云服务器成功优化统一整合的数据平台,满足了不断增长的业务处理需求,并进一步改善了终端客户体验。经过Oracle Exadata整合后的新平台采用混合负载互备架构,将平均处理性能提升7倍,既可以支持目前规划业务量的业务处理,还能够随着业务量的增长进行在线升级、扩容,满足处理能力和数据量的增长需求。软、硬件集成设计的Oracle Exadata 协助解决了1号店的I/O瓶颈问题,实现了比传统架构更高的性能和可扩展性。同时,基于Exadata的1号店IT新架构比传统架构拥有更好的性价比,最大限度地发挥了IT投资回报率。
16. 大数据在青岛银行:提升银行交易性能、简化运营和管理
利用IBM大数据专家PureData,青岛银行能够高效集成业务数据,简化运维。PureData for Transactions作为青岛银行重要业务处理系统,能够在一个系统中整合超过几十个数据库,同时提供良好的性能、可用性和可扩展性支持实现广泛的业务目标,例如地域扩张,突发的业务交易高峰,新柜面、流程银行等大规模的业务上线等。
17. Informatica方案帮助南京儿童医院实现信息互通共享
南京市儿童医院目前已建成包括HIS、LIS、PACS、电子病历EMR、医生工作站、移动护理、病案、财务管理、库房管理和手术麻醉等几十个应用系统,这些异构系统间数据调用分散,不能集中统一标准化管理。通过采用Informatica ETL工具构建数据仓库系统,并基于数据仓库建设医院数据调用公共资源中心库,南京市儿童医院实现了实时的数据交互和信息共享,干净、标准的数据为跨应用系统数据关联分析打下扎实基础。
18. 东吴大学采用达索系统EXALEAD启动大数据应用暨产学合作
台湾东吴大学采用达索系统EXALEAD大数据智能应用开发解决方案,全方位地整合校务信息,积极开发校务经营发展的各项应用。此外还将启动三方产学合作计划,协助建立校内大数据相关课程、人才培训和实习机制,使学生自入学就开始不断提升其未来职场所需的关键竞争力,学用合一,实现学校、学生、企业三赢。
19. 网络大脑PK人脑 大数据押高考作文题
为了帮助考生更好地备考,网络高考作文预测通过对过去八年高考作文题及作文范文、海量年度搜索风云热词、历年新闻热点等原始数据与实时更新的“活数据”进行深度挖掘分析,以“概率主题模型”模拟人脑思考,反向推导出作文主题及关联词汇,为考生预测出2014年高考作文的六大命题方向。
20. IBM助力同仁医院构筑强大的分析体系
同仁医院通过与IBM合作,同仁医院建立起了强大的分析能力和体系,包括对临床、运营、科研、考核等信息的分析,实现智慧的医院管理与考核;同时也能看到医疗设备的平均故障间隔周期,从而降低了设备的故障率、平均维修时间。这一切都让工作效率稳步提升,也缓解了病人看病难的问题,提高了患者就医满意度。
21. 微软助上海市浦东新区卫生局更加智能化
作为上海市公共卫生的主导部门,浦东新区卫生局在微软SQL Server 2012的帮助之下,积极利用大数据,推动卫生医疗信息化走上新的高度:公共卫生部门可通过覆盖区域的居民健康档案和电子病历数据库,快速检测传染病,进行全面的疫情监测,并通过集成疾病监测和响应程序,快速进行响应。与此同时,得益于非结构化数据的分析能力的日益加强,大数据分析技术也使得临床决策支持系统更智能。
22. 湖南电信通过分析掌握电信市场动向、针对性定制营销计划
利用IBM大数据专家PureData,湖南电信实现了通过分析掌握市场整体经营情况、快速制定市场策略以及加强客户经理营销维系的高效执行。PureData for Analytics作为湖南电信本地数据集市建设工程重要组成部分,高效整合了湖南电信旗下各本地网数据,为进一步分析创造先机。
23. 携程借SQL Server增强了数据采集和掌控
作为国内领先的综合性旅行服务公司,携程计算机技术有限公司曾面临分支机构、服务城市和员工数量的增长所带来的运营数据分散和数据集成难的 IT 问题。借助微软SQL Server 2012 商业智能解决方案,携程增强了其对所有下属分支机构的数据采集和掌控,大大减少了计划性停机时间以及非计划性停机的时间,灵活的部署选项也可以根据携程的需要实现从服务器到云的扩展。
24. 上海公共研发平台部署Oracle Exadata应对扩展需求
上海公共研发平台部署Oracle Exadata数据库云服务器,以应对其系统和应用的扩展需求。Oracle Exadata融合了一系列同类最佳的预配置的服务器、网络、存储和软件,能为数据仓库和在线事务处理应用程序提供超强性能。上海公共研发平台运行Oracle Exadata期间相对稳定,CPU占用率控制在5%以内,极大改善了用户应用体验。同时,Exadata平台的可扩展性极好的满足了上海公共研发平台的系统需求,目前整个公共研发平台的20多个应用系统已经全部迁移到Exadata上,应用部署量增长1倍,且运行十分稳定。
25. 360手机卫士10KB解决iPhone骚扰
360手机卫士通过对海量数据的运算和精准匹配下发,将一组大小仅为10KB的数据即1000个骚扰号码同步到用户手机上,打造个性化的骚扰号码数据库,此外,每天更新的骚扰号码库数据,会依据标记趋势调整骚扰号码库中各类数据比例,即每一位360手机卫士用户手机中的1000个骚扰号码都是动态的,随地域、身份以及骚扰趋势的变化而变化。
26. 神州数码助张家港市更“智慧”
在张家港实践的城市案例中,市民登录这款“神州数码”研发的市民公共信息服务平台后,市民只要凭借自己的身份证和密码,即可通过该系统平台进行240余项“在线预审”服务、130余项“网上办事”服务等,还可通过手机及时查看办事状态。相比于以前来说,市民办事的时间最少可以节省一半以上。
27. IBM助中网组委会构建安全和敏捷的内联网
IBM专门为中网设计了具有实时大数据分析功能的MatchTracker(赛事追踪系统),可以为球迷提供数据呈现、计分等功能。 MatchTracker基于IBM SlamTracker分析技术,使球迷能够利用历史和实时性数据,洞悉比分之后的态势和策略。此外,IBM还为中网组委会构建了安全和敏捷的内联网。
28. Cortana基于微软Bing大数据预测世界杯
微软为Cortana增加了世界杯预测的功能,基于微软Bing大数据,并综合考虑世界杯各支球队的过往比赛结果、比赛时间、天气情况、主场优势以及其他因素,使用大量的博彩市场公开数据、民意调查、社交媒体以及其它在线数据,利用大数据分析来判断每场比赛的结果。
29. 中科曙光助同济大学科研领域再创新高
为了满足爆炸式增长的用户和数据量,同济大学携手中科曙光,在全面整合云计算平台和现有资产的基础上,采用 DS800-F20存储系统、Gridview集群管理系统,以及Hadoop分布式计算平台构建出了业内领先的大数据柔性处理平台,使得同济大学在信息学科及其交叉学科研究领域迈上一个新台阶。
30. 华为助农行完成海量数据分布式处理的需求
华为向农行提供了良好的计算平台,基于华为RH2288 V2服务器的分布式并行计算集群进行测试,以及还提供了快速响应客户需求的研发能力,以及业界最快捷的售后服务。农行的测试结果表明,华为解决方案完全满足农行对海量数据进行分布式处理的要求。
‘玖’ 工业大数据应用难点有
工业大数据应用难点有下面这些:
一是大数据技术的运用困难,存在数据不足、数据信噪比低以及数据分析难度高等问题;
二是大数据给信息安全带来新挑战,如工业大数据加大了隐私泄露的风险,对现有存储和安全措施提出了更高要求,以及大数据正在被运用到新的攻击手段中;纯升
此一词语在2012年随着工业4.0的概念而出现,也和信息技术行销流行的大数据有关,工业大数据也意味着工业设备产生的大量数据有其潜在的商业价值。工业大数据会配合工业互联网的技术,利用原始资料来支援管理上的决策,例如降低维护成本以及提升对客户的服务。
工业大数据是指在工业领域中,围绕典型智能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所产生的各类数据及相关技术和应用的总称。
其以产品数据为核液蠢心,极大延展了传统工业数据范围,同时还包括工业大数据相关技术和应用。其主要来源可分为以下三类:第一类是生产经营相关业务数据。第二类是设备物联数据。第三闹裤陪类是外部数据。
‘拾’ 大数据应用须解决三大关键点
大数据应用须解决三大关键点
大数据应用的关键点是数据来源、产品化和价值创造;数据资源分布不均,大数据应用在数据密集领域更易获得突破;须对不当的行业管理模式进行改革,以促进大数据在已有各个行业中应用。
大数据贵在应用。当前,在国家层面,国务院出台《促进大数据发展行动纲要》;在地方层面,大数据被作为区域发展战略引擎;在企业层面,各类大数据概念公司方兴未艾、蓬勃发展。我们独关注大数据应用,关注数据从哪里来、数据怎么用、成果谁买单,也就是数据来源、产品化和价值创造三个关键点。一个好的大数据应用,从技术上可能很复杂,但从业务模式上应当简单、直白、管用。我们还关注,是否存在若干"数据密集型"行业或领域,大数据应用在这些领域可能更容易开展。在产业政策方面,我们关注作为新兴业态的大数据,过去屡试不爽的做法,如给地、给钱、给项目等,是否还会继续有效?
大数据应用的三个关键点
国务院《促进大数据发展行动纲要》(简称《大数据纲要》)将大数据定位为"新一代信息技术和服务业态",赋予大数据"推动经济转型发展""重塑国家竞争优势""提升政府治理能力"的战略功能,并将数据界定为"国家基础性战略资源"。在应用方面,《大数据纲要》在公共领域提出许多发展方向,如宏观调控科学化、政府治理精准化、商事服务便捷化、安全保障高效化、民生服务普惠化;在产业层面,主要按行业领域划分为工业大数据、新兴产业大数据、农业农村大数据、万众创新大数据,以及大数据产品体系和大数据产业链。这些方向,只是大数据应用的潜力和空间,能不能应用起来,能不能发挥作用,还得看有没有可行模式和实际效果。无论是在公共领域还是在产业层面,大数据应用都离不开数据来源、处理技术和方法、创造价值的模式,这是我们关注的重点。概括来说,需要回答下面三个看似简单、却是关键的问题。(一)数据从哪里来关于数据来源,普遍认为互联网及物联网是产生并承载大数据的基地。互联网公司是天生的大数据公司,在搜索、社交、媒体、交易等各自核心业务领域,积累并持续产生海量数据。物联网设备每时每刻都在采集数据,设备数量和数据量都与日俱增。这两类数据资源作为大数据金矿,正在不断产生各类应用。国外关于大数据的成功经验介绍,大多是这类数据资源应用的经典案例。还有一些企业,在业务中也积累了许多数据,如房地产交易、大宗商品价格、特定群体消费信息等。从严格意义上讲,这些数据资源还算不上大数据,但对商业应用而言,却是最易获得和比较容易加工处理的数据资源,也是当前在国内比较常见的应用资源。在国内还有一类是政府部门掌握的数据资源,普遍认为质量好、价值高,但开放程度低。《大数据纲要》把公共数据互联开放共享作为努力方向,认为大数据技术可以实现这个目标。实际上,长期以来政府部门间信息数据相互封闭割裂,是治理问题而不是技术问题。面向社会的公共数据开放愿望十分美好,恐怕一段时间内可望不可及。在数据资源方面,国内"小数据""中数据"应用并不充分,试图一步跨入大数据时代,借机一并解决前期信息化过程中没能解决的问题,前景并不乐观。另外,由于中国互联网公司业务主要在国内,其大数据资源也不是全球性的。数据从哪里来是我们评价大数据应用的第一个关注点。一是要看这个应用是否真有数据支撑,数据资源是否可持续,来源渠道是否可控,数据安全和隐私保护方面是否有隐患。二是要看这个应用的数据资源质量如何,是"富矿"还是"贫矿",能否保障这个应用的实效。对于来自自身业务的数据资源,具有较好的可控性,数据质量一般也有保证,但数据覆盖范围可能有限,需要借助其他资源渠道。对于从互联网抓取的数据,技术能力是关键,既要有能力获得足够大的量,又要有能力筛选出有用的内容。对于从第三方获取的数据,需要特别关注数据交易的稳定性。数据从哪里来是分析大数据应用的起点,如果一个应用没有可靠的数据来源,再好、再高超的数据分析技术都是无本之木。(二)数据怎么用数据怎么用是我们评价大数据应用的第二个关注点。大数据只是一种手段,并不能无所不包、无所不用。我们关注大数据能做什么、不能做什么,现在看来,大数据主要有以下几种较为常用的功能。追踪。互联网和物联网无时无刻都在记录,大数据可以追踪、追溯任何一个记录,形成真实的历史轨迹。追踪是许多大数据应用的起点,包括消费者购买行为、购买偏好、支付手段、搜索和浏览历史、位置信息,等等。识别。在对各种因素全面追踪的基础上,通过定位、比对、筛选,可以实现精准识别,尤其是对语音、图像、视频进行识别,使可分析内容大大丰富,得到的结果更为精准。画像。通过对同一主体不同数据源的追踪、识别、匹配,形成更立体的刻画和更全面的认识。对消费者画像,可以精准推送广告和产品;对企业画像,可以准确判断信用及风险。提示。在历史轨迹、识别和画像基础上,对未来趋势及重复出现的可能性进行预测,当某些指标出现预期变化或超预期变化时给予提示、预警。以前也有基于统计的预测,大数据大大丰富了预测手段,对建立风险控制模型有深刻意义。匹配。在海量信息中精准追踪和识别,利用相关性、接近性等进行筛选比对,更有效率地实现产品搭售和供需匹配。大数据匹配功能是互联网约车、租房、金融等共享经济新商业模式的基础。优化。按距离最短、成本最低等给定的原则,通过各种算法对路径、资源等进行优化配置。对企业而言,提高服务水平、提升内部效率;对公共部门而言,节约公共资源、提升公共服务能力。当前许多貌似复杂的应用,大都可以细分成以上几种类型。例如,贵州推行的"大数据精准扶贫项目",从大数据应用角度,通过识别、画像,可以对贫困户实现精准筛选和界定,找准扶贫对象;通过追踪、提示,可以对扶贫资金、扶贫行为和扶贫效果进行监控和评估;通过配对、优化,可以更好地发挥扶贫资源的作用。这些功能也并不都是大数据所特有的,只是大数据远远超出以前的技术,可以做得更强大、更精准、更快、更好。(三)成果谁买单成果谁买单是我们评价大数据应用的第三个也是最后一个关注点。道理很简单,不创造价值的应用不是好应用。我们关注大数据的应用是否实实在在地提升了能力、改善了绩效。如果大数据用于自身的产品设计、营销推广、资源配置,那就看企业竞争力是不是提升了,看企业最终是不是比以前更赚钱了。如果大数据用于为第三方提供服务,那就看是不是有人愿意付费、愿意持续付费。但如果是用于公共领域,还要看政府或公共部门的付费值不值,不仅仅是从出资方的视角看值不值,还要从老百姓的视角看值不值。当我们面对一项大数据应用时,只要简单问一问上面三个问题--数据从哪里来、数据怎么用、成果谁买单,就能揭开许多"伪装"。当然,如果经得起上述"大数据三问",也并非一定算得上优秀,却也离优秀的大数据应用不远了。寻找数据密集型领域既然大数据被视为一种资源,那就要考虑资源分布的问题。一般而言,资源分布是极不均匀的,如水、矿产、耕地、能源等自然资源;人力资源和知识的分布更是不均。大数据是否也存在分布不均的问题?发展大数据产业是否真的能弯道超车?这些问题值得深入思考。与可以探测的自然资源不同,数据资源分布难以定位和刻画。不过,可以用大数据人力资源分布状况来间接反映大数据应用在地区、行业间的差异,哪些行业、哪些地区大数据人力资源密集,这些行业和地区就可以看作是数据密集的。我们对两家主流招聘网站"前程无忧"和"智联招聘"2014年下半年以来发布的招聘信息进行筛选,得到两家网站两年来共发布相关信息涉及企业22.7万家,职位100.7万个,数据量确实足够"大"。通过分地区、分行业进行汇总分析,结果显示大数据人力资源分布极不均匀,各地区、各行业差异极大。不过,确切来说,通过招聘网站反映的是人才需求情况,并不是严格意义上的人力资源存量分布情况,但这两者是紧密相关的。从大数据相关岗位工作地来看,北京、广东、上海三地高度密集,遥遥领先于其他地区。三地相加,发布招聘信息企业数在两家网站占到52.35%和47.48%,职位数占到61.23%和56.74%。可以推测,大数据人力资源的半壁江山都集中在这三个地方,这与我们平时的直观感受是高度一致的。在这三个地方之外,我们关心是不是地方政府重视大数据产业、将大数据作为区域经济发展引擎,就可能促进人力资源集聚,就可能超越与自己相似经济发展水平的其他地区。从数据反映情况看,至少目前还看不到这样的结果,这揭示出人力资源结构是后发地区发展大数据产业最需要弥补的短板和最难克服的困难。改变一个地方人力资源构成的难度要远远大于改变地面建筑面貌,要么需要一个长期的过程,要么需要一个独特的制度。即便在同一省份内,大数据人力资源分布也极为不均。例如在广东,单深圳一市就大体占到了全省的一半。再加上广州,竟然能够达到九成。其他地方,即使经济实力不俗,但与深圳、广州相比,在大数据人力资源方面相差甚远。这再次表明,大数据人力资源分布是极不均匀的。显然,大数据人力资源密集地区发展大数据产业的基础要优于人力资源贫瘠的地区。从城市排名看,北上深广可以视作大数据人力资源需求密集的一线城市,杭州、南京、成都、武汉、西安等可以看作二线城市。大数据人力资源分布与城市经济实力、活力乃至房价水平都是大体一致的。从行业分布看,对大数据人力资源的需求分布更不均匀,主要集中在互联网、信息技术及计算机相关行业。这充分说明了大数据是互联网或IT产业的一部分,是在原有基础上的新发展。这些行业是典型的"数据密集型"行业,是大数据产业发展的摇篮。金融是另一个特别重要的"数据密集"领域。金融行业既是产生数据尤其是有价值数据的基地,又是数据分析服务的需求方和应用地。更为重要的是,金融行业具备充足的支付能力,将是大数据产业竞争的重要战场。许多大数据是通过在金融领域的应用辐射到了各个行业。除此之外,电信、专业服务(如咨询、人力资源、财会)、教育培训、影视媒体、网络游戏等,相对而言也是当前数据较为密集的行业。《大数据纲要》几乎面面俱到地对所有行业和领域都规划了大数据应用的广阔前景,但数据资源分布极为不均,在"数据密集"领域的大数据应用,取得市场成功的可能性较大。大数据需要什么样的产业政策大数据应用需要什么样的产业政策?从应用的角度来看,大数据并非一个全新的产业,而是与已有产业融合,对已有模式的改造、升级和替代。制约大数据发展的往往并不是大数据本身,而是大数据所应用的行业和领域原本存在的问题,如行业管制、行政垄断、要素不能自由流动,等等。因此,促进大数据发展,用给地、贴钱、上项目的方法,并不能解决根本问题。要从大数据应用领域角度,对不当的行业管理模式进行改革,对既有利益格局进行调整,使大数据应用具备必要的条件。即使在企业内部,大数据应用也不仅仅是个技术问题,而是涉及业务流程重组和管理模式变革,是对企业管理能力的一个考验。金融、电信、教育、影视媒体等"数据密集型"行业,既是大数据应用潜力巨大的领域,也是迫切推进行业改革的重点领域。另一方面,大数据的应用也可以为行业改革提供技术支撑,能以更有效的技术路线实现行业发展目标。
大数据应用需要的产业政策其实就是市场经济下各个行业发展所应有的政策,如放开准入、公平竞争、减轻企业负担、消除企业所有制歧视、消除企业规模歧视,等等。只有在一个开放的产业环境中,大数据才能在这些产业得以有效运用。一个地方若要在金融、医疗、教育等领域大力推动大数据运用,最管用的政策就是对这些行业进行有力的改革。