㈠ 数据分析指标有那些
用户行为类指标
用户行为指标是互联网行业和传统行业最大区别。传统行业,用户行为发生在门店里,极难用数字化手段记录,因此只有在发生交易时,才能记录数据。
传统企业的大部分数据都是交易数据。而互联网行业依托小程序/H5/APP,能记录用户在每个页面的点击,相当于在网上店铺的每一步动作都有记录,因此能分析很多东西。
具体到指标上,可以套用AARRR模型,分模块展开:
拉新:主要用于分析拉新的转化效率与质量。拉新是很多互联网公司最重要的任务,拉新成本是很多互联网公司最大的成本支出,因此拉新关注度极高。
通过这些指标的分析,能让负责商品运营的同事直观看到商品畅销/滞销情况,从而调整商品进销存计划,避免商品积压/缺货。
注意,虚拟商品原则上是没有库存的(或者说库存想设多少设多少)。但是滥发虚拟商品,又会引发互联网中通货膨胀与商品贬值。比如游戏里稀有皮肤卖的贵,是因为稀有才贵,为了短期收入搞大优惠,一但烂大街,反而大家都不稀罕了。
所以控虚拟商品的库存,不是看商品动销率或者在库时间,而是看GMV整体目标。在达成GMV整体目标情况下,高中低端商品保持一个稳定的库存结构,避免烂大街。
㈡ 你知道互联网业务数据分析常用指标有哪些吗
常用的数据指标包括三方面:用户数据、行为数据、业务数据,串成一句话即是:谁,干了什么,结果如何
可从用户来源、用户存量、用户增量、用户健康度四个常用维度去看
用户来源 :指用户来源的渠道,比如:网络自然搜索、网络关键字投放、搜狗、微信等
用户存量 :指日活DAU(Daily Active User,日活跃用户数量)、月活MAU(Monthly Active User,月活跃用户数量)等用户活跃数据。注:需要说明的是MAU不等于各日的DAU之和,需要对用户去重统计才有意义。
用户增量 :指新增用户,定义新增用户的流程节点和基于维度不同,统计出来的数据不同,在日常工作中,要和团队明确统一定义的标准,降低沟通成本
用户健康度 :可用用户留存率等指标衡量,关于留存率计算一般有三种算法
可从访问次数/频率、访问时长、访问转化、访问跳出四个常用维度去看
访问次数/频率 :可用PV(Page View,页面浏览量)、UV(Unique Visitor,独立访客量)、访问深度来呈现
PV指页面访问次数,UV指访客人数
访问深度 :用来衡量用户对产品的了解程度
访问时长 :可一定程度量化当前页面内容对用户的吸引程度。注:在处理访问时长数据时,需要注意剔除一些非常大的值,避免用户去做其他事情页面没关这种极端情况带来的干扰
访问转化 :指用户访问相关页面后,转化成注册用户、付费用户的比率
访问跳出 :可用弹出率等指标衡量页面对用户的质量,注:弹出率是基于访问次数的
可从业务总量、人均付费、人数、产品健康度四个常用维度去看
总量 :一般会用GMV(Gross Merchandise Volume,成交总额)来度量,
人均付费 :一般用ARPU(Average Revenue Per User,每用户平均收入)/ARPPU(Average Revenue Per Paying User,每付费用户带来的平均收益)
人数 :一般指付费人数
产品健康度 :衡量大多数产品健康度,看其能带来的收益,即可以用付费率、付费频次等指标来衡量
上述具体指标,在实际工作中,要根据产品的具体形态调整。比如业务数据的指标,视频产品一般就会采用观看时长来衡量总量,观看人数来度量人数这个指标
㈢ 数据质量与数据质量八个维度指标
数据质量与数据质量八个维度指标
数据的质量直接影响着数据的价值,并且直接影响着数据分析的结果以及我们以此做出的决策的质量。质量不高的数据不仅仅是数据本身的问题,还会影响着企业经营管理决策;错误的数据还不如没有数据,因为没有数据时,我们还会基于经验和基于常识的判断来做出不见得是错误的决策,而错误的数据会引导我们做出错误的决策。因此数据质量是企业经营管理数据治理的关键所在。
数据的质量可以从八个方面进行衡量,每个维度都从一个侧面来反映数据的品相。八个维度分别是:准确性、真实性、完整性、全面性、及时性、即时性、精确性和关联性。
我们在比较两个数据集的品相的时候往往采用这种图形表示。比如说,常规来讲内部数据采集的准确性、真实性、完整性高,而全面性、及时性、即时性、精确性和关联性方面取决于企业内部对数据的重视程度以及采用的技术手段的先进性有关;外部数据集,比如说微博数据、互联网媒体数据等,其全面性、及时性和即时性都可以通过技术手段,如网络爬虫等得到提高,但在准确性、真实性、精确性上难以保证,也难以控制,在关联性方面取决于数据采集和挖掘的相关技术。
我们也可以用这个模型来衡量公司内部各个职能部门数据的品相。下图是个示意,通过数据质量8大指标的评价,我们可以对企业内部数据治理有针对性地采取措施去提高企业的数据质量。
数据的准确性
数据的准确性(Accuracy)是指数据采集值或者观测值和真实值之间的接近程度,也叫做误差值,误差越大,准确度越低。数据的准确性由数据的采集方法决定的。
数据的精确性
数据的精确性(Precision)是指对同一对象的观测数据在重复测量时所得到不同数据间的接近程度。精确性,也可以叫精准性。精确性与我们数据采集的精度有关系。精度高,要求数据采集的粒度越细,误差的容忍程度越低。
测量人的身高,我们可以精确到厘米,多次测量差异只会在厘米级别;测量北京到上海的距离,我们精确到公里,多次测量结果间的差异会在公里级别;采用游标卡尺测量一个零件的厚度,可以精确到1/50毫米,多次测量的结果间的误差也只会在1/50毫米间。采用的测量方法和手段直接影响着数据的精确性。
数据的真实性
数据的真实性,也叫数据的正确性(Rightness)。数据的正确性取决于数据采集过程的可控程度,可控程度高,可追溯情况好,数据的真实性容易得到保障,而可控程度低或者无法追溯,数据造假后无法追溯,则真实性难以保证。
为了提高数据的真实性,采用无人进行过程干涉的智能终端直接采集数据,能够更好地保证所采集数据的真实性,减少人为干预,减少数据造假,从而让数据更加正确地反应客观事物。
数据的及时性
数据的及时性(In-time)就是数据能否在需要的时候得到保证。我们月初会对上个月的经营和管理数据进行统计汇总,这些数据能否及时处理完成,财务能否在月度关账后及时核算。数据的及时性是我们数据分析和挖掘及时性的保障。如果公司的财务核算复杂,核算速度缓慢,上个月的数据在月中才能统计汇总完成,等需要调整财务策略的时候,已经到了月底了,一个月已经快过完了。特别是公司做大了之后,业务覆盖多个市场、多个国家,数据不能及时汇总,会影响到高层决策的及时程度。
数据的及时性与企业数据处理的速度和效率有直接的关系,为了提高数据的及时性,越来越多的公司采用管理信息系统,并在管理信息系统中附加各种自动数据处理功能,能够在数据上传系统之后自动完成绝大部分报表,从而保证数据处理的效率。计算机自动处理中间层数据是提高企业数据处理效率的有效手段。
除了保证数据采集的及时性和数据处理的效率问题外,还需要从制度和流程上保证数据传输的及时性。数据报表完成了,要及时或者在要求的时间范围内发送到指定的部门,或者上传到指定的存储空间。
数据的即时性
数据的即时性是指数据采集时间节点和数据传输的时间节点,一个数据在数据源头采集后立即存储,并立即加工呈现,就是即时数据,而经过一段时间之后再传输到信息系统中,则数据即时性就稍差。
微博的数据采集,当用户发布了微博,数据立即能够被抓取和加工,会生成即时微博数据报告,并随着时间推移,数据不断变化,我们可以称作是即时采集和处理的。一个生产设备的仪表即时反应着设备的温度、电压、电流、气压等数据,这些数据生成数据流,随时监控设备的运行状况,这个数据可以看作是即时数据。而当设备的即时运行数据存储下来,用来分析设备运行状况与设备寿命的关系,这些数据就成为历史数据。
数据的完整性
数据的完整性是从数据采集到的程度来衡量的,是应采集和实际采集到数据之间的比例。一条信息采集12个数据点,如我们采集员工信息数据的时候,要求填写姓名、出生日期、性别、民族、籍贯、身高、血型、婚姻状况、最高学历、最高学历专业、最高学历毕业院校、最高学历毕业时间等12项信息,而某一员工仅仅填写了部分信息,如只填写了其中的5项,则该员工所填写数据的完整性只有一半。
一个公司数据的完整性体现着这个公司对数据的重视程度。要求采集数据而实际上并未完整采集,只采集了一部分,这就是不完整的,往往是公司对数据采集质量要求不到位导致的。公司要求每个人都填写完整的个人信息表,而有部分员工拒绝填写,公司2000员工,只有1200人填写了完整的个人信息表,则这个数据集就是不完整的。
另外,对于动态数据,我们可以从时间轴上去衡量数据采集的完整性。比如,我们要求每小时采集一次数据,每天会形成24个数据点,记录为24条数据,但是员工渎职,只记录了20次,那么这个数据集也是不完整的。
数据的全面性
数据的全面性和完整性不同,完整性衡量的是应采集和实际采集的差异。而全面性指的是数据采集点的遗漏情况。比如说,我们要采集员工行为数据,我们只采集了员工上班打卡和下班打卡的数据,上班时间的员工行为数据并未采集,或者没有找到合适的方法来采集。那么,这个数据集就是不全面的。
我们描述一个产品的包装,仅仅描述了产品包装的正面和背面,没有记录产品包装的侧面,则就是不全面的。我们记录一个客户的交易数据,我们只采集了客户订单中的产品、订单中产品的价格和数量,而没有采集客户送货地址、采购时间,这个数据采集就是不全面的。
腾讯QQ和微信的用户数据记录了客户交流沟通的数据;阿里和京东的用户数据记录了用户的购买交易数据;网络地图记录了用户出行的数据;大众点评和美团记录了客户餐饮娱乐的数据。对于全面描述一个人的生活的衣食住行各方面,这些公司的数据都是不全面的,而如果把他们的数据整合起来,则会形成更加全面的数据。所以说,数据的全面性说一个相对的概念。过度追求数据的全面性说不现实的。
数据的关联性
数据的关联性是指各个数据集之间的关联关系。比如员工工资数据和员工绩效考核数据是通过员工这个资源关联在一起来的,而且绩效数据直接关系到工资的多少。采购订单数据与生产订单数据之间通过物料的追溯机制进行关联,而生产订单又是由员工完成的,即通过员工作业数据与员工信息数据关联起来。
其实,我们本书探讨的企业大数据,每个数据集都是相关关联的,有些是直接关联的,比如员工工资数据和员工绩效数据,有些是间接关联的,比如说物料采购订单数据与员工工资数据。这些数据的关联关系是由公司的资源,包括人、财、物和信息等,连接起来的。如果有任何的数据集不能连接到其他的数据集,就会存在数据割裂或者数据孤岛。数据割裂和数据孤岛是企业数据关联性不足导致的。而数据的关联性直接影响到企业数据集的价值。
㈣ 什么是指标、维度、度量
维度是描述事情的角度,依赖于指标,例如:年份是时间维度,北京是地理维度,月活是业务维度。
指标是一数值或者比例,通过某种计算得到的,用来衡量业务。例如好评量、好评率、增长率。
维度是用来说明数据,即对象的描述性属性或特征。例如,宽度指的是用户群的覆盖范围大小。
1、指标
指标,用于衡量事物发展程度的单位或方法,它还有个IT上常用的名字,也就是度量。例如:人口数、GDP、收入、用户数、利润率、留存率、覆盖率等。很多公司都有自己的KPI指标体系,就是通过几个关键指标来衡量公司业务运营情况的好坏。
指标需要经过加和、平均等汇总计算方式得到,并且是需要在一定的前提条件进行汇总计算,如时间、地点、范围,也就是我们常说的统计口径与范围。
指标可以分为绝对数指标和相对数指标,绝对数指标反映的是规模大小的指标,如人口数、GDP、收入、用户数,而相对数指标主要用来反映质量好坏的指标,如利润率、留存率、覆盖率等。我们分析一个事物发展程度就可以从数量跟质量两个角度入手分析,以全面衡量事物发展程度。
刚才说过,指标用于衡量事物发展程度,那这个程度是好还是坏,这就需要通过不同维度来对比,才能知道是好还是坏。
2、维度
维度:是事物或现象的某种特征,如性别、地区、时间等都是维度。其中时间是一种常用、特殊的维度,通过时间前后的对比,就可以知道事物的发展是好了还是坏了,如用户数环比上月增长10%、同比去年同期增长20%,这就是时间上的对比,也称为纵比;
另一个比较就是横比,如不同国家人口数、GDP的比较,不同省份收入、用户数的比较、不同公司、不同部门之间的比较,这些都是同级单位之间的比较,简称横比;
维度可以分为定性维度跟定量维度,也就是根据数据类型来划分,数据类型为字符型(文本型)数据,就是定性维度,如地区、性别都是定性维度;数据类型 为数值型数据的,就为定量维度,如收入、年龄、消费等,一般我们对定量维度需要做数值分组处理,也就是数值型数据离散化,这样做的目的是为了使规律更加明 显,因为分组越细,规律就越不明显,最后细到成最原始的流水数据,那就无规律可循。
最后强调一点,只有通过事物发展的数量、质量两大方面,从横比、纵比角度进行全方位的比较,我们才能够全面的了解事物发展的好坏。
㈤ 数据分析的几个维度
数据分析需要5个维度。分别是用户维度、运营维度、产品维度、市场维度、经营者维度。从这茄镇慧几个维度出发对数据进行一个全面的分析,所谓维度,即事物旅缺的某种特征,比如:时间、性别、地区等。颤答
㈥ 数据分析包括哪些方面
1. Analytic Visualizations(可视化分析)不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观的展示数据,让数据自己说话,让观众听到结果。
2. Data Mining Algorithms(数据挖掘算法)可视化是给人看的,数据挖掘就是给机器看的。集群、分割、孤立点分析还有其他的算法让我们深入数据内部,挖掘价值。这些算法不仅要处理大数据的量,也要处理大数据的速度。
3. Predictive Analytic Capabilities(预测性分析能力)数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断。
4. Semantic Engines(语义引擎)我们知道由于非结构化数据的多样性带来了数据分析的新的挑战,我们需要一系列的工具去解析,提取,分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。
5. Data Quality and Master Data Management(数据质量和数据管理)数据质量和数据管理是一些管理方面的最佳实践。通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。
㈦ APP数据指标体系的维度包括哪些
APP的数据指标体系主要分为五个维度,包括用户规模与质量、参与度分析、渠道分析、功能分析以用户属性分析。
用户规模和质量维度主要是分析用户规模指标,这类指标一般为产品考核的重点指标。
参与度分析主要分析用户的活跃度。
渠道分析主要分析渠道推广效果。
功能分析主要分析功能活跃情况、页面访问路径以及转化率。
用户属性分析主要分析用户特征。
㈧ app数据分析的五大维度是什么
①对app产品用户规模及质量有个清楚的了解比如,当下用户活跃程度,新增用户指标,用户组成的指标,用户存留率多少,每一位用户总活跃天数的统计等等,都是要有一个详细的了解才是。只有这样才能更好的检验app经营推广的效果,尤其是新增用户数占据的比例多少可以展现出app运营的健康状况,一旦出现新增用户降低,说明app推广上出现了问题,作为运营者得想办法解决了。
②对参与度的合理分析
如何对参与度进行分析其实并不难,它主要是指app在线启动次数指标,在线使用时长,访问页面,使用时间间隔等等。其中app在线使用时长加上启动次数和活跃数可以多维度的展示用户对产品的参与程度。
③渠道分析也必不可少
其实对app推广渠道的分析,真正的用意是研究推广所引入的客户是否是真人在使用,如果是机器刷出来的只能算作是刷量的,没有实际意义。
④app自身功能分析
app功能分析也是五大app数据分析维度中必不可少的一部分,所谓的功能分析主要从app功能活跃程度,新功能上线测试效果,页面访问路径、客户属性、成功交易等路径进行分析。
⑤客户属性分析
所谓的客户属性的分析,是针对性最强大的一个类型。如app设备终端分析,网络和运营商分析,客户所在地域分析,用户画像分析,自然属性和商业属性分析等方面,都能够测试出目标客户对app产品的关心力度。