⑴ 大数据风控用了什么模型有效性如何
大数据风控的价值已经不用再多介绍了。这已经成为互金公司的核心竞争力,也是互金区别于传统金融的重要特征。互金公司能够为传统金融机构所不能服务的人群提供普惠金融服务,基于大数据的风控手段功不可没。通过全方位收集用户的各项数据信息,并进行有效的建模、迭代,对用户信用状况进行评价,可以决定是否放贷以及放贷额度、贷款利率 。
相比于传统金融的风控模式,大数据风控可以通过机器的大规模数据运算,完成大量用户的贷款申请审核工作,提升工作效率。传统金融的审核由人工完成,效率会相对有限;大数据风控可以针对业务运行中出现的新情况、新数据进行快速迭代,增强模型的有效性;机器和软件可以“24*365”模式工作,摆脱工作时间的限制。
互金公司发力大数据风控
目前很多互金公司都在做大数据风控,虎嗅之前的文章对BAT在消费金融业务进行盘点时总结了BAT在大数据风控方面的技术。京东也有相关的布局。
BATJ的大数据风控技术
除了BATJ这样的大公司,近年来新兴起的已经具备一定规模的互金公司也大力布局大数据风控,以网贷公司和贷款搜索平台为主,大多推出了相关的大数据风控技术体系。
国内部分网贷公司与金融搜索公司的大数据风控技术
除此之外,还涌现了不少做大数据风控技术的金融科技公司,开发大数据反欺诈模型和信用评估模型,向资金端或资产端有资源的金融企业输出技术。这类企业也不断获得资本青睐。统计显示,近四个月内,至少有8家做大数据风控技术输出的公司获得融资,其中九次方大数据、51信用卡、用钱宝都已融到B轮以上。
从BAT这样的大公司,到互金领域的创业公司,都在着力研发大数据风控技术。大数据风控的价值可见一斑。
大数据风控具体是怎样的?
大数据风控模型的构建,包含了明确模型目标、定义目标变量、确定样本、确定分析技术、构建模型、模型初步验证、数据处理、模型迭代等环节。我们专访了用钱宝CEO焦可等业内人士后发现,核心工作包括三方面,即获取数据、建立模型、模型在实践中优化、迭代。
数据的来源
对于大数据风控业务而言,数据来源主要包括几部分:
一是用户申请时提交的数据信息,如年龄、性别、籍贯、收入状况等,这些数据可以了解用户的基本情况,验证用户的身份;
二是用户在使用过程中产生的行为数据,包括资料的更改、选填资料的顺序、申请中使用的设备等,可以通过用户的行为来进行特征挖掘;
三是用户在平台上累积的交易数据,如果公司运营比较久的话,可以累积比较多的用户借款相关数据,这类数据对于判断用户信用会有很高的价值;
四是第三方数据,包括来自政府、公用事业、银行等机构的数据,以及用户在电商、社交网络、网络新闻等互联网应用上留存的数据。这类数据可以从多角度展示用户的特征,利用这些数据进行建模分析,可以找出不同特征与信用水平之间的相关性。
⑵ 数据挖掘中的异常检测
数据挖掘中的异常检测
一、实时分析需要关注的三大指标
数据化运营需要关注的指标非常多,如PV、UV、转化率、留存率等等。忽略留存、转化等结果型指标,在分钟级的实时监测中,运营主要关注网站平台的三大类数据指标:
访问用户量
访问来源
访问行为
用户访问量、访问来源和访问行为对网站平台的运营具有重要意义:
分钟级的访问量可以帮助我们了解流量的趋势,方便及时发现流量的异常;
访问来源的监测方便我们了解实时访问来源和权重,为渠道优化做准备;
访问行为的实时监测帮助我们了解用户的访问偏好,方便后期进行网站内容优化。现有的SaaS (软件即服务)产品中,将上述实时指标模块统一于一个后台页面中,这样的设计便于运营者对实时的情况一目了然、运筹帷幄。
二、通过三个案例讲透实时分析
从异常的流量峰值中发现问题
运营者一般都比较关注网站平台的PV、UV及其走势,这也是网站流量分析的基础指标。以天或者小时为颗粒度的流量分析较为粗糙,会掩盖很多时间节点上的流量波动细节。如果我们用分钟级的粒度来观察流量,又会有什么发现呢?某内容社区7月16日16:30-16:35用户访问量激增,是平时的4倍左右(如上图圆圈所示)。社区的运营人员马上就发现了这个异常值,借助[访问来源]发现该节点访问来源排第一位的是微信(mp.weixinbridge.com),然而当时并不知具体原因。在稍后的朋友圈分享的文章中发现,当时某运营大咖在一个微信群分享中推荐了该社区平台,贡献了16:30-16:35社区激增的访问量。该社区的PR果断抓住这次机会,邀请该运营大咖来该社区做知识分享,起到了非常好的传播效果。
这是通过激增流量发现合作渠道的典型案例,值得所有企业思考。反之,如果流量暴跌,甚至降为零,那么这个时候就马上检查网站/APP是否正常,以便及时修复问题。
精准投放:渠道优化与反作弊
作为一个运营人员,如果产品在各大渠道上投放了广告,则可以通过[访问来源]来时刻监测渠道的广告效果,进而确定渠道带来的访问用户量和质量。
某互联网企业近期做了系列的渠道投放测试。他们通过[访问来源]发现其中两个渠道带来的量非常少,而且价格不菲,于是短暂上线就立即撤掉了该投放。同时实时分析还可以用于反作弊,短时间、单一渠道流量暴增很可能就是刷单或者流量作弊的表现。某日上午该网站访问量连续出现两个异常高峰,且该期间绝大部分流量来自一个渠道。运营人员对此非常警觉,经排查是代理商作弊,用机器人刷量;事后该企业果断放弃该代理渠道。上述两个行为为该企业挽回了大量损失。
实时监测,让产品运营更加高效
现在互联网产品迭代的速度越来越快,产品运营需要对新上线的产品或者功能进行追踪,评估产品的效果或者市场反馈。互联网金融领域存在组团诈骗进件(进件,即购买金融产品)的情况。以某互联网金融公司为例,因为风险控制的原因会控制对外宣传的力度,每天的访问用户数基本比较稳定。某日,该互金公司上线了一个新的金融产品,公司的运营人员通过[访问用户实时走势]发现访问用户陡然增加,再通过[活跃网页]发现该产品中的某个页面的访问量特别高,经过排查确定这是该产品的漏洞,会导致公司流失大量资金,他们果断采取修复措施再重新上线。如果还是用传统的流量监测方法,可能等到两三天才能发现这个漏洞,到时候流失资金可能达几百万之巨。
三、数据驱动的精细化运营
一个产品或者运营手段从最初的“idea”到最后成型上线,运营人员需要通过数据来衡量它的表现及市场反馈。同时,从数据中发现问题,提出假设,不断升级迭代;从而形成“idea — proct – data”的良性循环,驱动业务和客户的增长。在运营的过程中,数据反馈越及时,我们迭代的速度就越快,运营的效率就越高。1.01的365次方约等于38;换言之,通过实时分析可以实现不断的、快速的小幅迭代,而这积累起来就是运营、是企业巨大的进步。
⑶ 运营主要关注什么数据指标
运营需要全面负责网店的日常运营,对网店的业绩负直接责任,主要工作就是策划如何把商品销量搞起来,产生利润。
关注两点: 产品和 顾客
怎么把产品卖给顾客呢? 关键在于: 流量(引流)、转化(优化)、用户粘性(回头购买率)
一.引流:
1.主图
2.SEO优化----免费
3.直通车、钻展、淘宝客 ----付费
4.站内和站外活动引流
二.转化:
1.产品定价 (根据市场需求和客户群体来定价,并不是越低越好,合适的定价才好)
2.产品卖点
3.详情页图片和文案
4.基础销量数据
5.评价(因为网上看不到商品质量,买家只能通过评价来评判)
三.用户粘性:
1.保证产品品质,性价比高。
2.售后服务
SEO优化:
SEO主要就是对商品标题优化,知道自己产品对应的 搜索热词,成交词,属性词 是什么,
付费推广:
直通车: 是按点击收费的,直通车用的比较多,一般商家都有使用,需要了解。
钻展: 可以设定点击收费,也可以设定按展现收费。钻展用的人比较少,一般小卖家不用。
淘宝客: 按成交收费。淘宝客用的也比较多,需要了解。
站内活动: 天天特价、淘抢购、聚划算、淘金币、淘宝试用等等
站外活动: 各大U站,折800、会员购、九块邮等等
一:影响店铺权重的数据因素基本都在下面:
运营需要了解的数据:
1.PV量(浏览量)
2.UV量(访客数)
3.人均停留时长
4.30天成交总人数
5.30天成交总金额
6.单品成交转化率
7.店铺成交转化率
8.商品动销率(有销量的商品数/上架商品总数)
9.客单价(跟同类目的竞争产品比较)
10.老客户回头购买率
11.产品和店铺的收藏量(正常收藏靠前、无收藏靠后,非正常收藏最后)
推广专员需要了解的数据:
1.UV (推广带来的顾客数量)
2.ROI(推广成交金额/推广费用)
3.直通车关键词质量得分
4.UV平均获取成本
5.点击率
6.展现量
7.推广总费用(推广还是必须要有的,你不给阿里赚钱,他干嘛给你大流量)
活动专员:
1.活动的点击率
2.活动订单比例
3.活动订单转化率
4.活动的售罄率(去库存率)(特别是KA商家,小二给你很多活动资源,你就必须给我达到一定的售罄率,要不然小二的业绩奖金谁给呢?)
客服专员:
1.旺旺平均租岩相应时间(聊天回复速度)弊雀御
2.旺旺在线时长 (并不是像QQ一样的去挂几个太阳,至少旺旺不能老不在线)
3.回复客人的数量(工作强度)
4.询单转化率
5.退货退款率(可以判断店铺服务态度、沟通技巧以及产品质量)
6.买家的评价(产品质量、服务、物流的综合表现,好的评价有多重要不用我说了)
7.发货速度
上面讲了这么多,看的云里雾里,谁能全部做好啊,全部做好就是神了。确实,全部做好就是神了,是大神。
很多数据是有关联性的,一个数据做好了,另外一个数据自然会被带动起来。其实所有的这些,只要把握好几个关键点,我相信你的店铺数据会很漂亮。
首先就是产品,一款好的产品,一款惹人爱的产品是王道,产品好了,回头客自然就多,退款自然就少,客户写的好的评价也会激起新客服的购物欲。如果这款产品你自己心里这关都过不了,那劝你还是不要做了。
还有就是美工,要好的图片,吸引眼球的主图加经典的详情页,图片做好,关联做好了,点击率肯定会高,进店人数自然会增加,人均停留时间变长,客户进来咨询的人也多了,宝贝活跃了,展现量也岁链会增加,正所谓生生相息。
活动也是助推剂,有资源,有能力的话多找找活动资源,不一定要大的活动,大的活动一般人恐怕也很难上,其他还有很多小的,免费的,或者收费很低的活动的,每次活动不求几百上千,能出几十个也好的。
一定要有个用心做事的好客服,客服很重要,直接关系到最后一步的转化和售后,自己做固然是最好的,但是一个人精力总是有限的,店铺忙的你若去做客服了,你就没有时间和精力去想怎么把店铺做的更好,怎么把好的生意维持的更久。
有好产品的同时一定要有完善的供应链,讲的高大上了一点,其实无非就是你的货卖出去了,要有充足的货源及时发货。
现在淘宝变化的是非常快,因为互联网是在不断的变化的,为了避免让大家学到错误的过时的知识,我联合淘宝上的牛人,组建了一个群,想学学习淘宝运营的小伙伴,可以来这里学习,这个群的开始的几位数字是:三四一,中间的几位数字是:三八七,最后的几个数字是:三八八,按照顺序组合起来就可以找到,我想说的是,除非你想学习这方面的知识,让自己获取运营机会,如果只是凑热闹的话,就不要来了。
还有人说刷单也和那种药,有人说刷单是仙,有的人说他是魔。人云亦云,不好评论。刷单是一种 辅助,关键你怎么用,它有太多细节、太多讲究,用的好的人爱不释手,用的不好的人谈虎色变。
一句话,开网店就必须有一款能过的了你自己这关的好产品,用心经营店铺,好的图片,好的文案,根据自己的启动资金适度推广,前期是否配合着精刷补单,那就由自己把握。
⑷ 如何进行互联网金融运营数据的分析
今天的互联网从业者比过去任何时候都重视数据,这并非是因为仅仅来自于“大数据”概念的炒作,而是因为我们可依赖的数据极大丰富,而我们可以动用的工具也相当充足。
这样,有一批立志专门从事互联网数据相关事业的朋友出现,也就不足为奇。
尽管,传统意义上的数据人才早已有之,早在人们需要进行统计分析和概率计算的时候便有精通数学的数据科学家,但互联网领域的数据人才却与之有巨大的不同。
互联网运营数据分析人才的定义
我们如何定义互联网运营数据分析人才?事实上,定义二字本身会让我觉得不安。我并不觉得要满足一定的条条框框才能算“人才”,而涉及到商业领域,许多目标的实现可以有许多不同的方法,而且殊途同归。
中国互联网市场对于数据分析人才的需求原本比对开发工程师的需求要弱,不过市场的人才供应情况更少,这个行业普遍缺乏具有系统性数据分析能力的人才。2016年,我明显感觉到这个缺口在进一步变大,原因在于突然爆发的精益创业、精益经营的需求随着经济的下滑而被激发出来。向讨要人才的情况也比15年的时候要频繁得多。
面向未来
数据分析人才的未来取决于数据分析本身的未来。最欣喜的事情是,这个未来现在正变得清晰起来,几个同方向的力量形成合力正在促进数据分析走向一个从可有可无到不可或缺的阶段。第一个力量来源于人们普遍对于数据价值的认可和重视。数据文化比过去要被更广泛的认同。经济形势的走弱也客观上促进了人们对精细化运营需求的提升,这也提升了数据的价值。第二个力量来自于可以使用的工具比过去要丰富太多,而使用难度又成倍降低。可以比较一下3年前的Omniture和现在的Google Analytics便知道这种变化的速度有多么的惊人。功能更强大但使用更简便的工具仍然在不断涌现。第三个力量来自于资本的力量,即更多的基于数据产品、工具、解决方案、大数据、人工智能的商业项目被认可和被大规模资助。第四个力量来自于连政府都在极力鼓吹和促进。第五个力量来自于国外的成功先例所起到的正向激励作用。
一直都强调,数据的革命是继互联网革命之后另一个颠覆世界的变革,现在正踩在这个变革的门线上,下一步是自然而然的走向更深远的领域,创造更大的价值,乃至创造一个前所未有的商业世界。
所以,相信任何一个阅读了这个文章的朋友,都已经做出了正确的选择。