Ⅰ 关于如何收集APP数据的思考
我们知道现在有很多的各种各种的APP,并且分布在不同的移动平台上。APP作为原生应用在安全性和性能上肯定比web应用有优势,但是有一个很大的问题就是共享性很差。我们知道在网站上产生的数据是可以被搜索引擎抓取的,这样用户可通过搜索引擎方便的找到所需要的信息。
但是app的封闭性也导致了其所产生数据的封闭性,现在大量的app数据是无法被共享的,这样数据只能被自己的用户使用,而无法向外传播。
所以就想是不是需要一个方案来手机这些数据,而收集的方式只有两种:爬虫主动抓取和被动接受。
显然目前还没看到成熟的app数据抓取方案和具体实现。
所以这里我在思考被动接受的方式是否可行。
这里有几个问题:
1、需要一个巨大的数据存储服务器
2、需要有一个数据接收规范,包括接收哪些数据,如何发送数据等
3、数据生产者,也就是app所有者愿意提供数据
4、生产者提供的数据是否有接收的必要,并不是数据越多越好好,没有意义的数据只是在浪费存储空间和带宽。
5、如何利用这些数据,暂时想到了几点:
a. 以网页形式呈现,供通用搜索引擎抓取
b. 把数据按一定的格式整理,通过专门的网站呈现出来
这些数据可以更好的共享有价值的信息,也可以帮助app拥有者更好的推广自己的产品。
Ⅱ App中的数据可以用网络爬虫抓取么
可以,你可以用抓包,然后通过代理ip的方式,让你的手机和电脑处在一个网络,然后通过发送请求的方式去获取