Dec 04

设想一下以下情景:信用卡公司如何能从消费者的消费数据中检测出信用卡欺诈行为呢?类似沃尔玛这样的零售公司面对海量的产品该如何定价呢?而类似中国移动这样的公司又是如何根据消费数据对几亿的消费者进行细分呢?

SAS,就是一个可以用来解决以上问题的公司。这是一个有趣的公司:它是全球最大的私人公司,由Goodnight在七十年代中期创办,直到今天公司还由他来控制操作;它又是一个极人性化的公司,多次获得雇员最欢迎的公司,其内部待遇和绝对和Google不相上下;它又是个极盈利的公司,在商业智能分析领域里,它的年销售额可以达到23亿美元,当然这主要归功于它功能巨强大但价格也让人吃惊的软件SAS。但是最近几日,它连续受到NYTimes, BussinessWeek等媒体的关注。这是因为,经济危机后,它要面临更多新的竞争对手了。

TIMELINE在商业管理软件市场中, SAP占有约24%的份额,SAS和Oracle打成平手,各占有约14%的市场。IBM虽然位居第四,占有11%的份额,但却后劲十足:要知道IBM是07年才进入此领域,而对SAS更大的一个挑战则是,IBM在今年以12亿美元的价格收购了SAS最大的竞争对手SPSS并聘请了几百个专家做分析顾问。在商业智能分析领域(Business Intelligence),IBM可以说已经成了SAS最大的对手了。一个新的机遇是:如今数据不仅仅来自于和客户、销售等相关等跟踪系统,互联网成了新的数据海洋,比如Youtube的海量访问,Twitter每时每刻诞生的信息,还可以包括以后物联网可能流行后带来的巨量传感器数据。考虑到这些数据可能蕴含的巨大市场,SAS已经意识到其中的重要性,开始尝试将其提供的统计分析服务用于这些领域,比如和Google合作分析Web data, NYTime报道中一句话点破其中缘由:

(The analysis is) making business more of a science and less a seat-of-the-pants art.

此外,SAS还面临着另外一个新的对手,那就是R。作为一个开源的软件,R可以免费的提供复杂的、定制性很强的统计分析功能。 R在国外高校、医学研究所中已经越来越受欢迎,据说Google和辉瑞制药都使用它。考虑到SAS高昂的价格,亦有公司开始转用R。REvolution Computing就是一家开始进行商用化R的一家公司, 比如通过提高R对海量数据的处理速度。但是,如同讨论Linux能否取代Windows,Scilab是否可以取代Matlab一样,R能在多大程度影响SAS, 或者是否可以商用并取代SAS依然是个很有争议的话题。一篇叫Data Analysts Captivated by R’s Power的报道则挑明了这个问题,引起了激烈的讨论, 而点燃火药桶的大概就是其中SAS产品经理一句话了:

I think it addresses a niche market for high-end data analysts that want free, readily available code. We have customers who build engines for aircraft. I am happy they are not using freeware when I get on a jet.

这下好了,一下子把自由软件的人们全得罪了,讨论争辩热闹非凡,效果和Ballmer说了句Windows天然就比Linux要好的效果差不多。最后以至于这位经理不得不出面在这篇报道记者的博客上出面道歉,并说明SAS的一个重要的矩阵计算模块IML已经提供了R的接口。我只是简单使用过R, 用的稍微多点是SAS。 就我的经验而言,SAS除了它的功能更强大外,说明文档那是相当的详细,一个9.2版的使用说明书将近8万页。R相比就逊色很多,这和其他自由软件面临的问题差不多。至于对于海量数据的处理,我目前还没对比过。但是不管如何,R都是个不可忽视的对手,要是哪天IBM也开始赞助R社区,并加速其商业化,SAS面临的麻烦可就大了。

网络海量数据的分析已经引起了一部分人的注意,据我所知,Yahoo的纽约研究院已经开始分析用户的网上购物行为,而就在最近,微软的前员工协同其从微软挖过去的一些人成立一个叫做DataApplied的公司,任务就是利用云计算提供网络数据分析服务。在中国,我个人感觉做的还算可以的大概就是百度的数据研究中心了,当然,将来能做的空间还很大。如何将这些Data Flow转换为Cash Flow, 除了如何发挥Data Mining的强大功能外,一个好的商业模型更是值得思考的。

Tagged with:
preload preload preload