大数据已经是趋势,这一点毋庸置疑。然而,火爆的概念之下却难以看到大数据产品的真容,大数据因此被业内人士扣上“炒作”的莫须有罪名。难落地,已经成为大数据发展过程中的一个痛点,也是大数据最难的突破点。
尽管很难,各互联网巨头和一些传统企业都在深耕大数据,阿里巴巴收购新浪微博18%股份,是巨头们布局大数据的战略。其实,除阿里巴巴外,很多企业都在布局大数据,因为对于企业而言,大数据就像一座巨大的金矿。
谈及大数据的意义,IBM华生实验室博士张书平提到,透过大数据的分析技术,人类在社群媒体上的互动与喜好,生活周遭的各种数据,都可以被归纳整理成有意义的信息,只要能够掌握大数据并且实时分析,就能有效的改变交通、运输、能源、医疗等产业,进而创造庞大商机。
面临巨大的商机,巨头们加速前行。就现状而言,很多企业对大数据商机的挖掘,仍停留在数据整合上面。的确,收购了新浪微博部分股份后,淘宝的很多广 告出现在新浪微博页面,但很多微博用户反馈称,淘宝的广告投放并不精准。也就是说,阿里巴巴与新浪微博的这一案例,称不上成功的大数据营销案例。
在社交领域,腾讯朋友网可以说是一个比较成功的案例。借助数据QQ用户数据,以及QQ空间、腾讯微博等多个产品的数据,深度挖掘和分析后,能够将用户的好友关系进行匹配,让用户从校友、家人等多个维度寻找好友。
在视频领域,收购了PPS的爱奇艺也在布局大数据。日前,爱奇艺PC客户端全面改版,依靠大数据分析实现了“千人千面”的首页全个性化的内容推荐。 笔者测试了一下,推荐内容全部是基于个人观看记录,以及搜索记录计算出来的结果,而且结果很精确。由于暑假期间儿子经常看动画片,我的爱奇艺客户端首页推 荐内容中,全是儿子感兴趣的内容。
爱奇艺、朋友网和阿里浪等案例都是大数据时代的产物,这意味着大数据并非炒作。事实上,大数据之所以难落地,根源还是数据。无论是基于大数据的营销,还是基于大数据的产品,必须有庞大的数据作为支撑,以实现广告精准投放或内容的精准推送。
以爱奇艺PC客户端个性化首页这一产品来说,其数据来源不仅仅是爱奇艺观看记录,还有爱奇艺站内搜索数据,以及百度视频搜索数据,爱奇艺用户观看行 为等数据。除个性化首页外,今年5月爱奇艺还推出的大数据精准广告投放系统“一搜百映”,通过挖掘搜索引擎海量数据价值来优化视频广告服务,同时减少对非 目标用户的广告打扰。如果用户通过百度搜索“购置税”关键字,在爱奇艺客户端观看视频时,贴片广告是汽车相关的广告。此外,还会根据用户的年龄、性别和收 入等信息,确定推送哪一品牌的汽车广告。
相比之下,阿里巴巴注资新浪微博谋求大数据广告精准推送战略的受挫,原因恰恰是数据挖掘和分析能力欠缺。众所周知,新浪微博有数亿用户,阿里巴巴有 市场份额最大的电商平台淘宝。在没有对两家用户数据进行打通并深度挖掘和分析后,在新浪微博实现精准广告投放是很难的,这才有了很多新浪微博用户抱怨淘宝 推送的广告不精准的一幕。再看腾讯旗下的朋友网,人脉匹配之所以如此精准,就是因为腾讯对QQ、QQ空间和腾讯微博几大产品用户行为数据进行了精准挖掘和 分析。
显而易见,大数据需要庞大的数据积累,以及深度的数据挖掘和分析。无论是精准广告投放,还是个性化定制,大数据要想落地,必须有两个条件:一是丰富的数据源,二是强大的数据挖掘分析能力。很多企业在大数据战略上受挫,就是因为数据源匮乏。
未来,企业要想在大数据时代领先,必须多方合作获取更多的数据,这是大数据的基础,也是大数据战略成败的核心。而相应的数据分析能力,则需要企业继续苦练内功。
在企业信息化建设及互联网行业的发展过程中,数据量的增长已经达到了前所未有的速度。厂商、分析师以及技术专家认为“大数据”(Big Data)时代已经到来,针对大数据的相关技术已经被IT部门提上了议事日程。除了如何存储管理大数据,更为重要的问题是如何利用大数据为企业服务,通过商业智能以及高级分析应用将其价值发挥到最大。
大数据的概念同我们比较熟悉海量数据有所区别,它可以用三个V来总结,即Variety、Volume和Velocity(多样性、数量、速度)。不难 理解,无论目前结构化数据还是非结构化数据,它们在深度与广度上都飞速地增长着,企业能否有效管理并挖掘利用这些数据将决定信息化建设的发展走势。除此之 外,技术提供商也纷纷将目光瞄准大数据领域,IBM、SAP、Teradata等数据仓库及商业智能厂商都在积极地推广各自的理念和产品。为 此,TechTarget记者在2011年大数据世界论坛上对Teradata公司的首席客户官周俊凌进行了采访,让他来谈一谈大数据与BI分析、数据仓库技术的发展。 平台技术选择应由需求驱动 新概念是新技术的催化剂,在大数据领域中,一些新技术包括Hadoop、MapReduce都得到了更广泛的应用,Hadoop MapReduce为通用计算与分布式架构架起了一座桥梁,而传统的企业数据仓库技 术(Enterprise Data Warehouse,EDW)则遭遇了前所未有的挑战。通过使用Apache Hadoop,企业能够避于支付大量的软件许可费用,还可以根据变更的需求更改原代码从而得到更高的灵活性。如何在Hadoop和EDW之间做出选择困扰 着许多企业用户,对此周俊凌表示,技术以及平台的选择在大数据时代同之前相比并没有太多的不同,企业首先考虑的仍然是自身业务需求。Hadoop架构的存 在有它的理由,但是这并不意味着在成本方面会比EDW有更多优势。 “企业在进行技术的选择时不应只看首次投入的成本,Hadoop不是 一劳永逸的,你需要不断对其进行维护,考虑持续的投入,无论是人力还是物力,它都可能会比传统的EDW要大。因此企业不应该一味迷信于新技术,无论是购买 平台还是进行定制,用户需要从自身需求出发。” 周俊凌解释说。 在谈到国内企业技术的选择时,周俊凌还表示,一些客户更具开放性和前瞻 性,特别愿意尝试大数据带来的新技术,打造自己的竞争优势,一些较小的客户和新行业都积极采用这样的新技术和工具。中国市场有其独特之处,中国的客户会对 这样产品和技术做出更快的响应,而且中国在计算方面的基础设施都比较新,中国是更加开放的,能够更加积极接受这种新技术。 Teradata通过收购补充产品功能 数据仓库市场是一个相对成熟的市场,其中Teradata一直保持在领导者的地位,但近两年伴随着大数据技术的发展,业内也出现了许多大型的并购,其中包括Oracle收购Sun、IBM收购Netezza、EMC收购Greenplum等。 像Oracle这样的厂商已经具备了推出集成平台(Appliance)产品的能力,在Gartner今年发布的数据仓库平台报告中,许多合并后的厂商都 保持了强劲的势头,这给Teradata的地位造成了比较大的挑战。对此,周俊凌认为对于Teradata来说,无论是否出现并购,其影响都不大。数据仓 库是个比较成熟的市场,竞争的格局已经存在多年,并在一段时间内不会出现太大的变动。 |