应用实例;《纸牌屋》是2013年Netflix的自制剧,在美国和其他40多个国家引起了观剧热潮,Netflix首次试水自制剧,就取得了令人吃惊的成功,它的秘诀是——大数据。
1亿美元买下版权、要求大卫·芬奇担任导演、凯文·史派西担任男主角,这些都是Netflix利用数据挖掘得出的结论。Netflix早就意识到数据的重要性,它记录Netflix用户的位置、设备等信息,以及收藏、推荐、回放、暂停等动作,加上400万个评分、300万次搜索请求,等等一系列数据。早些年,这些数据被Netflix用来进行精准推荐。Netflix根据数据技术推导出《纸牌屋》的关键要素,喜欢BBC剧集的用户、大卫·芬奇和凯文·史派西存在交集,事实证明,基于数据的结论非常有效[4] 。
市场;中国人口众多,互联网用户数在2013年已经超过5亿人,全球第一。海量的互联网用户创造了大规模的数据量。据预测,到2015年全球有超过85%的财富500强企业将在大数据竞争中失去优势。我们认为这种发展趋势在国内同样不可避免,在未来的市场竞争中,能在第一时间从大量互联网数据中获取最有价值信息的企业才最具有优势。
当前,大部分中国企业在数据基础系统架构和数据分析方面都面临着诸多挑战。根据产业信息网调查,目前国内大部分企业的系统架构在应对大量数据时均有扩展性差、资源利用率低、应用部署复杂、运营成本高和高能耗等问题。国内企业为适应大数据时代而做出大规模调整是一种必然,这为国内从事大数据相关业务的IT企业带来了极大市场需求。
中国企业数据系统架构存在的问题