登陆注册
4433900000018

第18章 大数据与技术变革(2)

目前,数据服务产业链上真正的大数据玩家,应该是例如谷歌之类的公司,通过重复利用数据以获得利益。谷歌成功地建立了“网页搜索+广告”的商业模式,其所有的业务都是构建在大数据之上的。因此,谷歌是大数据最大的玩家。2012年,它的总营收达到501.75亿美元,利润107.4亿美元,其九成利润来自广告。有咨询公司预测,2017年全球大数据技术的市场空间约500亿美金,约等于谷歌2012年的总营收。这其中,既包括了技术,也包括了大数据工具和相应的服务。

由此观之,在大数据时代的未来,获利最大者将是“数据为王”或者“数据驱动”的业务内涵和模式,发展大数据并挖掘大数据的新价值是其不可不为的原动力。中国也必须尽快扶植相关的产业和公司,以抗衡谷歌这样的跨国巨头,并最终实现赶超。

技术支持与发展

大数据不是口号,而是技术,同时也是技术的整合。大数据的到来,已经成为现实生活中无法逃避的挑战。无论如何,大数据已经成为新一轮技术变革的最强音。关于模式的思考,关于安全的质疑,关于应用的探索,我们必须静下心来看大数据,实实在在了解大数据目前仍然需要解决的问题。

国计民生、商业创新无不与大数据相关,大数据渐渐向人们展现了它为学术、工业和政府带来的巨大机遇。每当我们要做出决策的时候,大数据就无处不在。无论如何,我们都必须直面大数据时代的到来。

大数据给中国带来的巨大挑战,首先是三个重要的技术问题。

☆如何利用信息技术等手段处理非结构化和半结构化数据

大数据的一个重要特点就是数据分散。大数据中,85%都是非结构化的数据,结构化数据只占15%左右。大数据的另一个特点就是不确定性,表现在高维、多变和强随机性等方面。有90%的数据来自开源数据,其余的被存储在数据库中。而大数据则大量存在于社交网络、互联网和电子商务等领域。

值得注意的是,大数据刺激了大量的研究问题。但是大数据每一种表示形式都仅呈现数据本身的侧面表现,并非全貌。比如图像,如何把它转化成多维数据表、面向对象的数据模型或者直接基于图像的数据模型?

如果把通过数据挖掘提取“粗糙知识”的过程称为“一次挖掘”过程,那么将粗糙知识与被量化后的主观知识相结合而产生“智能知识”的过程就叫作“二次挖掘”。这些结构化的粗糙知识可以被主观知识加工处理并转化,生成半结构化和非结构化的智能知识,这也正是基于大数据的数据挖掘所产生的结构化的粗糙知识的一些新特征。

由于大数据所具有的半结构化和非结构化的特点,寻求“智能知识”也就反映了大数据研究的核心价值。非结构化和半结构化数据的个体表现、一般性特征和基本原理尚不清晰,要想实现从“一次挖掘”到“二次挖掘”这样类似事物量到质的飞跃,还必须通过包括数学、经济学、社会学、计算机科学和管理科学在内的多学科交叉来研究和讨论。这些都需要给定一种半结构化或非结构化数据,包括具体的经验、常识、本能、情境知识和用户偏好。

☆如何探索大数据复杂性、不确定性特征描述的刻画方法及大数据的系统建模

大数据的复杂形式导致许多对“粗糙知识”的度量和评估显得尤为重要。这一问题的突破是实现大数据知识发现的前提和关键。这里,人机交互将起到至关重要的作用。管理科学,尤其是基于最优化的理论将在发展大数据知识发现的一般性方法和规律性中发挥重要的作用。

从短期而言,学术界鼓励发展半结构化、非结构化数据之间的转化原则,以支持大数据的交叉工业应用。从长远角度来看,可以将已知的最优化、数据包络分析、期望理论、管理科学中的效用理论应用到“二次挖掘”过程中,研究如何将主观知识融合到数据挖掘产生的粗糙知识中。大数据的个体复杂性和随机性所带来的挑战将促使大数据数学结构的形成,从而导致大数据统一理论的完备。

☆数据异构性与决策异构性的关系对大数据知识发现与管理决策的影响

在大数据环境下,管理决策面临着两个“异构性”问题:“决策异构性”和“数据异构性”。大数据已经改变了传统的管理决策结构的模式。决策结构的变化要求人们去探讨如何为支持更高层次的决策而去做“二次挖掘”。探索大数据环境下决策结构的改变对管理决策结构的影响会成为一个公开的科研问题。寻找大数据的科学模式将带来对研究大数据之美的一般性方法的探究,已知的数据挖掘方法将成为大数据挖掘的工具。

无论大数据带来了哪种数据异构性,大数据中的“粗糙知识”仍可被看作“一次挖掘”的范畴。由于大数据本身的复杂性,这一问题无疑是一个重要的科研课题,传统的管理决策模式取决于对业务知识的学习和日益积累的实践经验,而管理决策又是以数据分析为基础的。大数据是一种具有隐藏法则的人造自然,如果我们找到了将非结构化、半结构化数据转化成结构化数据的方法,通过寻找“二次挖掘”产生的“智能知识”来作为数据异构性和决策异构性之间的桥梁,那么我们将能够很好地应对传统的数据挖掘理论和技术提出的新挑战。尽管这样的探索十分困难,但是研究大数据,是十分必要的。

除此之外,还有一些数据科学的问题,以上也仅仅是研究大数据挑战的一个起点。在未来,相关的问题都可以得到很好地解决。

自从人类进入到信息化时代以来,我们不断产生大量的数据,加之物联网、移动互联网应用的大规模爆发,大量新数据以每年50%的速度在增长,或者说每两年就要翻一番多。数据已经渗透到每一个行业和服务职能领域,随着互联网技术的不断发展,数据本身就是资产,这一点在业界已经形成共识。

人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。在云计算时代,人类通过对海量大数据的高效分析获得商业以及社会价值。云时代的到来、移动终端普及使得数据创造的主体由企业逐渐转向个体,而个体所产生的绝大部分数据为图片、文档、视频等非结构化数据。随着云计算技术的快速普及,人类社会正在步入一个被互联网和通讯技术引爆的大数据时代。大数据技术在中国的发展前景是光明的,前提是我们能够提升和扩充自己的技术王国,建设美好的蓝图。

全球技术研究和咨询公司Gartner将大数据技术列入2012年对众多公司和组织机构具有战略意义的十大技术与趋势之一。Gartner在其新兴技术成熟度曲线中将大数据技术视为转型技术,这意味着大数据技术将在未来3?5年内进入主流。中国也不会落后,“云基地”作为国内最早根植在云计算技术及商业模式的领先者,也一直积极关注大数据带来的发展机遇。

从战略到战术层面,从理念到技术层面,中国都已开始自我的进化,更加适应这个新的时代。中国经过了几十年的积累,让不断产生的海量数据正在成为虚拟世界取之不尽的能源,而它们还远未被开发。

信息化技术的普及使得中国企业更多的办公流程通过网络得以实现,由此产生的数据也以非结构化数据为主。而其他领域的研究,如云计算、下一代分析、内存计算等也都与大数据的研究相辅相成。我们尚无法确定万物是否皆有数据,但是至少已经推开了这样一扇大门:以理性的态度思考大数据,共同保持着持续变革的动力,主动地拥抱这种变化。早在2012年时,非结构化数据就已达到了互联网整个数据量的75%以上,用于提取智慧的大数据,往往是这些非结构化数据。而现在,这个比例已变得更大,我们也拥有了足够的技术支持。换句话说,中国的大数据技术的积累已到达了突破阶段。

“脚印追踪”--个性化的数据推荐系统

如果你在自己经常网购的网站看到“猜你喜欢”之类的东西是那么符合自己的要求,不要惊讶,因为我们每一个人都已经步入了大数据时代。你可以想象一下,也许在未来,每天打开电脑,它会自动把你所有的需求列一个清单,你只需要坐在舒服的沙发上点几个确定选项,就可以轻轻松松地搞定一切了。

不要以为这种情形只发生在科幻电影中。商家只有在满足大众的需求时才能够卖出商品,而这一切都是在满足大众的个性化需求的基础之上实现的。

2011年9月,淘宝公司发起了用户定制电视的活动,2天内1万台订制电视就被抢光。在该活动中,用户可以选择电视的各种属性,包括尺寸、边框、颜色等,厂商根据用户的订制内容生产电视产品,再送货到客户的家中。

从这个具有代表性的案例中我们就可以发现,未来的商业模式正在发生着质的变化,它通过满足个性化需求来提升商业运转的效率,在为消费者提供更好服务的同时,获得更多的利润。

☆“猜你喜欢”的由来

网购中随处可见的“猜你喜欢”是怎么来的呢?事实上,这种推荐方式来源于亚马逊的技术创新。

亚马逊公司的内容起初都是由人工完成的,他们聘请了一个由20人组成的书评团队在网页上推荐有意思的新书。但是随着在亚马逊上架的图书越来越多,这样的人工操作自然越来越显得乏力低效了。

后来,亚马逊的总裁贝索斯决定尝试更有创造性的做法,根据用户的习惯来为其推荐商品。但若想实现个性化推荐,必须要将不同用户进行比较再找到用户之间的关联。但是,面对庞大的数据,这种推荐系统算法烦琐,结果也是不尽如人意。

同类推荐
  • 总经理决胜市场要懂的188条锦囊妙计

    总经理决胜市场要懂的188条锦囊妙计

    《总经理决胜市场要懂的188条锦囊妙计》基于公司成长和发展成功的经典案例,全景式地论述私营公司做大做强的黄金法则,从公司的创立到发展、从市场到营销、从人才到管理、从危机处理到经营方略……全面系统、深入浅出地分析了公司决胜未来,创造长续发展可能的各个层面,解决了公司在经营过程中可能遇到的诸多问题,为总经理提供了最有实战价值的指南,让公司永立不败之地。
  • 做生意就是做心理学:商场必备新经济时代的制胜宝典

    做生意就是做心理学:商场必备新经济时代的制胜宝典

    金融危机以后。越来越多的人开始了自主创业的历程,但很多人以前并没有从商经验,初入商场,容易受骗上当。想要避免这样的事情发生,就要学一些心理学。从心理学的角度,对经商进行详细的分析。比如。在与对方谈判时,如何让自己处于主动地位。如何看透对方的真正心思;在销售中,该如何与顾客打交道,这些都是在经商过程中会遇到的。也是最常见的问题。
  • 总经理把私营公司做精做久的299条真经

    总经理把私营公司做精做久的299条真经

    本书结合当前经济现状,在强调把公司做大做强的同时,提出了如何在瞬向万变的市场中把公司做精做久,根据这一理念从多方面进行论证,总结提炼将公司做精做久的299条真经。
  • 李嘉诚最有价值的投资策略

    李嘉诚最有价值的投资策略

    李嘉诚,这个名字已成为中国财富英雄的象征,他的人生充满了财富的魅力。但又有谁知道他是贫民出身,17岁出外闯荡,从打工仔做起,靠塑胶花起家的呢?他纵横商海数年,在激烈的商战中,不但站稳了脚跟,而且能鹤立群雄、叱咤风云,他凭借什么取得了如此辉煌的成就?很多人希望能够拥有像李嘉诚一样成功的金钥匙,本书就是在为你解开李嘉诚财富王国的秘密。
  • 春秋战国的那些CEO们

    春秋战国的那些CEO们

    自大周证监会重建市场秩序后,各地相继设立了几大股份公司,以维护证监会的地盘。各股份公司的董事长和CEO各施手段,在市场上左突右杀,不断扩大自己的市场份额。其中绩优上市公司有齐国、楚国、晋国……齐国股份公司的首任董事长就是姜子牙。在数百年风云变幻的市场环境下,姜子牙及其继任者对内深化改革,聘请天才CEO,理顺公司内部关系;对外强势扩张,大肆收购小公司,逐渐奠定了独霸市场的地位,一举成为当时有超级影响力的跨国集团……【尊敬的书友,本书选载最精华部分供您阅读。留足悬念,同样精彩!】
热门推荐
  • 饥荒之无限交易

    饥荒之无限交易

    一觉醒来,天楚莫名出现在异世,同时身体也回到十三四岁的时候,还附带一个系统。从此,天楚新的命运是走向人生巅峰,还是……
  • 错变飞云诀

    错变飞云诀

    无间岛是世上最诡异的海岛,无间盟是世上最诡异的门派,无间盟的阎王是最心狠手辣之人,他豢养的女子是世上最痴傻之人……很多传闻,且虚且实。他是段步飞,她是段云错。他生,她存;他死,她亦之……即便是死,也要拖着彼此一起下地狱,绝不会让旁人得到机会……
  • 万世灵神

    万世灵神

    一个来自未来的系统,让一个被家族放弃的少年重启新的人生
  • 苍难

    苍难

    ,,,,,,,,,,,,,,,,,,,,,
  • 江山如画,总裁竟如此多娇

    江山如画,总裁竟如此多娇

    他揪眉,不悦的吐出:“你看看我的车有没有被你撞坏?”她腾的蹿起来,做茶壶状:“你不就是个资本主义的白眼狼开个奔驰牌拖拉机嘛,有什么了不起啊,我家还有红旗牌自行车呢,你有嘛,还在我面前摆谱!”他甩手而去……斗智斗勇的欢喜冤家,总裁如此多娇,美女环绕,看谁是正牌新娘?
  • 初世界的旅行家

    初世界的旅行家

    “如果能转世到我一个没有去过的世界就好了,这样我就又能继续踏上环游世界的旅程,去欣赏我没有看过的风景”“那我们就一起吧!”这是一位年轻人与一位银发的妖精在异世界旅行的物语,他们将会遇到不同的种族,民族,结交不同的朋友,偶尔会冒险,以他们的故事来一点一点展现这个名为“初”的异世界。
  • 逝恋的梦

    逝恋的梦

    第一次遇见他,是在MY酒吧,那个眼神让她记了一辈子。她慢慢的发现自己好像喜欢上了叶尧,那个集万千人喜欢的叶尧。……而叶尧却一直提醒自己说不可能喜欢那种女生,终于,他骗不过自己了。在那场事故之后,他就想要挽回,但是,好像一切都已经迟了。她已经开始恨他了,她再也不会像以前那样喜欢他了……
  • 大视野知识文库(插图)浩渺的宇宙

    大视野知识文库(插图)浩渺的宇宙

    大视野知识文库包括:世界未解之谜、史前生命、浩渺的宇宙、人类的奥秘、走遍世界、奇妙的植物、奇妙的动物、华夏五千年、大海之旅、建筑奇观、消逝的文明、神奇的大自然、等书籍,历史、自然、宇宙等涵盖人文社科所有方面。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 一切还未开始

    一切还未开始

    每当孟子雾回想到那个每天都对着她笑脸嘻嘻的大男孩,最后却躺在医院里,到最后的,远去他国,心里总会空荡荡的,一直到了死,都忘不掉。也许是上天的安排,她,又回到了他们还未认识的时候,这次,她想,宁愿他们没有相遇,就不会有后续的结局了!但是事情总和她想象中的刚好相反,总是逃不掉,算了,那,这次,换我来保护你