在系统的主界面上多出了奖励一栏,刘凡点开奖励后,竖排着两个选项。
《大数据处理深度运用》:点击使用后直接融入大脑。
《智力开发手册》:不可实体化,可随时点击查阅。
奖励就两个东西,简单明了,刘凡也不纠结,按照顺序先点击了《大数据处理深度运用》。
手指碰触之后,系统的形式感又来了,只见一本书在手机屏幕上快速转动着,然后逐渐变慢,直到消失。
几乎就是在手机上的是书消失的同时,刘凡的大脑感受到了熟悉的舒适感,一种涓流入海的感觉在刘凡的脑中出现,也不知过了多久,这种奇妙的感受才彻底消失,然后刘凡就发现大脑中出现了一堆知识。
这些知识就和刘凡所熟知的九九乘法表一般在大脑中存在,非常和谐,一点突兀感都没有,就好像是自己从小到大学习的一部分,和谐到让对系统的强大做好心理准备的刘凡不禁再次震撼。
消化了一会儿震惊的情绪,刘凡对系统奖励的东西很快有了进一步的认识。系统给的这个《大数据处理深度运用》,有点像是一个系统架构,但是十分精细,十分通俗。
类比来说,就好像是一个附带全流程操作细节的家装设计方案,有了它,你就知道电工要做什么,泥工要做什么,木工要做什么,最终如何整合,整体效果是什么,同时,材料,工具都给你备好了,而你需要做的事情,就是找到电工,木工,泥工这些师傅就行了,最终这个房子装修出来的质量和效果,就将由你找的这些师傅的能力所决定。
而在大数据处理这里的电工木工等对应的就是《离散数学》、《概率学》这些知识。换言之,刘凡已经知道了该如何设计出一款大数据处理工具,但自己设计出来的这个工具的处理能力如何,就取决于自己在《离散数学》、《概率学》等相关学科方面的知识储备和理解了。
这也意味着,这款工具的处理能力逻辑上来说是无上限的。
此时刘凡也终于明白为什么系统要挑出这三门课来作为任务了,因为《离散数学》和《概率学》是开发相关系统的重要基础科目,而《复变函数》可以起到优化辅助,当然,还有一些很重要的科目不在本学期的教学计划内,比如《线性代数》。
另外刘凡还注意到一点,在编程这一方面的知识,系统的奖励里是附带的,也就是等同于之前类比时提到的工具,唯独把基础数学作为了留给刘凡发挥的空间。
这不得不让刘凡联想到系统总结中写到的那句:希望您能在得到任务奖励后进一步理解任务的意义。
系统其实是给了自己高于自己祈福需求的奖励,但同时又需要自己继续付出努力,自己越努力,奖励的发挥空间就越大,系统到底想让自己明白什么呢?
刘凡暂时还想不明白。
想不明白干脆也不多想,打算先看看另外一个奖励。
点开《智力开发手册》,出来了四个字:耕勤乃智。
随后跳出来了一大串说明,简单来说就是刘凡按照手册指导有规划的不断练习,就能帮助自己的智力开发,但这会是一个漫长的过程,不会一蹴而就。
刘凡清楚了这是怎么回事,也就没有耽误时间,有了系统奖励自然要开始干正事了,现在首先是要研究一下市场上主流的几款大数据处理工具,之后根据木桶原理,补习一下《线性代数》等几个今年没考的科目是必须的,最后再设计自己的工具。
有了基本的思路,刘凡很快进入状态。
暑假室友们都回去了,正好给了刘凡闭关修炼的环境,不用花冤枉钱再出去租房子什么的。
时光荏苒,白驹过隙。
8月10号凌晨三点半,刘凡蓬头垢面的在寝室中来回踱步,神色兴奋久久不能平复。
这一个多月的时间里,刘凡几乎足不出户,但他可以感受到自己快速的成长。一方面是在基础数学方面的深入研究,另一方面是关于大数据处理工具在商用上的长远计划。
当初选择从大数据处理作为切入点,仅仅是一个方向,具体的内容也是在这一个多月中规划出来的。
刘凡研发的大数据处理工具,自然不可能只是去完成类似自动排序或者异常提醒这种常用功能,更准备的说,是面向企业的综合性大数据服务平台,涵盖企业内部管理和客户管理。
所以刘凡最终的成果,本质上来说是一个框架,需要输入企业的个性化需求从而进行个性化大数据处理服务。
刘凡也曾考虑过有没有做出通用工具的可能,毕竟这样可以免去未来很大的一个实施成本,但这种事情仔细一想就不现实,每个企业的情况都是不一样的,需求也不一样,要做通用,就等于要满足全世界所有企业可能出现的需求。现在的自己完全做不到啊。
虽然在通用问题上刘凡没有技术突破,但刘凡所研发的大数据处理工具却在另外两个方面做到了巨大突破。
第一个就是效率问题,刘凡虽然还是以随机森林法则作为算法基础,这也是没办法的事情,以他现在的能力还无法改变当下深度学习的算法环境。毕竟自己当初考虑安全问题没把算法作为自己发展的切入点,自然还是得用当下的算法作为基础。但刘凡虽然没能力改变,但是有能力优化。
刘凡通过一百次实验对比OpenRefine,自己的系统平均运算效率可以达到3倍以上,还是那句话,对于拥有庞大数据的企业来说,这是一个质的飞跃。就拿企鹅来说,他每天光是微信和扣扣产生的数据量就有几百TB。
更何况,数据量每天都是在增长的,因为数据处理的速度跟不上,越来越多的数据只能一直在那排队,企业的很多决策就会存在时效性的问题。
第二个突破就是数据挖掘的多样性,大数据技术的发展对企业来说最重要的就是他的数据分析和数据挖掘能力。
正如大数据行业最经典的案例之一:啤酒放在尿不湿旁边销量最高,这就是大数据分析给企业带来的实质性价值。
企业就是要大数据处理工具告诉自己,我该怎么做能赚更多的钱。
但在这个问题上,整个市场目前的大数据挖掘能力其实还处在一个相对初级的阶段,因为对于有规则的东西,大数据是很好分析的,但更多的企业是要从无规则的数据中分析出一个结果,这是很难的。因为牵扯的变量太多了。
而刘凡通过系统知识的提点,想到了在算法中加入一个数据关联逆推算法,让杂乱无章的数据之间自我建立起函数关系,再对函数进行二次深度挖掘从而导出有效函数,最后再对有效函数进行物理解析。
这就让很多在当下算法环境下被判为无用的信息变废为宝了。虽然刘凡这种算法也不可能保证说通过杂乱的数据直接能给企业一个怎么赚钱的答案,但却可以让企业更为全面的掌握产品情况,市场情况以及公司情况等,更多传统工具忽视的细节都将会大概率被呈现出来。
在各行各业同质化愈发严重的今天,信息的利用率和细节的把控有多重要,可想而知。
要说现在这款工具的缺陷,那就是数据量越大它的优势就越明显,如果数据量太小,可能一点优势都呈现不出来了。这就影响到后期确立目标客户的问题了。
在一个多月的学习,研发,对比,改良之后,刘凡觉得眼下的这一个大数据处理已经可以作为第一款产品亮相了。
一来在性能上刘凡认为已经具备了足够的竞争力,二来是刘凡为了这套系统,又要租服务器做实验又要花钱买数据,短短一个月把三年来打工攒下的2万块钱快花完了。
得赶紧赚钱了。
至于这套工具的名字刘凡也想好了,当时是因为看着像木龙才把系统捡回来的,所以刘凡打算以后不管是技术,芯片,还是公司,都以木龙为名。
这次的大数据处理工具也将是木龙科技旗下的第一款产品:木龙大数据处理工具1.0。