五、大数据与人才

2009年,“大数据”成为互联网信息技术行业的流行词汇,正式进入了大众的视野。2012年3月,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。奥巴马政府甚至将大数据定义为“未来的新石油”。2016年3月,我国将大数据战略纳入“十三五”规划。

如今,大数据终于迎来了属于它的时代。大数据技术已趋成熟,作为一个新学科,数据科学方兴未艾。人工智能的应用必将把智能决策推向新的高度。

1.人才成掣肘黄秋钧,王通讯.大数据产业莫让人才拖后腿.光明日报.2016年11月8日.

根据我们的观察,制约大数据进一步发展的瓶颈很有可能是大数据人才不足。所谓“十年树木、百年树人”,人才培养有其自身的规律,大数据领域的人才培养也不可能脱离这种规律。

什么样的人才是大数据人才呢?可以从大数据岗位和技能需求的角度进行定义和分类。第一类当属数据分析师。数据分析师熟悉大数据的概念和原理,具有一定的数理和统计学知识,能够熟练操作和使用数据软件和工具,他们工作在大数据与各个领域结合的第一线,例如女排的数据分析师袁灵犀就要既懂数据又懂排球,二者缺一不可。第二类是数据工程师。数据工程师应该能够开发和搭建数据平台和应用,并且熟悉数据挖掘的流程和原理,为大数据技术应用在各个领域提供解决方案。第三类是数据科学家。数据科学家需要熟悉各种大数据技术的原理和相对的优劣势,合理利用各种技术来设计大数据平台的架构,根据数据挖掘的使用需求和商业理解来设计和开发算法。

为了便于大家理解,我们可以用航空工业中的各类人才做个类比:数据分析师类似于飞行员;数据工程师类似于飞机生产制造和维护人员;而数据科学家则类似于飞机设计人员。遥想当年,莱特兄弟发明飞机的时候,他们二人既是设计者又是制造者和飞行员,但现在这是三个完全不一样的岗位类型。随着大数据技术的成熟,大数据人才的划分也会经历类似的过程。

2.培养周期长

现在大数据工程师和大数据科学家之间的界限还很模糊,不过数据分析师已经逐渐分离了出来。正如我们不需要飞行员也能够制造飞机一样,数据分析师相对于其他两者培养起来要容易一些。但是不同的飞机和不同的飞行场景对飞行员有不同的要求,数据分析师在不同领域的技能要求也不完全一样,总的说来,使用越复杂的数据应用和工具越需要数据分析师掌握更多的数据知识和技能。

如今,任何大数据平台的搭建和维护都需要成建制的数据工程师和数据科学家。过去两年间每年有数十个大数据平台在启动和搭建,这就在短时间内形成了对数据工程师和数据科学家的巨大需求,而在大数据人才的供应特别是高端人才供应方面则受到人才保有量不足和人才培养周期长的制约。如果我们从大学入学开始计算,加上软件开发和数据算法建模等方面工作经验的形成,培养一个合格的数据工程师和数据科学家至少需要5年到10年的时间。

当前一个明显的事实是,大数据人才培养速度明显低于大数据发展和应用的速度。据调查,尽管全国50%的大数据人才集中在北京,但是北京的互联网公司仍然普遍遇到了合格的大数据人才“招聘难”和“留人难”的问题。

3.先下手为强

大数据产业兴起于美国。美国现在正遭遇的“大数据人才荒”及其采取的应对措施,可以给我们诸多启发和借鉴。

例如,大数据人才在领英(LinkedIn)和玻璃门(Glassdoor)等人力资源和招聘网站长期处于供不应求的状态。麦肯锡咨询研究指出,到2018年仅仅在美国,大数据人才短缺就到达50%~60%。今日美国和彭博社等媒体一致认为,大数据人才短缺的问题短期内只会加剧而不会缓解。自从2011年麦肯锡报告预测美国到2018年将会有14万~19万数据分析人才短缺后,美国各类大学都争先恐后地开设与数据科学有关的课程(包括大数据技术、商业智能、数据分析、人工智能等)和专业。比如,北卡公立大学早在2007年就先知先觉地设立了数据分析硕士项目,2016年该项目毕业生的就业率达到了100%,而且平均年薪达到了10万美元左右。该项目从2007年到现在的毕业生人数已经达到了100多人。然而,同美国教育界全力开动起来培养的人才数量和大数据快速发展所需要的人才数量相比,仍然是杯水车薪。

可以预见,在未来世界,国家之间、区域之间甚至是公司之间的大数据人才争夺战将会愈演愈烈。有鉴于此,建立中国的大数据人才平台,对大数据人才问题进行超前研究,并且未雨绸缪,加大人才培养和引进的力度,应该引起领导者与人才规划部门更多的重视。