对话戴金权:英特尔怎么构建软硬件协同一致的大数据分析+AI渠道?

时间:2019-05-29 11:25:36  来源:龙翔网

【龙翔网修改】

原标题:对话戴金权:英特尔怎么构建软硬件协同共同的大数据剖析+AI渠道?

雷锋网音讯,在2019全球人工智能技能大会主论坛,英特尔高档首席工程师、大数据技能全球CTO戴金权宣布了题为“怎么构建共同的大数据剖析+AI渠道”的讲演,英特尔的硬件才能不用赘述,这次英特尔则侧重展现了软硬协同才能,尤其是人工智能开源软件渠道Analytics Zoo。

戴金权表明,英特尔致力于供给从设备端到边际再到数据中心、云端完好的核算架构,比方在数据中心,英特尔至强系列服务器是AI运用剖析的根底架构,一同也供给了多种神经网络处理器等硬件架构。

英特尔开源AI软件地图

如上图所示,这是英特尔运用开源AI软件加快开发的地图,他着重,英特尔致力于供给全栈的解决方案,从最底层的算法开源项目协助用户更高效开发核算库,再到上层各种机器学习或许深度学习的结构,再到最上层,英特尔也供给了一些开源工具包,意图是协助运用开发人员更高效的开发根据深度学习的运用。

趋势 | 大数据剖析和AI渠道融为一体

据雷锋网了解,业界大数据剖析和AI渠道产品并不少,英特尔这类将大数据剖析和AI渠道融为一体的形式正成为职业新趋势。

榜首,关于大多数用户来说,尤其在出产体系傍边,根据Apache Spark这样的大数据集群仍然是一切的出产数据以及包含许多硬件资源的聚集地,怎么更高效运用出产数据以及硬件资源,可以将新的人工智能的运用支撑起来成为新应战。

第二,要构建一个工业级端到端的大数据剖析+人工智能运用,并不是说练习一个模型就可以完结的作业,其是一个十分杂乱的流水线或许作业流。从数据的搜集、导入、处理、特征的提取、各种模型的构建练习,到最后的布置、推理等等,是一个十分杂乱的作业流。

“咱们可以协助用户可以将这一个样端到端的大数据处理剖析加上机器学习的作业流可以十分便利地构建出来,然后大大可以进步了用户的开发功率、布置功率和运维功率”,戴金权介绍道。

与曩昔数年比较,深度学习和人工智能运用场景愈加广泛,要处理的数据也愈加广泛,所以客观要求运用者构建端到端的大数据处理剖析加上机器学习、深度学习的共同流水线。英特尔观察到,客户有越来越多的相似需求。

“咱们有许多用户是来自于许多十分大的互联网公司或许是大的企业里边的传统实验室,他渐渐的也会发现,当构建了一些人工智能深度学习的结构和模型之后,怎么样可以很好的真实跑到出产体系上去,能将出产数据在上面跑起来。这是用户来运用英特尔Analytics Zoo一个很重要的起点。”

此外,Analytics Zoo的用户也不乏硬件的OEM的厂商、软件供给商、公有云服务商等,英特尔现场展现出的客户包含浪潮、宝信、戴尔、阿里云和腾讯云等。

中心 | 端到端运用场景刻画

从深度学习模型到一个完好的工业级运用要多少过程?如上戴金权在现场展现的PPT,黑色部分是中心的深度学习模型,可是周边有许多作业要完结,才能使之运转起来。

深度学习的模型仅仅整个流程的一部分,要构建和运用深度学习模型,还有数据的导入、数据清洗、特征提取、对整个集群的资源的办理和各个运用之间对这个资源的同享等,这些作业事实上占有了机器学习或许深度学习的一个工业级运用开发大部分的时刻和资源。所以,数据处理、机器学习,以及算法有必要很好地和现有的大数据处理的作业流整合在一同。

这也是构建一个端到端的运用场景所面对的问题,在没有一个共同的大数据剖析+AI渠道之前,需求人工把许多不同的结构凑集起来。

别的许多用户开发一般都是从单机开端,当需求处理更多数据的时分,就需求跑到一个大规模分布式环境,乃至到一个出产环境里去。

从Analytics Zoo的视点,榜首,英特尔可以将不同的结构无缝的集成到流水线里边去,经过在软件层上面各种新的支撑或许功用,可以将TensorFlow、Spark可以十分无缝的集成在一个程序里边,在一个Spark程序里边直接嵌入TensorFlow的Code,然后一同运转起来,这其实对许多用户来说很有吸引力。

第二是在开发过程中,由于底层运转在Spark这样的引擎上,上面可以嵌入各种深度学习的功用,它可以运转在一个单机的环境,也可以跑到一个分布式环境里边去,用户也可以直接拜访出产数据。

“许多用户之所以想用Analytics Zoo,便是它可以直接构建端到端的,跟出产体系简直共同的原型。这是咱们的一个首要起点,可以协助用户将整个的大数据剖析+人工智能的运用很便利的将端到端的流水线构建出来,并且它可以很便利的从用户的笔记本运转到集群、运转到用户的出产环境傍边去,这是英特尔在底层Analytics Zoo这个渠道里所做的作业”,戴金权总结道。

Analytics Zoo是为了大数据渠道所优化的,今日大数据渠道根本都运转在十分大规模的英特尔至强处理器上,或许是几十、几百、几千个节点,可是英特尔运用了许多的底层优化的结构和库,像MKL-DNN、OpenVINO等等,将来会经过英特尔One API这样的生态体系输出。

戴金权说到,当在英特尔的生态体系上构建一个人工智能开发渠道时,带来的优点便是底层可以支撑英特尔各种硬件的加快,不管是至强服务器,包含像Movidius、FPGA,神经网络处理器,还有将来的独立显卡,都可以经过One API下面的底层生态体系来给上层的渠道和运用所运用。

雷锋网总结,Analytics Zoo可以将各种不同的模块不同的结构下共同到一个端到端流水线上,进步客户开发布置大数据剖析和深度学习的才能,这在现在深度学习或许机器学习越泛化的布景下十分重要,英特尔的作业可以让用户削减人工智能运用的开发环节,快速面向实际场景。

英特尔高档首席工程师、大数据技能全球CTO戴金权现已承认到会由我国核算机学会主办,雷锋网、香港中文大学(深圳)联合承办的CCF-GAIR全球人工智能与机器人峰会。

2019年7月14日,CCF-GAIR 2019 将结合语音、核算机视觉等传统人工智能要点方向的研讨,以及如在经济学等范畴的新运用,接受前史与未来、学术研讨与工业运用,对国际和我国近四十年来的人工智能研讨进行一个体系性的回忆并展望在当时杂乱国际形势下我国人工智能的未来开展。

超链接:CCF-GAIR 2019 大会官网
龙翔网发布!