你所在的位置: 首页 > 正文

业内公认的AI发展最大挑战,有哪些技术突破机会?

2019-09-01 点击:1064

Original DeepTech Deep Technology 3天前我要分享

冯诺依曼体系结构建立于80多年前,它仍然统治着现有的计算机。然而,随着机器学习等人工智能技术的发展,由于存在分离沉积物和计算的“冯诺依曼瓶颈”,这种经典的计算机体系结构越来越难以满足机器学习的计算需求。

最近,在接受DeepTech采访时,第四范式硬件业务部负责人蔡思阳告诉DeepTech:“从整个学术界和行业的角度来看,人工智能进一步发展的公认和最具挑战性的部分在于计算机体系结构。“

作为人工智能开发的“三驾驭”(数据,算法,计算能力)之一,未来计算能力的进一步发展受到X86和冯诺依曼计算机系统的限制,创新计算机系统架构的时机已经成熟。 “第四种范式目前正在与英特尔就如何突破限制计算能力发展的瓶颈进行深入讨论。双方希望通过硬件和软件的最佳组合构建领先的AI技术架构和计算能力。 “蔡思阳说。

越来越多的学者表示,建筑创新几十年来将成为信息科学与技术领域的核心命题,甚至会带来下一个“黄金时代”。这意味着必须考虑新的计算基础设施,以进一步打破建筑层面的摩尔定律而不是晶体管层面。

性质)

目前,业界在探索非冯诺依曼计算架构方面也取得了一些进展,如AI芯片的开发和与逻辑计算和数据存储相结合的类脑芯片(如清华大学发布的“天极”芯片)在很久以前的自然)。在全球主要技术公司的尖端实验室中,也有越来越多的非冯诺依曼计算机,如光子计算机,量子计算机,神经计算机和DNA计算机。

电子文艺复兴计划由国防高级研究计划局(DARPA)于2017年实施,其重点还在于开发用于非冯诺依曼体系结构的新处理器及其相关软件工具。在中国,国家自然科学基金建立的“国家创新发展联合基金”也包括2019年非冯诺依曼人工智能领域的人工智能领域。

在这股新浪潮中,Chase Young向DeepTech介绍说,在第四种范式中,公司自己提供特定于AI的计算能力的实践,他们从三个方向切入,希望给冯诺依曼系统和整个计算机能源瓶颈带来新的突破。

首先是“软件定义的计算能力”,人工智能的核心软件主要来自算法,而算法优化的异构计算将迎来未来五年的黄金发展时期。

阿里巴巴)

在异构计算中,当前的AI芯片GPU只是异构计算中的一种。如今,NPU,ASIC和FPGA等各种计算平台已应用于人工智能计算。之所以存在这么多不同形式的AI芯片,正是因为算法的多样性,例如用于机器学习算法的LR,GBDT,用于深度学习的CNN,DNN等等。这些算法非常复杂,如果机器是会非常快。为了运行这些算法,必须在算法的逻辑和芯片计算的逻辑之间具有高度匹配,并且效率良好。

在具体实施方面,产业链中不同厂商之间的合作实现软硬件的协同作用已成为一种新的范例。以英特尔与第四范式之间的合作为例,英特尔的产品从SkyLake发展为第二代Xeon可扩展处理器Cascade Lake。整数运算和浮点运算提高了约30%。 Sageone的第四个范例系统从SkyLake迁移到Cascade Lake,但整体性能可提高4-8倍。

4到8倍的升级背后是双方在软件加硬件方面的协同作用。 “第四种模式与英特尔建立了联合实验室。双方的合作在于软件和硬件的协同优化。由于英特尔拥有自己的技术路线图,第四种模式有自己的框架路线图,我们需要找到一个优化的通用技术路线,“Chesyan说。 “与此同时,双方的合作是基于我们对软件的理解和英特尔对硬件的理解,以及对芯片的理解和对系统的理解,实现软件的整体优化。和AI系统的硬件。目前,双方通过第二代代表Xeon可扩展处理器,奥腾数据中心级持久内存,提高AI的计算性能,优化模仿和内存容量等,涉及的技术工作相当复杂。 “

东方IC)

第二个突破在于数据。他指出,许多客户的数字转型和人工智能转型的最大瓶颈在于有计算能力但没有数据,很难建立没有数据的模型。数据在哪里,如何收集,收集的数据如何成为机器可以理解的数据,如何存储数据以确保数据可以在AI培训和推理中快速使用和调用.这些是数据现在需要优化。方向。

其中,统一的AI数据治理对企业来说是非常必要的。数字转换的要求之一是将历史批量数据与在线流式数据同步。只有这样,系统才会在建模过程中因数据不同步而导致操作精度问题。 AI的数据治理是以统一的方式聚合大量数据,并以特征和事件的形式对它们进行分类和清理。整个数据弧结构与传统BI基本不同,因此这也是未来的重要转变点。一。 “这里涉及很多技术细节,因此未来AI的存储形式会有一些变化,”他说。

第三个突破在于网络。人们普遍认为,网络和人工智能之间的关系并不大,但第四种模式发现,在开发企业级AI集成系统SageOne时,团队花了相当多的时间来优化网络。这是因为在机器学习过程中,跨节点的整个I/O交互和分布式机器学习通信压力非常大。

图4是SageOne第四范式的第四个范例

“从计算能力的底部,人工智能的演变和发展有一个明确的轨迹,即随着数据量和计算能力的爆发,人工智能在过去五年中一直蓬勃发展。目前,数据,计算力的突破,而不是算法,是人工智能在过去五年实质性商业价值突破的根本原因.事实上,尽管许多互联网和人工智能公司都在使用包括机器学习在内的人工智能算法,但大多数这些算法都是不是过去五年的技术。推动五年AI热潮的核心原因是数据爆炸和计算能力成本效益的提高,“Caisyan说。

在未来,人工智能在计算基础设施建设和计算架构突破方面有很多创新机会。计算能力也将是继续支持人工智能发展的重要部分。由此可以看出,向非冯诺依曼建筑的发展将为人工智能推动产业变革提供更持久的动力。

本文为第一作者的原创,未经授权不得转载

收集报告投诉

冯诺依曼体系结构建立于80多年前,它仍然统治着现有的计算机。然而,随着机器学习等人工智能技术的发展,由于存在分离沉积物和计算的“冯诺依曼瓶颈”,这种经典的计算机体系结构越来越难以满足机器学习的计算需求。

最近,在接受DeepTech采访时,第四范式硬件业务部负责人蔡思阳告诉DeepTech:“从整个学术界和行业的角度来看,人工智能进一步发展的公认和最具挑战性的部分在于计算机体系结构。“

作为人工智能开发的“三驾驭”(数据,算法,计算能力)之一,未来计算能力的进一步发展受到X86和冯诺依曼计算机系统的限制,创新计算机系统架构的时机已经成熟。 “第四种范式目前正在与英特尔就如何突破限制计算能力发展的瓶颈进行深入讨论。双方希望通过硬件和软件的最佳组合构建领先的AI技术架构和计算能力。 “蔡思阳说。

越来越多的学者表示,建筑创新几十年来将成为信息科学与技术领域的核心命题,甚至会带来下一个“黄金时代”。这意味着必须考虑新的计算基础设施,以进一步打破建筑层面的摩尔定律而不是晶体管层面。

性质)

目前,业界在探索非冯诺依曼计算架构方面也取得了一些进展,如AI芯片的开发和与逻辑计算和数据存储相结合的类脑芯片(如清华大学发布的“天极”芯片)在很久以前的自然)。在全球主要技术公司的尖端实验室中,也有越来越多的非冯诺依曼计算机,如光子计算机,量子计算机,神经计算机和DNA计算机。

电子文艺复兴计划由国防高级研究计划局(DARPA)于2017年实施,其重点还在于开发用于非冯诺依曼体系结构的新处理器及其相关软件工具。在中国,国家自然科学基金建立的“国家创新发展联合基金”也包括2019年非冯诺依曼人工智能领域的人工智能领域。

在这股新浪潮中,Chase Young向DeepTech介绍说,在第四种范式中,公司自己提供特定于AI的计算能力的实践,他们从三个方向切入,希望给冯诺依曼系统和整个计算机能源瓶颈带来新的突破。

首先是“软件定义的计算能力”,人工智能的核心软件主要来自算法,而算法优化的异构计算将迎来未来五年的黄金发展时期。

阿里巴巴)

在异构计算中,当前的AI芯片GPU只是异构计算中的一种。如今,NPU,ASIC和FPGA等各种计算平台已应用于人工智能计算。之所以存在这么多不同形式的AI芯片,正是因为算法的多样性,例如用于机器学习算法的LR,GBDT,用于深度学习的CNN,DNN等等。这些算法非常复杂,如果机器是会非常快。为了运行这些算法,必须在算法的逻辑和芯片计算的逻辑之间具有高度匹配,并且效率良好。

在具体实施方面,产业链中不同厂商之间的合作实现软硬件的协同作用已成为一种新的范例。以英特尔与第四范式之间的合作为例,英特尔的产品从SkyLake发展为第二代Xeon可扩展处理器Cascade Lake。整数运算和浮点运算提高了约30%。 Sageone的第四个范例系统从SkyLake迁移到Cascade Lake,但整体性能可提高4-8倍。

4到8倍的升级背后是双方在软件加硬件方面的协同作用。 “第四种模式与英特尔建立了联合实验室。双方的合作在于软件和硬件的协同优化。由于英特尔拥有自己的技术路线图,第四种模式有自己的框架路线图,我们需要找到一个优化的通用技术路线,“Chesyan说。 “与此同时,双方的合作是基于我们对软件的理解和英特尔对硬件的理解,以及对芯片的理解和对系统的理解,实现软件的整体优化。和AI系统的硬件。目前,双方通过第二代代表Xeon可扩展处理器,奥腾数据中心级持久内存,提高AI的计算性能,优化模仿和内存容量等,涉及的技术工作相当复杂。 “

东方IC)

第二个突破在于数据。他指出,许多客户的数字转型和人工智能转型的最大瓶颈在于有计算能力但没有数据,很难建立没有数据的模型。数据在哪里,如何收集,收集的数据如何成为机器可以理解的数据,如何存储数据以确保数据可以在AI培训和推理中快速使用和调用.这些是数据现在需要优化。方向。

其中,统一的AI数据治理对企业来说是非常必要的。数字转换的要求之一是将历史批量数据与在线流式数据同步。只有这样,系统才会在建模过程中因数据不同步而导致操作精度问题。 AI的数据治理是以统一的方式聚合大量数据,并以特征和事件的形式对它们进行分类和清理。整个数据弧结构与传统BI基本不同,因此这也是未来的重要转变点。一。 “这里涉及很多技术细节,因此未来AI的存储形式会有一些变化,”他说。

第三个突破在于网络。人们普遍认为,网络和人工智能之间的关系并不大,但第四种模式发现,在开发企业级AI集成系统SageOne时,团队花了相当多的时间来优化网络。这是因为在机器学习过程中,跨节点的整个I/O交互和分布式机器学习通信压力非常大。

图4是SageOne第四范式的第四个范例

“从计算能力的底部,人工智能的演变和发展有一个明确的轨迹,即随着数据量和计算能力的爆发,人工智能在过去五年中一直蓬勃发展。目前,数据,计算力的突破,而不是算法,是人工智能在过去五年实质性商业价值突破的根本原因.事实上,尽管许多互联网和人工智能公司都在使用包括机器学习在内的人工智能算法,但大多数这些算法都是不是过去五年的技术。推动五年AI热潮的核心原因是数据爆炸和计算能力成本效益的提高,“Caisyan说。

在未来,人工智能在计算基础设施建设和计算架构突破方面有很多创新机会。计算能力也将是继续支持人工智能发展的重要部分。由此可以看出,向非冯诺依曼建筑的发展将为人工智能推动产业变革提供更持久的动力。

本文为第一作者的原创,未经授权不得转载

——

信阳新闻网 版权所有© www.pdsbb.cn 技术支持:信阳新闻网 | 网站地图