网站首页

产品中心

智能终端处理器 智能云服务器 软件开发环境

新闻中心

关于开元体育

公司概况 核心优势 核心团队 发展历程

联系开元体育

官方微信 官方微博
主页 > 新闻中心

人工智能未来发展之路开元体育

发布时间:2023-10-16 12:42浏览次数: 来源于:网络

  开元体育人工智能(Artificial Intelligence,AI)已经无处不在。在数字化转型的时代,当人们转向更加频繁的数字交互时,来自数字虚拟世界的海量数据与真实物理世界无缝融合。随着数据的数量、种类和产生速度的增加,人工智能代表了从海量数据中提取见解和推进其他新兴技术的重要关键步骤

  人工智能算法以及硬件加速系统正在提高企业的商业决策效率,改进业务流程,并在大规模上提供更智能、更实时的数据分析结果。人工智能正在从根本上改变企业的运营方式,重新定义人们的工作方式,并在全球范围内改变各个行业。在数字化转型的时代,我们的社会和企业都需要更多地利用智能化的信息系统架构、应用软件和算法以及数据优先的策略来充分发挥企业的商业潜力。

  这里我也简单列举反映人工智能蓬勃发展的一些关键数据:62%的全球企业都在一定程度上投资了人工智能 [1] ;全球53%的数据和分析决策者表示,他们正计划实施某种形式的人工智能 [2] ;到2022年,75%的企业将智能自动化嵌入到技术和工艺开发中 [3] 。

  如前文所述,人工智能在最近几年得到了长足的发展,但是我们依然有不少亟需解决的问题。在本文中,我将首先分析目前人工智能发展中尚待解决的核心问题,随后提出我们在人工智能领域重点发展方向的一些想法。

  现如今人工智能的主流算法以机器学习(Machine Learning)的深度神经网络(Deep Neural Network)[13]为基础。随着人工智能技术的发展,深度神经网络的结构越来越复杂,超参数(Hyperparameter)越来越多。

  复杂的深度神经网络提高了机器学习模型的精度,然而配置与调试如此复杂的网络也会让人工智能的普通使用者望而却步。深度神经网络的算法以及应用的简易开发、调试与部署也变得越来越紧迫

  时下深度神经网络的高效推理识别主要依赖于大量训练数据的支撑。开放的数据库如ImageNet[9]提供了成千上万的图片,视频以及相应的标注信息。通过大量数据的训练,机器学习模型几乎能够覆盖各种推理识别场景的变化。然而如果数据量不够或者类型不够全面,机器学习模型的表现势必会有所局限性,正所谓“没有看过就没有切身体会”。在工业界的人工智能应用中,数据紧缺的问题尤其突出。不同于传统面向普通消费者的推理识别应用,工业界的人工智能应用往往都是和业务相关的独特问题(例如:智能制造、远程系统调试与维护等),相应的数据(尤其是负样本)特别少。

  在训练数据紧缺的情况下,如何改进人工智能的算法模型,使其能够在特定的场景以及有限数据下仍然高效工作也是一个新的紧迫任务

  如前两方面所述,深度神经网络的复杂性以及大数据的多样性都会导致目前人工智能应用对于计算资源的高消耗性。目前比较先进的机器学习模型,例如GPT-3的训练,利用高性能集群动辄就需要几个月[10]。普通的机器学习模型在传统的x86高性能服务器上训练如果数据量较大也需要几个小时甚至几天。同时,训练好的模型在执行推理识别任务时,由于模型结构较复杂,超参数较多、计算较复杂,对于处理数据的终端设备的计算资源要求也更加高。例如,轻便的IoT设备无法运行复杂的机器学习推理识别模型,或者对于智能终端设备,例如智能手机而言,运行复杂的机器学习模型会导致电池电量消耗较大。

  如何能够更好地、充分地优化计算资源,用于支持机器学习的训练和推理识别也是另一个新的紧迫任务。

  利用深度神经网络的人工智能技术,由于神经网络的复杂性,很多时候人们都会把他们当作一个“黑匣子”。用户输入需要推理识别的数据,深度神经网络通过一系列“复杂且未知”的数学处理,得到推理识别的结果。然而,对于输入的数据为什么会得到相对应的结果,通过复杂的神经网络我们无法直观分析出来。在一些关键人工智能领域,例如自动驾驶,

  。在一些与安全相关的关键场景中,为什么自动驾驶系统做出这样的驾驶决定?为什么有时候对路况推理识别错误?这些从“黑匣子”里出来的推理识别结论必须能够解释,必须能够溯源。

  人工智能只有可解释了,我们才能找到决策判断的依据,才能找出推理识别错误的原因。“从果到因”,我们才能改进深度神经网络的性能,使其能够在不同的场合更加高效、安全、可靠的提供人工智能的应用

  当然,除了以上列举的目前人工智能亟需解决的四大主要问题,人工智能还有一些其他的局限性,例如人工智能的隐私、人工智能的通用,以及发展人工智能的人才稀缺、人工智能的法律约束等等,我在这里就不再一一赘述。我在本文中会重点针对上面列出的四大主要问题,探讨未来发展之路。

  针对前文列出的人工智能亟需解决的四大主要问题,下面我将简述对于未来发展,我们需要关注的主要技术方向:

  首先,我们需要成为“第三次人工智能浪潮”(3rd Wave AI)的促进传播者,为我们的企业社会迎接即将到来的人工智能变革做好准备

  。这些变革将推动我们的数据管理、人工智能算法以及硬件加速器的蓬勃发展。我们需要积极与推动“第三波人工智能浪潮”的客户和研究实体开拓新的合作模式。那么,什么是“第三波人工智能浪潮”?

  从算法的角度出发,我们总结为语境顺应(Contextual Adaptation)的概念

  我们在人工智能系统中需要建立可信赖的决策能力,使人们能够理解或者分析“黑匣子”的机器学习算法模型为什么做出推理识别的决定。具体而言,安全可信的人工智能需要解决的三个问题:

  如何构建可以通过一个(One-Shot Learning[6])或者极少数量(Few-Shot Learning[7])的示例进行机器学习模型训练的人工智能系统。

  如前文所述,真实工业应用场景下,数据比较稀缺,在极其有限的数据下有效构建训练机器学习模型是目前的一个热门研究方向

  相对于传统、开环的离线学习(Offline Learning),在线学习(Online Learning)[20]作为一个新兴方向,是一个闭环系统:机器学习模型基于目前的参数和架构将推理识别结果发送给用户,收集用户反馈,并用以更新优化模型,从而完成一个不断接受信息并更新迭代的优化过程。

  多场景学习(Multi-Task Learning)[21]指的是训练数据中包含来自多个不同场景的样本,且在学习过程中利用该场景信息提升机器学习任务性能的学习方法。

  传统的迁移学习中的场景自适应方法通常只实现原场景到目标场景之间的双向知识迁移,而多场景任务学习鼓励多场景之间的双向知识迁移

  基于语境的上下文信息进行机器学习模型训练,随着时间的推移和场景的迁移,人工智能系统将逐步学习自主构建更新模型的方法[11]。

  通过语境学习(Contextual Learning[15])而来的机器学习模型将被用来更好地感知世界,帮助人类更加智能地做出推理决策

  随着人工智能技术的快速发展,基于深度神经网络的知识表示和知识推理受到越来越多的关注,也陆续出现了不同场景的场景知识图谱[22]。

  作为一种语义网络,场景知识图谱刻画了场景知识,为场景内的推理识别任务提供了基础。作为知识推理的应用,基于知识图谱的问答系统取得了长足的发展

  ,也能帮助我们更好地对我们的数据和需要感知的世界进行抽象化(Abstraction)[16],从而使我们的人工智能系统更加通用化,得以适应解决各类复杂问题。

  总结而言,“第三波人工智能浪潮”的先进算法不仅能够从环境中的数据(感知,Perceive)中提取有价值的信息(学习,Learn),也能创造新的意义(抽象,Abstract),并有能力协助人类计划和决定(理性,Reasoning),同时满足人类的需求(整合,Integration)和关切(道德、安全,Ethics,Security)。

  从硬件的角度出发,特定领域架构(Domain Specific Architectures,DSA)[12]的加速器使第三波人工智能的算法能够在边缘(Edge)、数据中心(Core)以及云(Cloud)组成的混合生态系统中的任何地方运行

  。具体而言,特定领域架构的加速器包括以下例子:Nvidia的 GPU、Xilinx的FPGA 、Google 的TPU以及人工智能加速芯片如BrainChip的Akida Neural Processer、GraphCore的Intelligent Processing Unit(IPU)、寒武纪的Machine Learning Unit(MLU)等等。由于需要较少的训练数据并能够在需要时以较低的功率运行,这些类型的特定领域架构加速器将被集成到更多的信息设备、架构和生态系统中。

  针对这一趋势,我们需要重点发展的领域是开发一套统一的异构体系架构方法,使信息系统能够轻松地集成和配置各种不同类型的特定领域架构硬件加速器。对于戴尔科技集团而言,我们可以利用戴尔全球庞大的供应链与销售网络吸引特定领域架构加速器的供应商遵守戴尔定义的标准接口,从而实现统一的异构体系架构

  总结而言,“第三波人工智能浪潮”的硬件不仅应该更强大(Powerful),也要更聪明(策略,Strategic)和更事半功倍(高效,Effective and Efficient)。

  除了以上所述推动“第三波人工智能浪潮”的算法和硬件的发展,另外一个需要我们更多关注的发展方向是人工智能自动化(AutoML)[12]。如前文所述,人工智能发展得越来越复杂,对于普通用户而言,使用人工智能的专业技能门槛越来越高。我们亟需提供一套完整的“让人工智能变得简单”的信息系统架构方案。

  我们需要更好地操作和管理人工智能的工作负载,推动信息系统架构的简化和优化。在整个人工智能应用的软件堆栈里面,我们需要定义针对于未来人工智能工作负载的“

  (Application Protocol Interface),以便信息系统架构集成使用更加先进复杂的算法。

  提供机器学习模型参数自适应(Adaptive)选择与调优(Tuning)的策略

  ,根据用户的需求,自动选择最合适的算法,同时优化算法的参数取得最佳性能表现。

  ,例如[14]所述的MLOps(Machine Learning Operation)。机器学习流程管理(MLOps)是创建新的机器学习(ML)和深度学习(DL)模型,并通过可重复、自动化的工作流程将其部署到生产中的实践。当我们有新的人工智能应用问题时,我们可以借鉴以前已有的数据处理流程,略作分析与修改后就可以复用之前较成熟的人工智能软硬件方案满足新的需求,从而减少重复开发的资源浪费。

  当我们的人工智能系统完成部署以后,我们的算法模型依然需要有自我更新、自我学习、自我调优的演化(Evolve)功能

  。根据推理识别场景和推理识别任务的变化以及算法精度的衰减,我们利用边缘以及云的信息系统架构充分调动不同的计算资源来更新、优化以及部署我们的算法模型。在人工智能模型的更新部署过程中,我们也会用到模型压缩[17]、数据蒸馏(Distillation)[19]以及知识蒸馏[18]等最新算法,从而充分利用有限的计算资源。

  我们需要考虑在多云和混合云的环境中集成启用上述人工智能的自动化服务,与数据管理和编排(Data Management and Orchestration)保持一致,创建一个完整且智能化的人工智能服务平台

  总结而言,人工智能的自动化不仅应该更简便(Easy to Use),但也要更灵活(适应,Adapt)和更具有自我学习、成长(演进,Evolve)的能力。

  戴尔科技集团的技术创新永远不会停步。我们的使命是促进人类社会进步,推动技术创新,成为数据时代最重要的科技公司。我们的人工智能解决方案将会协助我们的客户从目前复杂的大规模数据处理、分析和洞悉(Insights)的流程中解放出来。我们首席技术官办公室(Office of CTO)的研究部门(Research Office)也在积极探索上述的人工智能发展方向。我们致力于帮助我们的客户更好地利用最先进的信息系统架构,高效以及及时地了解他们的数据,为他们的商业业务创新带来更大的价值。

  致谢:感谢戴尔科技集团中国研究院人工智能研究团队(李三平、倪嘉呈、陈强、王子嘉、杨文斌等)在人工智能领域的卓越研究,他们的工作成果大力支持了本文的内容整理。

下一篇:规范管理确保人工智开元体育能安全向善
上一篇:“人工智能与中国式现代开元体育化”专题论坛在宁举行

咨询我们

输入您的疑问及需求发送邮箱给我们