网站首页

产品中心

智能终端处理器 智能云服务器 软件开发环境

新闻中心

关于开元体育

公司概况 核心优势 核心团队 发展历程

联系开元体育

官方微信 官方微博
主页 > 新闻中心

开元体育上海人工智能实验室许劭华:评测对于AI大模型后续研发非常重要

发布时间:2023-10-21 22:04浏览次数: 来源于:网络

  在10月21日举行的第四届1024资管科技开发者大会(ITDC 2023)资产管理垂直领域大模型开发与应用论坛上,上海实验室书生大模型生态和产业合作负责人许韶华分享了大语言模型技术总览,即数据准备、预训练、指令微调、部署&推理、模型评测。

  许韶华表示,大规模构建高质量语料数据是大模型研发中非常具有挑战的环节,其中精细化数据处理是关键,而掌握领域数据是建设行业大模型的关键。算力方面,语言大模型的预训练计算量巨大,需要在大规模计算集群上进行,并且依赖高效的训练系统以充分发挥集群算力。在技术层面,实现大模型的高效且稳定的训练也是非常具有挑战性的。

  许韶华认为:“评测主要目的不是为了排名,而是指路,对于我们认识模型能力,安排后续研发非常重要。”

  开元体育

  在国家标准化总体组近期成立的大模型专题组中,上海实验室担任组长。在大模型安全对齐与评测方面,上海人工智能实验室是中国网络空间安全协会人工智能安全治理专业委员会副主任委员,围绕框架规范、评测数据、评测技术、对齐技术、评测平台等方面开展工作。

  此外,上海人工智能实验室与中国信息通信研究院联合成立大模型测试验证与协同创新中心;联合优势单位成立大模型语料数据联盟,该联盟将以模型能力测评验证为抓手,构建具有严谨性、科学性、引领性的测评验证指标及平台服务。

  据许韶华介绍,上海人工智能实验室,以原始创新引领技术进步,以开源开放赋能创新生态,构建了书生通用大模型体系。其中轻量级(InternLM-7)是社区低成本可用最佳模型规模;中量级(InternLM-20B)是商业场景可开发定制高精度较小模型规模;重量级(InternlM-123B)通用大语言模型能力全面覆盖千亿模型规模。

下一篇:中国水质遥感专开元体育家学者交流研讨 共促遥感大数据与人工智能深度融合
上一篇:加拿大工程院院士崔曙光:生成式人工智能有开元体育潜力实现无线网络的全局控制

咨询我们

输入您的疑问及需求发送邮箱给我们