经济日报 | 作者 佘惠敏
今年以来,国内外科技企业竞相围绕大模型扩展商业版图。据统计,截至今年7月底,我国累计有130个大模型问世,其中,仅今年前7个月就有64个大模型发布。国产大模型进入高速发展期,加速千行百业的数字化与智能化转型。
赋能场景应用
正在进行的杭州亚运会是史上首届云上亚运,基于阿里云实现核心系统百分百上云。在杭州亚运会数字科技体验中心,游客借助艺术装置“畅想未来亚运”,就能让阿里云的绘画创作大模型“通义万相”现场绘画,生成亚运主题图像。
“阿里云是最早投入大模型研发的科技公司之一,2019年开始布局大模型。”阿里云CTO周靖人告诉记者,今年以来,阿里云连续推出多个自研通义大模型和大模型应用产品,已具备处理或生成文本、语音和图片等多种模态内容的能力,并在各行各业广泛应用。
9月21日,华为云在华为全联接大会2023上发布盘古医学大模型。该模型具备医学临床辅助能力,将有效支撑医学检验、临床辅助诊疗、个人健康管理等场景应用。华为常务董事、华为云CEO张平安介绍,基于盘古大模型研发的润达医疗大模型·良医小慧,将走进4000家医院,辅助医生进行报告解读和诊断。
9月5日,2023百度云智大会宣布,百度智能云千帆大模型平台上,月活企业数已近万家,覆盖金融、制造、能源、政务、交通等行业的400多个场景。
中国移动研究院主任研究员黄实介绍,中国移动已发布“九天·海算政务大模型”和“九天·客服大模型”两个行业大模型,正与市场需求方在政务、医疗、司法、教育等领域持续展开深入合作,共同推进大模型技术在实际场景中的应用。
技术挑战待解
大模型重塑千行百业的背后,是众多复杂的技术挑战。
“伴随着参数和数据的提升,大模型对算力的要求也不断提高,提供算力的GPU芯片已供不应求。”黄实建议,下一步,要打造以算力网络为核心的新型基础设施,以网强算,缓解算力供给不足。“要通过算力网络连接泛在化的算力资源,利用网络集群优势,突破单点算力的性能极限;通过整网资源的最优化配置和使用,缓解算力不足的问题。”
“找到合适的落地场景是大模型遇到的最大挑战。”百度智能云AI与大数据平台总经理忻舟表示,百度目前研究了400多个场景,每个场景对大模型的使用方法、行业经验都不同。在部分标杆行业场景,百度的算法专家会针对不同客户、不同需求总结共性特征,不断沉淀经验、积累工具、完善工具链。
华为云CTO张宇昕认为,随着大模型能力的涌现,模型参数将很快达数万亿,对海量的稳定算力、大规模并行训练以及整体的架构设计都提出了更高要求。同时,随着数据集规模的快速增长,数据高效存储、清洗和标注的难度等问题仍有待优化。
共建开源生态
人工智能引发生产生活方式、社会治理模式、科学研究范式的变革,为经济社会高质量发展提供了新的动力。共建大模型生态,降低使用门槛,是“炼大模型”的科技巨头们的一致选择。
“阿里云希望和全行业共建大模型开源生态,进一步降低大模型使用门槛。”周靖人介绍,阿里云一方面自研了通义大模型系列,另一方面也在为大模型创业公司和开发者提供服务,推动大模型生态繁荣。阿里云魔搭社区是大模型开源社区,目前已集聚了230多万人工智能开发者、1200多个优质人工智能模型,模型累计下载总量超过8500万。
清华大学党委书记邱勇表示,要瞄准世界科技前沿和国家重大战略需求推进科研创新;加强人工智能方向拔尖创新人才自主培养,为关键核心技术攻关提供人才支撑;服务人工智能领域创新链产业链深度融合,提升教育对高质量发展的支撑力贡献力。
护航大模型发展,还需做好顶层设计,筑牢安全防线。科技部部长王志刚表示,要抢抓新一轮人工智能发展的重大机遇,坚持系统思维,把握人工智能发展规律和趋势,按照强基础、促发展、保安全的思路,做好顶层设计,以体系化工程思路进行科技攻关,以创新链和产业链有机融合构建创新生态,以“发展是最大安全”的理念健全治理体系。