今天分享的是:AI大模型专题:AI大模型开源生态及大模型平台实践(演讲PPT)
报告共计:40页
该文档主要介绍了AI大模型开源生态及大模型平台实践,包括生态基石、模型底座和平台架构三个部分。
在生态基石部分,AI大模型发展迅速,通过增加模型参数、训练数据和训练轮数可增大模型容量,但当前模型性能提升趋缓且成本高昂。ChatGPT是大算力、大数据驱动的大模型,通过人工反馈强化学习增强模型效果,其商业模式包括云服务、传统业务升级和垂类解决方案等。
在模型底座部分,华为提供集群全栈软硬件能力,使能大模型开发、训练、微调、部署。昇思MindSpore持续演进,支持大模型,实现训练 - 推理全流程技术闭环,具备高效能训练和推理、AI for Science融合、易用性覆盖全流程等特点,在CV/OCR等领域关键模型精度性能领先,支持第三方框架兼容,使能中科院 - 紫东·太初升级2.0。
在平台架构部分,大算力赋能大模型,使能新应用,牵引生态聚合,加速产业发展。昇思大模型平台打造大模型开源生态,使能垂直行业,赋能百万开发者,提供模型在线训练/推理部署、大模型可视化在线体验等功能,通过Jupyter + MindFormers打造极简一站式开发、推理与部署,共建垂直行业专区,推动行业领域模型应用生态。
总之,AI大模型开源生态及大模型平台实践在不断发展和完善,为人工智能的发展提供了有力支持。
以下为报告节选内容