今天分享的是:李大海:提升大模型知识密度,做高效的终端智能
报告共计:35页
《提升大模型知识密度,做高效的终端智能》由面壁智能CEO李大海介绍了该公司在大模型领域的成果和技术探索,核心内容如下:
- 公司发展与模型技术演进
- 发展历程:面壁智能2019年成立,2022 - 2023年发布多款大模型技术,2024年2月发布旗舰级端侧模型MiniCPM - 2B及后续更新版本,在不同维度超越GPT - 3.5及部分竞品。
- 模型技术验证:2018年见证大模型规模法则(Scaling Law),但AI发展并非单纯追求规模,面壁智能探索科学化发展,包括提升知识密度、模型制程优化等,过去四年大模型知识密度平均每8个月翻一倍。
- 高效大模型技术探索
- 知识密度原理:知识密度 = 模型能力 / 模型参数,随着数据 - 算力 - 算法协同发展,模型知识密度持续增强。
- 科学化建设:强调人工智能科学化,探索高质量数据合成与多模态融合机制、智能表示架构等问题,通过模型风洞技术提升模型成长效率,摆脱“炼丹”窘境。
- MiniCPM系列模型介绍
- 模型优势:MiniCPM是大模型科学化结晶,以小博大,同等参数性能更强,成本更低。包括基座模型、多模态模型等,适配多种场景,具有多语言、长文本、高清图像识别等能力,部分能力超越竞品。
- 应用成果:在全球技术社区获得好评,如全球下载量超146万,GitHub Star超15k等。以不同手机芯片测试,生成速度表现优秀,推理成本低。
- 端侧智能潜力与展望:芯片制程提升终端算力,模型制程提升知识密度,两者交汇揭示端侧智能潜力巨大,端侧算力分布离散且总量巨大亟待激活,端侧AI市场势能强劲。
以下为报告节选内容