李大海：提升大模型知识密度，做高效的终端智能_资讯

创始人

2024-10-19 14:21:13

今天分享的是：李大海：提升大模型知识密度，做高效的终端智能

报告共计：35页

《提升大模型知识密度，做高效的终端智能》由面壁智能CEO李大海介绍了该公司在大模型领域的成果和技术探索，核心内容如下：

- 公司发展与模型技术演进

- 发展历程：面壁智能2019年成立，2022 - 2023年发布多款大模型技术，2024年2月发布旗舰级端侧模型MiniCPM - 2B及后续更新版本，在不同维度超越GPT - 3.5及部分竞品。

- 模型技术验证：2018年见证大模型规模法则（Scaling Law），但AI发展并非单纯追求规模，面壁智能探索科学化发展，包括提升知识密度、模型制程优化等，过去四年大模型知识密度平均每8个月翻一倍。

- 高效大模型技术探索

- 知识密度原理：知识密度 = 模型能力 / 模型参数，随着数据 - 算力 - 算法协同发展，模型知识密度持续增强。

- 科学化建设：强调人工智能科学化，探索高质量数据合成与多模态融合机制、智能表示架构等问题，通过模型风洞技术提升模型成长效率，摆脱“炼丹”窘境。

- MiniCPM系列模型介绍

- 模型优势：MiniCPM是大模型科学化结晶，以小博大，同等参数性能更强，成本更低。包括基座模型、多模态模型等，适配多种场景，具有多语言、长文本、高清图像识别等能力，部分能力超越竞品。

- 应用成果：在全球技术社区获得好评，如全球下载量超146万，GitHub Star超15k等。以不同手机芯片测试，生成速度表现优秀，推理成本低。

- 端侧智能潜力与展望：芯片制程提升终端算力，模型制程提升知识密度，两者交汇揭示端侧智能潜力巨大，端侧算力分布离散且总量巨大亟待激活，端侧AI市场势能强劲。

以下为报告节选内容