李大海:提升大模型知识密度,做高效的终端智能
创始人
2024-10-19 14:21:13

今天分享的是:李大海:提升大模型知识密度,做高效的终端智能

报告共计:35页

《提升大模型知识密度,做高效的终端智能》由面壁智能CEO李大海介绍了该公司在大模型领域的成果和技术探索,核心内容如下:

- 公司发展与模型技术演进

- 发展历程:面壁智能2019年成立,2022 - 2023年发布多款大模型技术,2024年2月发布旗舰级端侧模型MiniCPM - 2B及后续更新版本,在不同维度超越GPT - 3.5及部分竞品。

- 模型技术验证:2018年见证大模型规模法则(Scaling Law),但AI发展并非单纯追求规模,面壁智能探索科学化发展,包括提升知识密度、模型制程优化等,过去四年大模型知识密度平均每8个月翻一倍。

- 高效大模型技术探索

- 知识密度原理:知识密度 = 模型能力 / 模型参数,随着数据 - 算力 - 算法协同发展,模型知识密度持续增强。

- 科学化建设:强调人工智能科学化,探索高质量数据合成与多模态融合机制、智能表示架构等问题,通过模型风洞技术提升模型成长效率,摆脱“炼丹”窘境。

- MiniCPM系列模型介绍

- 模型优势:MiniCPM是大模型科学化结晶,以小博大,同等参数性能更强,成本更低。包括基座模型、多模态模型等,适配多种场景,具有多语言、长文本、高清图像识别等能力,部分能力超越竞品。

- 应用成果:在全球技术社区获得好评,如全球下载量超146万,GitHub Star超15k等。以不同手机芯片测试,生成速度表现优秀,推理成本低。

- 端侧智能潜力与展望:芯片制程提升终端算力,模型制程提升知识密度,两者交汇揭示端侧智能潜力巨大,端侧算力分布离散且总量巨大亟待激活,端侧AI市场势能强劲。

以下为报告节选内容

相关内容

热门资讯

山东黄金集团深井开采实验室一项... 来源:市场资讯 (来源:山东黄金集团) 近日,从国家知识产权局获悉,山东黄金集团深井开采实验室参与研...
水田插秧之后 马云低调现身麻省... 快科技6月25日消息, 近日有网友曝出照片,阿里巴巴创始人马云在杭州参加插秧活动后,又低调前往美国麻...
端网业协同创新 中国移动河南公... 【大河财立方消息】6月25日,在2026上海世界移动通信大会期间,面向端网业协同的5G-A体验经营产...
字跳申请界面交互方法专利,提高... 国家知识产权局信息显示,北京字跳网络技术有限公司申请一项名为“界面交互的方法、装置、设备和存储介质”...
2026年准大学生万元预算OP... OPPO数码全家桶 随着2026年高考结束,准大学生们即将迎来人生的新篇章。一份能够陪伴学习、娱乐与...