李大海:提升大模型知识密度,做高效的终端智能
创始人
2024-10-19 14:21:13

今天分享的是:李大海:提升大模型知识密度,做高效的终端智能

报告共计:35页

《提升大模型知识密度,做高效的终端智能》由面壁智能CEO李大海介绍了该公司在大模型领域的成果和技术探索,核心内容如下:

- 公司发展与模型技术演进

- 发展历程:面壁智能2019年成立,2022 - 2023年发布多款大模型技术,2024年2月发布旗舰级端侧模型MiniCPM - 2B及后续更新版本,在不同维度超越GPT - 3.5及部分竞品。

- 模型技术验证:2018年见证大模型规模法则(Scaling Law),但AI发展并非单纯追求规模,面壁智能探索科学化发展,包括提升知识密度、模型制程优化等,过去四年大模型知识密度平均每8个月翻一倍。

- 高效大模型技术探索

- 知识密度原理:知识密度 = 模型能力 / 模型参数,随着数据 - 算力 - 算法协同发展,模型知识密度持续增强。

- 科学化建设:强调人工智能科学化,探索高质量数据合成与多模态融合机制、智能表示架构等问题,通过模型风洞技术提升模型成长效率,摆脱“炼丹”窘境。

- MiniCPM系列模型介绍

- 模型优势:MiniCPM是大模型科学化结晶,以小博大,同等参数性能更强,成本更低。包括基座模型、多模态模型等,适配多种场景,具有多语言、长文本、高清图像识别等能力,部分能力超越竞品。

- 应用成果:在全球技术社区获得好评,如全球下载量超146万,GitHub Star超15k等。以不同手机芯片测试,生成速度表现优秀,推理成本低。

- 端侧智能潜力与展望:芯片制程提升终端算力,模型制程提升知识密度,两者交汇揭示端侧智能潜力巨大,端侧算力分布离散且总量巨大亟待激活,端侧AI市场势能强劲。

以下为报告节选内容

相关内容

热门资讯

CAC2026举办,完美世界持... 5月24日,2026年反恐精英亚洲邀请赛(CAC2026)在上海源深体育中心落幕。卫冕冠军Legac...
这个在Steam闷声发财的新兴... 最近无聊逛Steam,陀螺君注意到了一个颇有意思的细分游戏品类:“傻瓜式点击游戏”。 这类游戏的玩法...
向苏超取经,外地观众超9成,原... “我们把原来的冬冠改名为挑战者杯,希望能激励更多挑战者去拼搏竞逐,所以我们想看到的故事,谜底就在谜面...
美少女卡牌《卡厄思梦境》首发、... 阿里巴巴灵犀互娱旗下游戏平台 各位玩家好啊,欢迎来到本期的「新游抢先报」!每周,九酱都会筛选一批有潜...
原创 U... Uzi回应送老婆180W项链,这是生小孩应得的,直播哭穷被吐槽,在电竞圈,“高收入”和“高消费”一直...