商汤股价涨超30%,大模型性能全面对标GPT-4 Turbo
澎湃新闻
2024-04-24 18:34:33

原标题:商汤股价涨超30%,大模型性能全面对标GPT-4 Turbo

4月24日,商汤-W(0020.HK)股价涨超30%。4月23日,商汤科技发布日日新5.0大模型,采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到 200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。

商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”

商汤端侧大语言模型可在中端平台实现18.3字/s的平均生成速度,旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

徐立还展示了商汤的文生视频能力,并表示会在很短时间发布文生视频平台。(澎湃新闻记者 秦盛)

相关内容

热门资讯

商品条码新规有何作用(政策速递... 商品条码是商品的“身份证”,是商品流通的“通行证”,是产品质量追溯和数字化监管的重要抓手。近日,市场...
成都人工智能如何长出“热带雨林... 龙头西进、单人成军、培育AI训练师 成都人工智能如何长出“热带雨林”? 明途科技WorkBrai...
TES零封AL后,小奶油发文小... LPL精彩赛事依旧在火热进行中,虽然第二赛段只开启了几天,但是比赛的精彩程度确实让人大饱眼福,主要是...
博通将为谷歌供应TPU芯片、为... 根据博通周一向SEC提交的监管文件,该公司已同意为谷歌生产未来版本的人工智能芯片,同时还与Anthr...
青岛塑科机械取得箱板生产裁切切... 国家知识产权局信息显示,青岛塑科机械有限公司取得一项名为“一种箱板生产裁切切割机”的专利,授权公告号...