商汤股价涨超30%,大模型性能全面对标GPT-4 Turbo
澎湃新闻
2024-04-24 18:34:33

原标题:商汤股价涨超30%,大模型性能全面对标GPT-4 Turbo

4月24日,商汤-W(0020.HK)股价涨超30%。4月23日,商汤科技发布日日新5.0大模型,采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到 200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。

商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”

商汤端侧大语言模型可在中端平台实现18.3字/s的平均生成速度,旗舰平台可达78.3字/s。扩散模型端侧推理速度小于1.5秒,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

徐立还展示了商汤的文生视频能力,并表示会在很短时间发布文生视频平台。(澎湃新闻记者 秦盛)

相关内容

热门资讯

2026世界杯成AI网络攻击:... 随着2026年世界杯在美国、加拿大和墨西哥拉开帷幕,这场赛事将成为人工智能驱动网络攻击时代的首个大型...
中外高校代表齐聚辽宁探路科教协... 沈阳6月10日电 (王涵)“面对全球性挑战,国际科学合作已不再是可有可无的选择,而是势在必行的必然要...
原创 作... 肯尼迪航天中心的展厅里,"亚特兰蒂斯"号航天飞机被高高悬挂在半空,机腹朝下,姿态宛如刚刚出舱归来。 ...
Siri AI或将在长时间对话... 随着对话式聊天机器人的普及,一个日益受到关注的问题是:部分用户可能对其产生过度依赖,或长时间将其当作...
脑机接口新突破:两地患者凭神经... 两位高位截瘫患者通过脑虎科技自研的“全植入、全无线、全功能”脑机接口系统,完成了一场相隔约八百公里的...