2023-10-04 05:40:14 作者:姚立伟
Stability AI近日发布了其最新语言模型Stable LM 3B,该模型宣称适用于移动平台设备,能够为相关设备提供可持续、高性能的体验。 根据公告提供的信息,这种Stable LM 3B模型包含30亿个参数,并主要专注于文本生成。它采用了基于变换器解码器架构的自回归体系,并利用了多个开源大规模数据集进行训练。 官方表示,该模型使用了30亿个参数,并使用了256个NVIDIA A100 40GB GPU进行训练,尽管参数相比同类大模型较少,但其性能仍然可圈可点。此外,由于该模型的体积较小、功耗更低,因此更适合移动平台使用。该模型还具有多平台兼容性,并允许根据特定需求进行微调。 目前,这种新型语言模型已经在Hugging Face平台上开源,方便开发者使用和改进。对该模型感兴趣的用户请耐心等待。