大模型商业化难题待解,帮企业提升数据质量会是一个新方向吗?
创始人
2024-11-29 19:42:15

界面新闻记者 | 肖芳

界面新闻编辑 | 宋佳楠

“百模大战”爆发一年后,大模型虽然在智能办公金融和教育领域有了一些落地应用,但商业化落地难问题并没有完全得到解决

近日,猎户星空发布了一款自主研发的大模型Orion-MoE8×7B,试图去探索一些能够破解上述难题的新方向。

Orion-MoE8×7B大模型拥有8×70亿参数,采用了生成式混合专家的设计,支持中文、英语、日语、韩语等种语言与同规模参数级别的基座大模型对比Orion-MoE8×7B大模型在推理速度方面展现出一定优势

猎户星空首席科学家韩堃对界面新闻表示,很时候大模型用来聊天体验还不错,但要放到比较严肃的任务型或企业级技术应用中,效果总是不好,核心的原因就在于数据。“用更好的数据赋能大模型,其在应用中才能真正发挥价值。”

近年来,随着AI大模型进入爆发增长期,算力、算法、数据成为发展的关键三要素。相比于算法和算力,在大模型的商业闭环中,数据会直接影响其在垂直行业落地的效果。

猎户星空董事长傅盛解释背后原因,称算力供应商都是一致差距限于各家公司购买GPU规模不同算法基本差不大模型能力就是数据,之前并没有捅破这层窗户纸”

而该公司新发布大模型Orion-MoE8×7B正是看准了市场高质量训练数据需求。其研发基础模型同时联合猎豹移动旗下聚云科技共同推出大模型数据服务产品AI数据宝AirDS大模型应用需求企业提供数据收集、清洗、标注、提示词工程以及评估等服务

这相当于猎户星空研发基础模型应用帮助其他大模型落地需求企业提升训练数据质量这项服务本身有望Orion-MoE8×7B大模型实现商业化落地

界面新闻了解目前大模型训练数据标注主要还是依靠人工。但大模型训练需要数据量非常人工标注或者数据清理速度往往难以跟上市场需求成本也相当如果通过大模型海量数据进行筛选、清理、去重就能实现降本提效

不可否认,目前大模型在数据处理上还不能完全替代人工,在一些对数据质量要求比较高或者难度比较大场景人工进行精细的标注和筛选更为合适

一位大模型技术人士告诉界面新闻未来数据服务应该AI+人工结合的方式AI大模型价值数据规模快速提升上来如果数据质量非常数据量不够大模型训练仍然出现瓶颈

这意味着通过大模型进行数据处理市场需求大大增加,那些具备对外开放数据能力厂商也将得到的发展机会

相关内容

热门资讯

原创 被... 在王者荣耀中,有些皮肤可以说是非常稀有的,而且有些皮肤不只是因为限定那么简单,因为它的获取方式也比较...
海曼科技申请回路总线通讯方法专... 国家知识产权局信息显示,深圳市海曼科技股份有限公司申请一项名为“一种回路总线通讯方法、装置、电子设备...
崩铁三周年再赠240万纪念册获... 《崩坏:星穹铁道》即将迎来游戏正式上线三周年,在前两天的前瞻节目中,官方放出了周年庆期间回馈给玩家的...
2026 老板百度百科的技术逻... 互联网环境持续迭代,企业数字化名片的构建逻辑正在发生深刻转变。对于企业管理者而言,个人品牌的线上呈现...
深耕校地合作,40余家清华校友... 4月12日,作为四川—清华校地合作创新发展大会的系列活动之一,“科创天府·智汇蓉城”科技成果对接清华...