当地时间13日,OpenAI公司在美国加州举办新品发布会,推出一款名为GPT-4o的人工智能模型。该公司表示,这款新产品在多模态方面非常强大,并且用户可以免费使用。
在发布会上,OpenAI首席技术官穆拉蒂表示,GPT-4o中的"o"代表了“全能”。新款大模型提供了GPT-4同水平的智能,并改进了文本、图像和音频方面的能力,现在这款模型能够以这三者任意组合的形式进行输入和输出,交互方式更多样、更自然。
研究人员提到,新款模型在进行语音对话时平均响应时长仅有320毫秒,与人类近似。并且,在进行对话时,用户可以随时进行打断。除了语音对话,新款模型在视觉能力方面也有显著进步。在现场演示中,研究人员在纸上随手写下方程,让模型不直接给出答案,而是解释每步应该如何做。
另外,OpenAI公司表示,新模型性能更强,接口调用价格却只有此前模型的一半。所有用户都可以免费使用新模型,不过消息数量会受到限制,付费用户消息上限更高。预计新模型各项功能会在未来几周逐步推出。5月到6月,人工智能领域多家重要企业将集中举办发布会。接下来,谷歌2024年I/O开发者大会将于当地时间5月14日举行,微软Build开发者大会将于5月21日举行。而苹果公司的年度全球开发者大会将在6月10日至14日举行。不少分析都认为,本次苹果可能推出更多人工智能相关功能。
转自:CCTV4《中国新闻》
中央广播电视总台华语环球节目中心新媒体
来源:CCTV4