ChatGPT增加实时视频访问功能:可查看手机上看到的内容
创始人
2024-12-14 02:00:50

鞭牛士报道,12月13日消息,OpenAI周四宣布, 正在推出在 ChatGPT 移动应用程序的高级语音模式下共享手机屏幕和手机实时视频的功能,这样用户就不必在聊天中上传照片或描述周围环境。

屏幕和视频共享可以使语音聊天更高效、更有用,但它们也为 OpenAI 提供了更多访问用户潜在敏感个人信息的机会。

OpenAI 表示,通过点击聊天栏中的语音图标,可以在高级语音模式下实现屏幕和视频共享。

该功能于去年 5 月随GPT-4o发布而推出,但目前只有音频模式可用。现在用户可以使用手机摄像头与 ChatGPT 聊天,模型将看到您所看到的内容。

在直播中,首席产品官 Kevin Weil 和其他 OpenAI 团队成员演示了 ChatGPT 如何协助制作手冲咖啡。通过将摄像头对准动作,AVM 表明它理解了咖啡机的原理,并指导团队冲泡了咖啡。该团队还展示了 ChatGPT 如何通过理解手机上的一条公开消息来支持屏幕共享,Weil 戴着圣诞老人的胡须。

OpenAI 表示,这些功能将在大多数国家向 ChatGPT Plus 和 Pro 用户以及所有 ChatGPT Team 用户推出。

Enterprise 和 Edu 用户将于 1 月开始使用该功能。

OpenAI 表示,欧盟、瑞士、冰岛、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用户将很快获得该功能。

此前,谷歌宣布了Astra 项目取得的进展。Astra 项目是一款实验性的人工智能助手,它使用安卓应用程序或原型眼镜来记录人类所看到的世界。

新款 Gemini 2.0 还可以处理视觉和音频输入,并具有更多代理功能,这意味着它可以代表用户执行多步骤任务。Gemini 2.0 的代理功能目前作为研究原型以三个不同名称存在:通用 AI 助手项目 Astra、特定 AI 任务项目 Mariner 和开发人员项目 Jules。

相关内容

热门资讯

两会好声音|市人大代表刘武:大... “我主要关注算力回城、边缘计算等方面,因为随着人工智能的不断发展,社会对算力的要求越来越高。”成都市...
“极数”数据大模型(LimiX... 中新社河北雄安1月31日电 (裴国荣 韩冰)2026年雄安新区“人工智能+”创新生态系列活动1月31...
黄仁勋:英伟达与联发科合作打造... IT之家 1 月 31 日消息,据中国台湾地区媒体《经济日报》今天报道,英伟达创始人兼 CEO 黄仁...
字跳申请用于处理视频的方法专利... 国家知识产权局信息显示,北京字跳网络技术有限公司申请一项名为“用于处理视频的方法、装置、设备、介质和...
原创 得... 美国得克萨斯州又出招了!州长阿博特最近签署新令,全面禁止州政府设备使用来自中国的软件和硬件,从百度、...