ChatGPT重磅更新!可以通过图片和语音命令交互
澎湃新闻
2023-09-26 09:28:15
0

原标题:ChatGPT重磅更新!可以通过图片和语音命令交互

·OpenAI在其官网宣布,目前正在推出ChatGPT的新版本,除了通过常见的文本框交互外,现在它正在学会以新的方式理解人类的问题,比如通过大声说话或者上传一张图片。

·随着越来越多的人使用语音控制和图像搜索,并且ChatGPT越来越接近成为一个真正多模式、有用的虚拟助手,维持住安全护栏会变得越来越困难。

OpenAI在其官网宣布,ChatGPT现在可以“看”、“听”和“说”了。

自诞生以来,ChatGPT的大部分更新主要在于,这个基于AI的机器人可以做什么、可以回答哪些问题、可以访问哪些信息,以及如何改进其基础模型等方面。这一次,OpenAI正在调整使用ChatGPT的方式。

北京时间9月25日晚,OpenAI在其官网宣布,目前正在推出ChatGPT的新版本,除了通过常见的文本框交互外,现在它正在学会以新的方式理解人类的问题,比如通过大声说话或者上传图片。

具体而言,在语音方面:第一,允许用户进行语音对话,提供更直观的交互方式;第二,支持在iOS和Android移动应用上使用;第三,提供5种不同的语音选择;第四,通过新型文本转语音模型和语音识别系统实现。

这应该感觉就像与苹果的Siri交谈一样,只是OpenAI希望,通过改进基础技术使其说出更好的答案。目前,大多数虚拟助手,如亚马逊的Alexa,都在以大语言模型(LLM)为基础进行改进。

据OpenAI介绍,新的语音功能由一个新的文本到语音模型提供支持,该模型能够从文本和几秒钟的语音样本生成“类似人类的音频”。OpenAI似乎还认为该模型的潜力不止于此,其正在与流媒体音乐服务平台Spotify合作,将播客翻译成其他语言,同时保持播音者的声音。合成语音有许多有趣的用途,而OpenAI可能会成为该行业的重要组成部分。

然而,只需几秒钟的音频就能构建出功能强大的合成音色,这也为各种问题性用例敞开了大门。“这些功能还带来了新的风险,比如恶意行为者冒充公众人物或实施欺诈的可能性”,OpenAI在其宣布新功能的博文中写道。OpenAI表示,出于这个原因,该模型不会广泛被使用,而更多受到特定用例和合作伙伴的限制。

在图像方面,第一,允许用户上传图像与ChatGPT进行交互;第二,支持多张图像;第三,提供移动应用上的绘图工具;第四,使用多模态GPT模型(Generative Pre-Trained Transformer,生成式预训练Transformer模型)理解图像;第五,在接下来的两周内首先面向Plus(付费订阅用户)和企业用户推出;第六,语音和图像功能的推出采取渐进策略,以确保安全性;第七,要注意模型局限性,避免高风险场景下对其依赖。

图像搜索有点类似于Google Lens的功能,用户拍摄自己感兴趣的任何东西的照片,ChatGPT去尝试了解用户在询问什么,并做出相应的回应。用户还可以使用应用程序的绘图工具帮助明晰自己的诉求,或配合图像进行说话或写入问题。

这是ChatGPT希望实现的一个互动特性:与其进行一次搜索得到错误答案,然后再重新进行一次搜索,不如在进行的过程中提示AI机器人完善答案。

不过,显然图像搜索也有其潜在问题。比如,如果用户询问的是关于一个人的情况,ChatGPT该如何反应?OpenAI表示,他们故意限制了ChatGPT“分析和直接陈述关于人的能力”,这既是为了准确性,也是为了隐私原因。这意味着对于AI的一个极具科幻色彩的想象——看着某人然后问AI“那是谁”,并不会很快实现。

在ChatGPT首次推出将近一年后,OpenAI似乎仍在寻找,如何为其AI机器人增加更多功能和能力而不会产生新的问题和缺点。OpenAI也试图通过有意限制其新模型的功能,来维持“更进一步”和“降低风险”这两者之间的平衡。但这种方法可能不会永远奏效。随着越来越多的人使用语音控制和图像搜索,并且ChatGPT越来越接近成为一个真正多模式、有用的虚拟助手,维持住这个护栏会变得越来越困难。

相关内容

热门资讯

江苏美能取得中空纤维内压膜通量... 金融界2025年3月14日消息,国家知识产权局信息显示,江苏美能膜材料科技有限公司取得一项名为“中空...
神策数据携手DeepSeek,... 在人工智能技术的不断演进中,神策数据正积极引领数据分析和智能运营领域的新变革。该公司近日宣布,已全面...
服务器安全防护策略及入侵应对技... 文章标题:应对服务器入侵的全方位指南:从预防到恢复 摘要:服务器被入侵是一个令人担忧的问题,但通过正...
我来教你牛牛房卡找谁买,房卡游... zaJ1N从核心配置来看,这款OPPO Reno10新机将搭载高通骁龙7+gen2旗舰级处理器,采用...
推荐一款微信金花房卡怎么弄,微... 9zzjgF因此整个手机看起来非常的好看。在参数方面,据悉该机采用了5000万像素大底主摄+3200...
我来告诉你正版房卡批发大厅,金... RzlyIQ关键是苹果手机一直都有着战三年的称号,再加上iOS系统也在逐渐变得给力,也就会导致产品本...
一分钟揭秘金花房卡怎么购买,牛... msSoY0P再加上直面屏的设计以及控制得相当合理的前置挖孔,因此整个手机正面的视频效果非常的赏心悦...
玩家实测房卡多少钱一张价格,金... s从核心配置来看,这款OPPO Reno9手机搭载了高通骁龙778G处理器,采用了更先进的6nm工艺...
玩家实测微信金花房卡在哪里购买... 4d9Q.延续了几代的刘海屏也将会被抛弃,采用了全新的“感叹号”屏。以前一直觉得iPhone产品的刘...
我来告诉你牛牛房卡最低价格,房... TLaT富有且慷慨!上述曝光的这款摩托罗拉X50mini,零下巴直面屏的全面屏的设计带来了令人惊叹的...
实测分享牛牛怎么建房间,牛牛房... 1xGjIAi此次华为旗舰新品发布会不仅有三款华为P60系列旗舰,而且还有华为折叠屏新机华为Mate...
重大通报金花房卡充值,金花房卡... Mfak关键是苹果手机在市场中立足了如此久的时间,按理来说一些功能或者是规划都非常详细,然而从实际的...
带你了解牛牛房卡在哪里购买,正... yyG5WckO从外观屏幕来看,这款OPPO Reno9手机采用了一块6.7英寸的全面屏设计,像素分...
带你了解金花房卡哪里购买,牛牛... hSSA1.顶级的A16仿生芯片将运用到iPhone 14系列上。苹果A16芯片采用先进的4nm工艺...
重大发现正规房卡链接在哪购买,... JYNBQM尤其是高通骁龙7+ Gen2以及IP68等核心硬件和技术的加入,使得该机的综合硬件配置诚...
重大来袭斗牛房卡从哪里购买,牛... 6最核心的处理器,其实真没必要多讲,iPhone13搭载A15芯片,尽管是“阉割版”,但依旧是行业顶...
实测分享金花牛牛房卡批发,金花... 8从核心配置来看,这款OPPO Reno9手机搭载了高通骁龙778G处理器,采用了更先进的6nm工艺...
重大通报金花房卡链接怎么买,牛... zfvEfAzMiPhone13后置1200万广角+1200万超广角,广角升级了传感器位移式光学防抖...
智慧养老机器人成“健康管家” ... 中新网杭州3月13日电 题:智慧养老机器人成“健康管家” 科技温情守护“夕阳红” 作者:张煜欢 郭天...
玩家实测微信金花房卡购买,微信... 62yC当然,行业在发展,相信在接下来realme手机会再接再厉,为行业带来更有竞争力的产品。网上曝...