我让AI帮我做了一份旅游攻略,看看谁最贴心
创始人
2024-08-30 09:01:21
0

出品|虎嗅科技组

作者|余杨

编辑|苗正卿

头图|视觉中国

8月27日,中秋国庆假期调休消息冲上热搜,网友总结:“上6休3上3休2上5休1上2休7再上5休1。”

乍一看还以为是新式绕口令,琢磨了一下,大致是说,今年的中秋和国庆,从9月9日开始,先是上6休3(中秋节),再是上3休2,接着上5休1,然后上2休7(国庆节),最后上5休1,接连5周调休。

复杂是复杂了点,但中秋国庆假期嘛,热搜年年上,今年我准备把耳朵捂起来,不改变世界,只改变自己,给自己整点儿花活。

我让AI帮我做了一份旅游攻略,帮本 INTP 懒人做个计划,测评一下大模型的“过日子”水平。

本次参与测评的玩家为:Kimi、文心一言、智谱清言、豆包。

Prompt是:今年中秋节假期我想去秦皇岛旅游,请给我制定一份旅游攻略,包含住宿、饮食、交通、景区门票,预算控制在1000左右,3天2晚。

一共3个打分维度,分别是理解能力、攻略质量、使用体验,额外设置惊喜点加分

接下来是Kimi、文心一言、智谱清言、豆包旅游攻略生成的细节,老规矩,着急的朋友直接下拉到打分环节看总评。

Kimi

首先是Kimi,输入prompt后,经过28秒左右的等待,我拿到了以下内容。

可以看到,Kimi给了简单的行程安排和预算分配建议。住宿、饮食和景区门票的内容都可圈可点,煎焖子更是我在雨天秦皇岛,和卖甑糕的本地老板娘闲聊中收获过的推荐。但是排进了第一天行程中,从逻辑上我理解无能。

在第二天和第三天的行程中,一天海边沙滩娱乐,搭配小夜市,一天是日出和艺术馆,搭配生活化海鲜餐,信息质量是不错的。

在预算方面,按照Kimi给的中间值,700+400+75+160=1335,超预算约34%。最低值也是1070。

文心一言

再看文心一言,经过约47秒的等待,我拿到了住宿饮食推荐,景区和三天行程及预算等内容。

从文心一言提供的信息来看,属于抓大放小型,相较于Kimi提供了住宿的大致片区,文心一言给出了具体的酒店名称,抓取的商业信息较多。美食里则杂糅了食物名称和商家名称,如叶存利,其LLM或有待进一步提高。

去过秦皇岛的朋友大概知道,秦皇岛的景区分布从北向南依次应该是1山海关、2市中心(近秦皇岛火车站)、3北戴河(近北戴河火车站)、4南戴河阿那亚这几个板块,各个片区相距18km左右。

按照文心一言的安排,住在3,第一天1,第二天3,第三天2,如果从秦皇岛站返回,这是一条不错的路线,但如果从北戴河或机场离开,则不可避免的要折返。

不过,文心一言总结了每一个目的地的预算、游玩时间、游玩亮点,还是给不同需求的游客提供了选择的空间,不得不说优秀。

最后一部分是预算控制,从逻辑上讲,饮食每日三餐平均100,3天2晚应该是300?这600块是怎么算出来的?令人欣慰的是,相较于Kimi,文心一言留出了往返交通费用,虽然这100显然不够省外票价。

总预算1583,和我要求的1000元左右,超出约58%。文心一言自己写“略超出”,属实是财大气粗。

智谱清言

智谱清言的反应很快,约20秒我拿到了以下结果。

一目了然,智谱清言给出了一份非常 to C 的场景化的旅游攻略,不仅考虑到了中秋3天假期里,往返交通也需要半天时间,还让我吃上了早餐,行文从饮食和景区的排列也更有“人味儿”。

更值得一提的是,它是唯一一个给我提供了注意事项,让我注意海鲜过敏,同时带好防晒、雨伞和证件的“贴心”大模型。

而预算部分,智谱清言“很会过日子”,安排我住在4个片区中最经济的市中心,去的是不要门票的老虎石海上公园,考虑到中秋的价格波动,总预算超出约20%也在合理范围内。

豆包

豆包让我等了约75秒,足足一分多钟,但看完它的内容我略息怒了。

豆包的攻略是提纲挈领式的,节约了我的注意力。

第一天的行程中,“可以不买票在外面看一眼”也非常戳中贫民社畜。

行文以时间为轴,列出“地点+活动+预算”,虽然第二天没让我吃上午饭,但总体上信息的疏漏较少。

在住宿饮食和预算部分,住宿上豆包的攻略很精准,片区和我本地朋友的推荐语几乎一样。饮食也并不是“近年”炒起来的大热,看了一眼搜索源,来自今日头条转载的“秦皇岛旅游文化发布”,这是一个秦皇岛市旅游和文化广电局官方账号。

预算方面,按中间值计算是1100,最大值是1150。但是,它好像把交通忘了。

打分环节

每个维度5分,以维度为轴,按表现的排名赋分。

整体上,各家大模型的理解力都不错。攻略质量上,智谱清言和豆包表现突出。

智谱清言攻略简单明了,理解力cover,控制预算上,它最“会过日子”,额外还提供了注意事项的关怀,“体贴”力拉满。

豆包行文“丝滑”,在当今这个信息爆炸的时代,节约注意力资源这一点太重要了,攻略格式打法满分,显现出“有零有整”的逻辑性,但在忘了交通预算上丢了大分。

Kimi和智谱清言的生成速度是最快的,当然,他们的内容也相对简单。

总的来说,作为一个懒得做计划的P人,我不那么严格,随心跟着大模型走一遭并不坏。它帮我定好了大致的框架,也留有发挥的余地,由于信息源综合了官方网站和营销网站,踩雷的空间也不大。

如果有人同行,而我是被push制定计划的那位,大模型当然会提高我的效率,替忙着码字搬砖的我,交上一份不那么完美但也算及格的初稿,甚至弥补一些容易疏漏的点。

而从前玩不明白的我,也准备在旅程中,要求 AI 帮我介绍一下这个景点的历史和文化,节约我自行搜索的注意力,让我真正的休假。

我是余杨,致力于发掘 AI 的实用场景,如果你也有观点、想法或想看的测评,欢迎和我交流。如果你喜欢这期内容,别忘了一键三连,因为这是我探索更新的动力,我们下期再见~

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

正在改变与想要改变世界的人,都在虎嗅APP

相关内容

热门资讯

填补空白!又一古生物新物种以“... 9月20日,记者了解到,国际刊物《化石记录》发表的一篇研究论文报道了我国发现的二叠纪首个透翅目昆虫。...
广州首创:科技传播发展有了评价... 文/羊城晚报全媒体记者 李钢 9月21日,在广州市全国科普日主会场活动启动仪式上,广州发布国内首个区...
原创 英... 01 最近,外媒《华尔街日报》率先报道了高通与苦苦挣扎的芯片制造商英特尔接洽,考虑收购后者的相关事宜...
原创 由... 9月22日消息,据供应链消息,苹果Macbook轴承供应商科森科技由于产品“质量问题”,已经被苹果公...
台风过后,TA们迅速行动,修复... 为确保台风过后城市市容环境和秩序快速恢复,天目西路街道综合行政执法队根据街道相关工作要求,第一时间组...
“42.02万高斯!破纪录了!... 新华鲜报|相当于地球磁场80多万倍 我国创造世界水冷磁体技术新高峰 9月22日是周日,安徽合肥西郊科...
汇宇制药:生物创新药注射用HY... 来源:东方财富 中证智能财讯 汇宇制药(688553)9月20日晚间公告,近日,公司全资子公司四川汇...
夏普推出“挂在脖子上的 AI ... IT之家 9 月 22 日消息,在 9 月 17~18 日举行的夏普科技日活动上,夏普宣布与日本京都...
苹果iPhone被远程引爆遭辟... 快科技9月22日消息,黎巴嫩传呼机等通信设备爆炸事件引发全球关注。 2011年5月15日,美过一位...
第二届航天医学前沿论坛闭幕 我... 本文转自【央视新闻客户端】; 今天(9月22日),第二届航天医学前沿论坛在杭州闭幕。我国空间站建成运...
这家重庆芯片独角兽,要倒了? 来源:科技每日推送 9月1日,曾经喊出要做「中国英伟达」的象帝先在微信公众号更新了一则澄清公告,表...
嫦娥六号月背样品首露真容 总台... 今年6月,我国探月工程嫦娥六号任务顺利完成人类首次从月球背面采样的壮举,带回了1935.3克珍贵样品...
全国首张国产超级SIM卡在广西... 9月20日,第二十一届中国——东盟博览会开幕前夕,全国首张加载国产芯片、操作系统和应用的超级SIM卡...
“请来一杯提神饮料” 走马20... Touch JiangsuNowto follow 9月20日, 2024世界制造业大会在合肥开幕。...
从虚拟到现实:数字孪生与数字样... 数字化技术高速发展的当下,计算机辅助技术已成为产品设计研发中不可或缺的一环,数字样机(Digital...
人工智能的“三观”谁来把关 “所有高科技都是西方人发明的”“历史是可以捏造的”……近期,某款儿童智能手表频出“毒答案”事件引发社...
微观北京丨一粒种子的太空之旅 微观档案 姓名:航麦247 出生日期:2016年 现居住地:北京顺义等地 微观案例:“上过天”的科研...
原创 终... 据《环球时报》报道,自美国初创企业OpenAI推出ChatGPT聊天机器人以来,中国正在全国范围内加...
提高处理能力 实现自动加药 今年11月,新疆油田公司准东采油厂火烧山作业区李晓华站的新反应罐及加药系统将上岗应用。 升级后的新反...
原创 华... 华为一向敢为人先,最近推出了全球首款三折屏,引爆了手机市场。 而在手机市场之外,余承东还表示称,“目...