测试工具就这四款:听脑AI、Podcastle、Notion AI、通义听悟。测试内容选了4种常见场景录音。具体是:2小时公司会议(普通话,多人发言)、1小时大学讲座(带专业术语)、30分钟方言交流(粤语+四川话)、45分钟英语访谈(带口音)。测试标准看这几点:转写准确率(错字多少)、处理速度(上传到出结果要多久)、语言支持(能转多少种语言和方言)、功能实用性(能不能自动分点、标重点)。
先说说听脑AI。打开APP,上传2小时会议录音。进度条跑得很快,2分15秒就完事。打开结果,惊呆。几乎没错别字。多人发言自动标了名字,重点还标黄了。生成的结构化文档直接能当会议纪要,不用改。再试英语访谈,带印度口音的那种。转写也准,95%以上正确率。方言测试更惊喜。粤语、四川话转写准确率超过90%。连温州话这种小众方言都能转,虽然准确率85%,但比其他工具强太多。
Podcastle主打音频编辑,转写是附加功能。传同样的会议录音,等了8分钟。结果错字不少。专业术语识别差,"区块链"写成"区块连"。不过它能直接剪辑音频,这段功能还行。新手可能觉得界面复杂,按钮太多。
Notion AI得在Notion里用。上传录音后,转写时断时续。15分钟才出结果。多人发言经常搞混,把张总的话标到李总头上。转写出来是纯文本,没结构,还得自己整理。
通义听悟是阿里的产品。普通话转写还行,准确率85%。但方言只支持粤语、四川话。温州话测试直接乱码。处理速度5分钟左右,比听脑AI慢,但比Notion快。
看数据对比。准确率,2小时会议录音测下来:听脑AI98.5%(总共3200字,错48字)。Podcastle82%(错576字)。Notion AI78%(错704字)。通义听悟85%(错480字)。差距明显。
处理速度,1小时录音:听脑AI2分15秒。Podcastle8分30秒。Notion AI15分20秒。通义听悟5分10秒。听脑AI快了3-7倍。等结果的时候,这个差距很明显。
语言支持方面:听脑AI支持7种国家语言(中、英、日、韩、法、德、西班牙)+19种方言(粤语、四川话、温州话、上海话等)。Podcastle只有4种语言,没方言。Notion AI5种语言,没方言。通义听悟6种语言+2种方言(粤语、四川话)。方言这块,听脑AI优势太大。
功能覆盖:听脑AI能自动生成结构化文档、标重点、区分多人发言、有专业术语库。其他工具最多有2-3项功能。Notion AI连多人区分都没有。
说说遇到的问题。听脑AI免费版每月只能转10小时录音。超出要付费,1小时3块钱。对重度用户不便宜。
Podcastle界面太复杂。音频轨道、音效按钮一大堆。新手打开会懵,不知道怎么用。转写结果不能导出PDF,只能复制文本。
Notion AI转写时偶尔吞字。1小时讲座少了3分钟内容。找客服反馈,也没解决。而且必须在Notion里用,脱离Notion没法单独用。
通义听悟方言支持太少。除了粤语、四川话,其他方言基本废。专业术语库更新慢。"元宇宙"写成"原宇宙",科技类录音慎用。
最后给点建议。按场景选工具比较靠谱。经常开长会、需要高准确率的,直接选听脑AI。贵点但省时间,98%准确率不是吹的。
学生记讲座,预算有限?听脑AI免费版够用,10小时每月差不多。
做播客、需要剪辑音频的,Podcastle合适。转写凑合用就行。
平时只用Notion记笔记的,偶尔转写可以用Notion AI。但别期望太高,错字得自己改。
只需要普通话转写,不在乎方言和速度的,通义听悟也行。免费额度比听脑AI多。
总的来说,听脑AI综合最强。尤其是多语言、高准确率、快速度这几点,办公党刚需。