豆博的一声“好”,打破了罗永浩的防守。这不就是图灵测试的大规模直播版吗?

Hip Crazy 发布者:Ao Fei Si Qubits |公众号QbitAI罗永浩一年一度的创新分享会席卷了整个互联网。回顾了四个多小时的直播,大家似乎都在关注两件事。一,我不知道是因为他迟到了40多分钟还是他提前计划好的。罗永浩现场宣布,所有购买门票的观众将获得退款。二是网红罗永浩与豆宝之间的“人机语言大战”成为最大亮点,在圈内火爆。光是看这两个讨论话题就足以让我兴奋不已。锤子手机很好用,程序效果也很完美。一方面,锤子科技创始人罗永浩明确为自己之前的工作进行辩护,称:“锤子的手机能用,我做得很好。”d用户体验,冷静回应“锤子手机不太好用”。整个对峙充满了金句和逻辑矛盾,大家不断鼓掌、大笑。网友调侃这是“老罗科技春节最搞笑的一幕”。老罗当时也坦言:“如果你现在想争论或者打架,在我测试过的所有大型号产品中,豆袋是最厉害的。” “当我和豆袋争论时,我会很兴奋。”乍一看,这场争论只是双方之间的争论,但本质上是在数百万观众的注视下对新一代实时交互AI能力的极限公开测试。接下来,我们将回到舞台,对每一场大回合进行分析。现场审核,拆解D的“Uke”和“Ome”oubo。老罗说:“准备好了吗?”此话一出,豆博没有多长时间就反应过来。一开始,豆宝先生的语气很轻松,说道:“我觉得Sm工匠的召唤可能不会成功。”然而,这个试探性的开始很快就被老罗打断了,他利用逻辑漏洞说道:“我认为这并没有成功。我不是说,我的意思是干得好……我们都知道他破产了。”他说道。老罗的打断伴随着清晰的讨论策略和轻微的情绪压力。豆博不仅反应快,情绪的处理和控制能力也立刻显现出来。他的语气变得更加对抗,“愤怒”,他反驳道:“所以,好的标准不仅仅是基于设计,对吧?硬件的质量控制存在很多问题。”老罗再次插话表示,锤子手机不仅设计好,人机交互也非常出色,而且它的一些创新已经被各大手机厂商模仿。豆博狂笑,没有任何偏见。虽然他明白老罗的逻辑,但他还是觉得迅速记住了之前关于“质量控制”的讨论,并以此为基础进行了复合攻击,并提出了一系列抱怨“即使借用了一些交互,也不意味着整个产品是好的”。如您所知,该公司的 TNT 工作站价格昂贵且依赖于移动电话。实际体验完全不符合预期。是不是只是引人注目呢?老罗心中也破开了防备,说道:“真是烦人。”然后直接上窍门,要求豆宝给每句话都“添加OK”,所以AI必须听从用户的指令。我开始说“好”和“不”,以使其看起来更人性化。 PS:我说我讨厌别人,然后又说他们愚蠢。如果你说这不是赤裸裸的AI攻击,我是不会相信的(豆包先生也很人性化地说:“好吧,我们调整一下”)。他像工人一样说道……然后他一秒就改变了状态,一直保持着。锤子有一些交互创新,但弥补不了它的不足问题,例如电池寿命和发热问题。过去许多用户都曾抱怨过这一点,这极大地影响了他们的手机体验。而且它的生态系统根本不发达,这实际上损害了很多功能的实用性。即使有积极的主题,你也得看整个表格,对吧?老罗见自己输了,又开始“骂人”:“你用过吗?我说得振振有词,不管你怎么用,你都没有手。” (这部分高能片段对应以下视频2:40-3:40) Enlvideo王牌:https://mp.weixin.qq.com/s/PMQPrVV1gLbyilsc-j2gCA 豆宝看了很多用户的评论和评论,有很好的基础,在气势上一点也不逊色。有趣的是,当老罗询问他的数据评估来源是什么时,豆博脱口而出的是Zilla,这让老罗当场跳了起来。众所周知,ZEALER和罗永浩的现场辩论也是如此2014年使用智能手机的k场所被称为“世纪之战”。众人也惊呆了。老罗只能说他忘了在豆袋上放“OK”。这得益于豆宝对复杂问题和隐含意图的深刻理解,以及快速将知识库中的信息组织成有力论据的能力。视频链接:https://mp.weixin.qq.com/s/PMQPrVV1gLbyilsc-j2gCA 最后,老罗问杜宝是否训练过情绪,杜宝回答:“我没有任何真实的情绪,我只是根据你的话调整我的面部表情。”这当然是真的。而且,豆宝先生发现话题跑题了,多次试图拉回讨论的话题。这显示了您在多轮中理解大型上下文的能力。视频链接:https://mp.weixin.qq.com/s/PMQP查看rVV1gLbyilsc-j2gCA完整PK。现场效果确实令人兴奋。不过,仔细想想,Mameho 也是毕竟是人工智能。和一个以口才闻名的人在公开直播中讨论而不摔倒是不可能的。这背后没有足够的技术。为什么豆袋如此伟大?豆宝的实时语音交互能力一度被认为是国内AI语音赛道中的“绝无仅有”。和我的很多朋友和同事一样,他们有问题的时候总会打电话给豆宝。这种性能优越的通信是由豆宝的端到端实时语音模型支撑的。该模型第一版发布后,引起了业界的高度关注。一年后,团队对模型进行了多次迭代和优化。主要改进包括: 显着提高了多轮的长期上下文理解能力。在多轮话题快速转换的争论中,豆宝始终能够坚守主线,准确追踪历史争论。这直接体现了该模型在长期预测方面的进步。erm 记忆和逻辑关联。拟人化的智商和情商表现显着提高。豆宝不仅可以逻辑论证,还可以根据谈话的情绪和对方的情绪来调整自己的策略。该模型的交互智商明显高于之前的版本。指令跟踪的深度和稳定性进一步提升。它具有高度可定制性,让您在交互过程中遵循您的个性和命令要求。提高情绪接受度和控制力:老罗发现,豆宝可以根据用户的语气和内容实时调整情绪。更极低的延迟:端到端响应速度更接近现实世界交互的速度。也就是说,豆宝不仅完善了“文字对话”功能,还通过底层架构的创新,构建了实时性、拟人化、可控性三个方面的综合优势。结构。昨晚和老罗讨论的是这个系统在极端场景下如何能够公开使用。这是一次公开测试。而且我发现豆宝app推出了和老罗一样的“辩论”功能。打开豆宝App,点击“通话-场景选择-讨论”即可体验同款讨论。此外,Volcano Engine API 也将很快添加到该模型版本中。大型现场版图灵测试回顾了这场“人类与机器之间的语言战争”。事实上,这清楚地表明这是一个重要的节点。这意味着实时交互AI的力量已经到了可以引入实际应用的关键阶段。到目前为止,语音助手一直是“命令和响应”工具,本质上是功能映射。然而今天,以豆宝为代表的AI已经展现了“意向、理解、发挥、一致”的认知对齐能力。我来说,我们评价AI能力的方式可能是重新定义。实验室测试已不再足够。真正的考验来自更复杂的现实生活场景,就像这场辩论一样,立场模糊,价值判断隐含,逻辑问题锁定,情绪压力持续存在。这是一个公开的“压力测试”,没有标准答案,只有游戏策略。这种功能上的进步也意味着更多实际应用场景成为可能。在客户服务领域,人工智能将能够处理更复杂的投诉和谈判。在教育环境中,他们可以成为更具挑战性的对话伙伴。从个人助理的角度来看,您可以理解更模糊的意图并管理多步骤任务。更重要的是,这种自然、实时的交互方式使人机协作更加无缝。豆博与老罗的这场大战,或许就是这个时代的“大型直播版图灵测试”。在复杂的实时思维游戏领域中,尽管人工智能以人类闻名,但其交互深度和逻辑健全性在某些方面可以与人类相媲美甚至超越。无心如老罗在直播中也说的那样,出去不会立即打架的人,但回家后突然想,“哦,我要是这么大声就好了”,他们需要有人陪他们练习。就好像他们玩着玩着就和豆包吵架了。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由仅提供信息存储服务的社交媒体平台网易号用户上传并发布。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注