豆博的一声“好”，打破了罗永浩的防守。这不就是图灵测试的大规模直播版吗？

Hip Crazy 发布者：Ao Fei Si Qubits |公众号QbitAI罗永浩一年一度的创新分享会席卷了整个互联网。回顾了四个多小时的直播，大家似乎都在关注两件事。一，我不知道是因为他迟到了40多分钟还是他提前计划好的。罗永浩现场宣布，所有购买门票的观众将获得退款。二是网红罗永浩与豆宝之间的“人机语言大战”成为最大亮点，在圈内火爆。光是看这两个讨论话题就足以让我兴奋不已。锤子手机很好用，程序效果也很完美。一方面，锤子科技创始人罗永浩明确为自己之前的工作进行辩护，称：“锤子的手机能用，我做得很好。”d用户体验，冷静回应“锤子手机不太好用”。整个对峙充满了金句和逻辑矛盾，大家不断鼓掌、大笑。网友调侃这是“老罗科技春节最搞笑的一幕”。老罗当时也坦言：“如果你现在想争论或者打架，在我测试过的所有大型号产品中，豆袋是最厉害的。” “当我和豆袋争论时，我会很兴奋。”乍一看，这场争论只是双方之间的争论，但本质上是在数百万观众的注视下对新一代实时交互AI能力的极限公开测试。接下来，我们将回到舞台，对每一场大回合进行分析。现场审核，拆解D的“Uke”和“Ome”oubo。老罗说：“准备好了吗？”此话一出，豆博没有多长时间就反应过来。一开始，豆宝先生的语气很轻松，说道：“我觉得Sm工匠的召唤可能不会成功。”然而，这个试探性的开始很快就被老罗打断了，他利用逻辑漏洞说道：“我认为这并没有成功。我不是说，我的意思是干得好……我们都知道他破产了。”他说道。老罗的打断伴随着清晰的讨论策略和轻微的情绪压力。豆博不仅反应快，情绪的处理和控制能力也立刻显现出来。他的语气变得更加对抗，“愤怒”，他反驳道：“所以，好的标准不仅仅是基于设计，对吧？硬件的质量控制存在很多问题。”老罗再次插话表示，锤子手机不仅设计好，人机交互也非常出色，而且它的一些创新已经被各大手机厂商模仿。豆博狂笑，没有任何偏见。虽然他明白老罗的逻辑，但他还是觉得迅速记住了之前关于“质量控制”的讨论，并以此为基础进行了复合攻击，并提出了一系列抱怨“即使借用了一些交互，也不意味着整个产品是好的”。如您所知，该公司的 TNT 工作站价格昂贵且依赖于移动电话。实际体验完全不符合预期。是不是只是引人注目呢？老罗心中也破开了防备，说道：“真是烦人。”然后直接上窍门，要求豆宝给每句话都“添加OK”，所以AI必须听从用户的指令。我开始说“好”和“不”，以使其看起来更人性化。 PS：我说我讨厌别人，然后又说他们愚蠢。如果你说这不是赤裸裸的AI攻击，我是不会相信的（豆包先生也很人性化地说：“好吧，我们调整一下”）。他像工人一样说道……然后他一秒就改变了状态，一直保持着。锤子有一些交互创新，但弥补不了它的不足问题，例如电池寿命和发热问题。过去许多用户都曾抱怨过这一点，这极大地影响了他们的手机体验。而且它的生态系统根本不发达，这实际上损害了很多功能的实用性。即使有积极的主题，你也得看整个表格，对吧？老罗见自己输了，又开始“骂人”：“你用过吗？我说得振振有词，不管你怎么用，你都没有手。” （这部分高能片段对应以下视频2:40-3:40） Enlvideo王牌：https://mp.weixin.qq.com/s/PMQPrVV1gLbyilsc-j2gCA 豆宝看了很多用户的评论和评论，有很好的基础，在气势上一点也不逊色。有趣的是，当老罗询问他的数据评估来源是什么时，豆博脱口而出的是Zilla，这让老罗当场跳了起来。众所周知，ZEALER和罗永浩的现场辩论也是如此2014年使用智能手机的k场所被称为“世纪之战”。众人也惊呆了。老罗只能说他忘了在豆袋上放“OK”。这得益于豆宝对复杂问题和隐含意图的深刻理解，以及快速将知识库中的信息组织成有力论据的能力。视频链接：https://mp.weixin.qq.com/s/PMQPrVV1gLbyilsc-j2gCA 最后，老罗问杜宝是否训练过情绪，杜宝回答：“我没有任何真实的情绪，我只是根据你的话调整我的面部表情。”这当然是真的。而且，豆宝先生发现话题跑题了，多次试图拉回讨论的话题。这显示了您在多轮中理解大型上下文的能力。视频链接：https://mp.weixin.qq.com/s/PMQP查看rVV1gLbyilsc-j2gCA完整PK。现场效果确实令人兴奋。不过，仔细想想，Mameho 也是毕竟是人工智能。和一个以口才闻名的人在公开直播中讨论而不摔倒是不可能的。这背后没有足够的技术。为什么豆袋如此伟大？豆宝的实时语音交互能力一度被认为是国内AI语音赛道中的“绝无仅有”。和我的很多朋友和同事一样，他们有问题的时候总会打电话给豆宝。这种性能优越的通信是由豆宝的端到端实时语音模型支撑的。该模型第一版发布后，引起了业界的高度关注。一年后，团队对模型进行了多次迭代和优化。主要改进包括：显着提高了多轮的长期上下文理解能力。在多轮话题快速转换的争论中，豆宝始终能够坚守主线，准确追踪历史争论。这直接体现了该模型在长期预测方面的进步。erm 记忆和逻辑关联。拟人化的智商和情商表现显着提高。豆宝不仅可以逻辑论证，还可以根据谈话的情绪和对方的情绪来调整自己的策略。该模型的交互智商明显高于之前的版本。指令跟踪的深度和稳定性进一步提升。它具有高度可定制性，让您在交互过程中遵循您的个性和命令要求。提高情绪接受度和控制力：老罗发现，豆宝可以根据用户的语气和内容实时调整情绪。更极低的延迟：端到端响应速度更接近现实世界交互的速度。也就是说，豆宝不仅完善了“文字对话”功能，还通过底层架构的创新，构建了实时性、拟人化、可控性三个方面的综合优势。结构。昨晚和老罗讨论的是这个系统在极端场景下如何能够公开使用。这是一次公开测试。而且我发现豆宝app推出了和老罗一样的“辩论”功能。打开豆宝App，点击“通话-场景选择-讨论”即可体验同款讨论。此外，Volcano Engine API 也将很快添加到该模型版本中。大型现场版图灵测试回顾了这场“人类与机器之间的语言战争”。事实上，这清楚地表明这是一个重要的节点。这意味着实时交互AI的力量已经到了可以引入实际应用的关键阶段。到目前为止，语音助手一直是“命令和响应”工具，本质上是功能映射。然而今天，以豆宝为代表的AI已经展现了“意向、理解、发挥、一致”的认知对齐能力。我来说，我们评价AI能力的方式可能是重新定义。实验室测试已不再足够。真正的考验来自更复杂的现实生活场景，就像这场辩论一样，立场模糊，价值判断隐含，逻辑问题锁定，情绪压力持续存在。这是一个公开的“压力测试”，没有标准答案，只有游戏策略。这种功能上的进步也意味着更多实际应用场景成为可能。在客户服务领域，人工智能将能够处理更复杂的投诉和谈判。在教育环境中，他们可以成为更具挑战性的对话伙伴。从个人助理的角度来看，您可以理解更模糊的意图并管理多步骤任务。更重要的是，这种自然、实时的交互方式使人机协作更加无缝。豆博与老罗的这场大战，或许就是这个时代的“大型直播版图灵测试”。在复杂的实时思维游戏领域中，尽管人工智能以人类闻名，但其交互深度和逻辑健全性在某些方面可以与人类相媲美甚至超越。无心如老罗在直播中也说的那样，出去不会立即打架的人，但回家后突然想，“哦，我要是这么大声就好了”，他们需要有人陪他们练习。就好像他们玩着玩着就和豆包吵架了。
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由仅提供信息存储服务的社交媒体平台网易号用户上传并发布。

归档

分类

豆博的一声“好”，打破了罗永浩的防守。这不就是图灵测试的大规模直播版吗？

由 bet356在线官方网站

发表回复取消回复

您错过了

中国的人工智能通话数量首次超过美国。今年国产手机价格全线上涨，涨幅最低超过1000元。 Netflix 退出了收购华纳兄弟的竞赛。

Aliro 1.0智能门禁标准公布：将iPhone 17等手机变成“万能钥匙”

单季度营收为 681 亿美元，净利润为 429 亿美元。 NVIDIA财报再爆，黄仁勋“捂”智能体

他曾挑战董明珠，但这位昔日的空调巨头却在春节前倒塌。

豆博的一声“好”，打破了罗永浩的防守。这不就是图灵测试的大规模直播版吗？

由 bet356在线官方网站

相关文章

Aliro 1.0智能门禁标准公布：将iPhone 17等手机变成“万能钥匙”

他曾挑战董明珠，但这位昔日的空调巨头却在春节前倒塌。

7名中国游客在贝加尔湖溺水身亡；当地南北线全线封闭 涉事司机被控两项罪

发表回复 取消回复

您错过了

中国的人工智能通话数量首次超过美国。今年国产手机价格全线上涨，涨幅最低超过1000元。 Netflix 退出了收购华纳兄弟的竞赛。

Aliro 1.0智能门禁标准公布：将iPhone 17等手机变成“万能钥匙”

单季度营收为 681 亿美元，净利润为 429 亿美元。 NVIDIA财报再爆，黄仁勋“捂”智能体

他曾挑战董明珠，但这位昔日的空调巨头却在春节前倒塌。

7名中国游客在贝加尔湖溺水身亡；当地南北线全线封闭涉事司机被控两项罪

发表回复取消回复