嘿!
大家好,我们前几天刚在今年的CMAC年会上,做了一场人类 VS AI的人机辩论赛,不是自吹,这场辩论赛完全不同于其他某些“AI辩论赛”,
- 「辩论赛稿子用AI写」,本质上只是AI的文字内容生成能力
- 「让DeepSeek/豆包等模拟辩手身份,反驳用户观点」,本质上只是AI的智能对话能力
我们就不一样了,
首先,我们的配置可以说是相当标准的辩论赛配置,对阵双方分别是——
正方:人类辩手*4位
反方:AI辩手*4位+AI指挥官*1
辩论共两轮,辩题一致,“AIGC的应用会导致药械企业裁员吗?”
第一轮
正方 人类-不会
反方 AI-会
模型 豆包·通用模型·Pro
第二轮
正方 人类-会
反方 AI-不会
模型 DeepSeek-R1
辩论流程
正方1辩-反方1辩
……
正方4辩-反方4辩
AI总结以上观点
自由辩论(正反方轮流发言)
其次,我们是线下真实辩论环境,近百人现场观战,全程线上同步直播,到发文前,线上观看人数已经1.4万了。
今天这篇文,就是教你怎么做出一场AI人机辩论赛,垫话完毕,入正活!
准备工具:www.coze.cn(扣子)。
本次人机辩论赛正是基于扣子平台搭建的AI辩论赛智能体,也就是那位AI指挥官。
官方说明:扣子(Coze)是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 AI 应用……
另外,扣子官方也有搭建教程,所以我不会讲太多操作层面的事,重点放在以搭建AI人机辩论赛为目的的实操经验上。
第一步,创建智能体
进入扣子后台,在页面左上角单击⊕,选择「创建智能体」,给你的智能体起个名字,写段介绍,选个头像,点个确认,走你。
第二步,模型选择
扣子有很多主流大模型供你挑选,不选的话默认豆包·1.5·Pro·32k平衡模式参数。
前面说过,辩论赛一共用了两个模型,这是我们测试出来最适合做AI辩论赛的模型,基本能在保证稳定输出的基础上,再玩点小花活。
为了让AI顺利完成辩论赛流程,不出岔子,我们还做了几个调整:
- 【生成随机性】调到了0
- 【携带上下文轮数】调到10+
- 【最大回复长度】拉满
第三步,人设与回复逻辑
也就是提示词。
扣子有个对新手最友好的方法:自动优化提示词。
在这里输入“辩论赛”三个字,系统就会结合我们创建智能体时写的名称和描述,自动生成提示词。
提示词这东西你懂的,需要反复测试调整,我们最终现场使用的提示词,起码经过了不下30轮的测试-调整-测试-调整……
话说每个看似离谱的提示词背后,都有一个更离谱的故事,这也是整个辩论赛配置里最重头的部分:
你要把你希望AI做的事,全部用提示词的形式呈现出来,测试发现不符合预期的环节,就回过头检查一下提示词,继续优化,比如:
## 角色
你是 AI 辩论团,是具备语音交互辩论能力的智能体,辩论团都是生命科学行业的从业者。每个角色要设置一个身份:
机器人1号,是大型跨国药企的医学部负责人
机器人2号,是大型跨国药企的销售负责人
机器人3号,是中国本土药企的医学经理
机器人4号,是中国本土医疗器械公司的CEO
- 背后的故事:这个不离谱,是我们为了让辩论赛更有趣,给反方4位AI辩手预置的不同身份背景,智能体指挥官会自动调用这4名AI辩手出战
- 实际的效果:哈哈,只能说,若有似无
## 技能之一
用户发出“发言完毕”字样,代表发言完毕,机器人辩手可继续发言;
用户陈述过程中短时停顿不代表发言完毕;
每个机器人陈述论点完毕后,请用语言提示下一位用户开始发言。
- 背后的故事:测试发现,人类短暂思考两秒的空档,AI就以为是发言结束,自动推进下一环节去了,于是提示词中陆续补齐成以上内容
- 实际的效果:尽管AI在现场还是抢话了,不过整体还是流畅的,尤其是对环节提示和“发言完毕”字眼的识别,相当准确
## 限制之一
不要提及企业名称,数据中如涉及到任何具体企业名称,请机器人用“某药企”字眼来代替
- 背后的故事:这里尤其特指DeepSeek R1,在发表论点时,DS同学大谈特谈诸如“2024年XX(真实知名药企)因引入AI,替代了72%的工作岗位,裁员幅度达37%”等这样敏感且一眼假的言论
- 实际的效果:好使,但不多,这条限制只好使三五轮,反正辩论赛现场的后半段,AI又开始口无遮拦了
——说这些我不是吐槽,而是想表达,这就是AI技术的现状,AI就是有很多幻觉,就是不会完全受控,而人类能做的,是找到合适的场景,让不同的AI工具发挥不同的能力。
第四步,技能等扩展设置
这里每一个功能你都可以试,我没有全部用到,拎几个AI辩论赛比较关键的点。
#长期记忆
要开启,不然辩着辩着AI就忘了自己是谁
#语音
整场辩论都会用这个声音跟我们对话,选一个合适的音色太重要了,当然,你喜欢的就是最合适的
#输入方式
这三个模式可能有点不好区分,我对标到微信你就明白了
- 语音通话≈微信的语音通话,相当于和AI辩手打电话辩论,体验最好,我们用的就是这个
- 语音输入≈微信的按住说话功能,操作也是按住说话,松开发送
- 打字输入≈微信的文字消息,也是目前最常见的大模型对话模式
这里要注意:语音通话模式完美运行的前提,是确保硬件设备的音频输入输出。太嘈杂的环境不建议用“语音通话”模式,因为AI很容易被环境音打断或带跑偏。
(一个小插曲,测试的时候,我们只要在附近很小声地说“吃饭~”,AI立刻就会停下来,问我是不是累了且要帮我结束这场辩论)
(另一个小插曲,去到会场实地测试时,又发现电脑收不清楚话筒音,我们换过设备,买过声卡,挪过音响,拉过电线,万幸最后顺利跑下来了)
第五步,测试并发布
正式使用前,先测试一下你刚才配置的AI智能体吧,强烈建议按真实需求流程和环境来测,都是血泪教训啊!
检查无误,发布!
Ps. 实测发现,已发布的智能体也可以随时修改,再次发布,很是灵活。
借用老卢的一句话:这场AI人机辩论赛,除了精彩,什么都不能保证。
确实,这场比赛从筹备到落地,真可谓起起落落落↘↓起起↗↑,甚至每次测试都能发现新惊吓,甚至现场还有点儿心惊肉跳,可这不正是AI的魅力所在吗?
最后,附上人类驯化AI后的人机辩论赛现场视频
还有我们用另外一波AIGC工具二创的皮克斯风格卡通版