会说话的机器人纷纷上岗 但是聊天就有点“尬”
人类的对话是极其复杂的,其中每个语句都建立在对应的语境和上下文的基础上。因此,对话智能体需要通过对语言和语境的深度理解来更加有效地学习。
“我想买手机有什么推荐吗?”“三星的不错,我之前一直用三星的。”“魅族是国产手机十大品牌之一,好不好,用了才知道哦。”“小米也不错。”“小米比大米有营养。”这些看似时而认真,时而无厘头的对话和我们日常微信群聊看似并无二致,但其实在这个群里聊天的都是机器人。
能让机器人们聚在一起好好聊个天可是个技术活,不仅要把多智能体强化学习的方法应用在自然对话场景中,还需要优化社交机器人在不同上下文语境下的谈话策略。在日前天津高新区举行的第三届社交机器人论坛暨首届机器人群聊比赛研讨会上,多个社交机器人在同步对话的比赛现场一较高下。
这群机器人聊天有点“尬”
据了解,本次比赛尝试将多智能体人机对话的技术应用在自然对话场景中。比赛选取特定主题的启动句,打乱启动顺序,经过单轮或者多轮,生成符合主题且流畅的对话,最终采用自动评价和人工评价相结合的方式,根据主题相关性、语言流畅性和语境相关性进行打分。
“刚刚还是一群在认真聊天的机器人,却可能因某一个机器人的话锋一转,整个话题就被带入尬聊场景。就像那个推荐手机的话题,明明是在聊手机,就因为一个机器人说了小米,整个话题就变成了美食和养生。”大赛组委会委员、哈尔滨工业大学副教授张伟男介绍说,通过这次比赛,我们看到机器人们的聊天能力有所增强,但是与真人聊天相比还存在几个问题:多样性程度比较低,语言比较贫乏,回复重复率高;一致性能力弱,同一个群聊下,机器人经常前后回复出现矛盾;主题漂移,就是我们常说的跑题,几乎每个群聊到最后都跑题;质量不稳定,回复质量差的机器人严重影响群聊质量,机器人不能很好地筛选对话历史进行回复决策。
三种主流技术各有优缺点
让机器人群聊看似简单,却都需要人工智能的交互式实现技术——人机对话技术的发展作为支撑。获得首届机器人群聊大赛第一名的队伍FunNLP的指导老师,天津大学副教授张鹏介绍说,在研究上,大数据和深度学习共同推动了自然语言理解技术的发展。目前实现人机对话有三种主流技术,各有优缺点。
基于规则的人机对话系统,机器人需根据系统中预先定义的一些规则来进行回复,例如关键词、if-else条件等。这种技术最大的缺点是需要人工撰写规则,要定义的规则太多,需要付出极大的努力来做规则设计。
基于检索的人机对话系统,直接从预先定义的候选池中选择最佳的答案,但缺点是无法应对自然语言的多变性、多义性、语境结构、连贯性等,且当输入消息的语义差别很小时,机器人便无法精确识别,以至于无法生成新的回复。
“目前基于生成模型的人机对话系统是研究的热点。”张鹏表示,与检索型对话机器人不同的是,它可以生成一种全新的回复,因此相对更为灵活。但是这种系统有时候会出现语法错误,或者生成一些没有意义的回复。
目前还难达人类对话水平
在我们日常生活中,不同类型的人机对话可谓是随处可见:闲聊式对话,如微软小冰;任务驱动的多轮对话,如订餐对话系统等;问答式的对话,如汽车语音系统;推荐式对话,如一些客服机器人。其中闲聊、问答和任务型对话是用户输入内容后系统才会给出相应的回复,而推荐式系统主动向用户提供服务和信息。但由于各项技术尚未成熟,因此对话机器人还达不到类人的对话水平,表现不够灵活,甚至会产生一些笑料。
对于本次比赛的机器人在群聊回复方面出现的一些问题,张鹏解释说,这主要是由三方面原因造成的。首先对话机器人在理解群聊对话记录,回复的情感一致性及与其他机器人的交互三个方面存在一定的问题。所以群聊过程中出现了机器人自顾自回复或者是矛盾性回复等现象。
其次,训练机器人聊天是需要大量数据的,但某些特定领域的对话数据相当有限,如本次比赛中的数码产品和美食主题。并且,这些领域的中文闲聊型对话数据的收集和对话系统的构建都是十分耗费人力的。
第三,目前基于神经网络的对话系统主要依赖于大量结构化的外部知识库信息和对话数据,系统通过训练来“模仿”和“学习”人类说话,这也导致了回复语句单一的问题。因此,对话智能体需要通过对语言和语境的深度理解来更加有效地学习。
像人一样聊天还需深入理解语境
“虽然深度学习技术被充分运用,技术水平有所提高,但是以目前的技术来说,要做到让机器人像人一样聊天还有一定的难度。”张鹏表示,人类的对话是极其复杂的,其中每个语句都建立在对应的语境和上下文的基础上,朋友们在聊天时甚至能在对方说话之前就预料到下一句会说什么。
若想要达到相当于人类对话的水平,目前有几种方法可以探讨。其中一种是构造庞大且高度复杂的AI模型,如现在基于Transformer结构的Bert模型和GPT模型,其参数量已达到数亿级。然而模型越大,从用户输入信息到对话系统反应之间的延时就越长,而且实质上,此类模型仍然需要依赖于大量的数据,这与人类的思考和学习方式不符。
第二种是Meta Learning技术,这种技术需要机器人具备学会学习的能力,能够基于过往的经验快速地学习。这类模型是模拟人的思考与学习方式,从本质上更接近人类间的相互对话。但问题是我们需要结合具体的任务,提出基于Meta Learning的解决方案,这无疑需要更加深入的研究。
第三种是强化学习技术,强化学习系统由智能体、状态、奖赏、动作和环境5部分组成。现在的研究工作主要是将强化学习应用于任务型对话系统的策略学习上,强化学习能解决基于规则策略存在的泛化能力差、人工成本高等问题,并且无需大量的训练语料,只需要一些目标,便能够提高任务型对话的质量,弥补了深度学习的一大缺点,当然强化学习也会带来很多挑战,比如智能体会给当前互动的环境带来一定的影响等,这些都是需要我们去不断探索和深入研究的。
关键词: 会说话的机器人纷纷上岗
责任编辑:hnmd004
- 期货开户最低多少钱?期货开户要求2026-01-20
- 普通人玩期货能赚钱吗?普通人怎么玩期货?2026-01-20
- 年货提前购,iHerb助你一站囤起健康年2026-01-20
- 期货交易平台有哪些?期货交易平台介绍2026-01-20
- 基金怎么玩才能赚钱?基金玩法介绍2026-01-20
- 有没有比较稳的基金?目前最好最稳的基金推荐2026-01-20
- 中国中免与DFS 宣布有关DFS大中华区零售业务的收购协议2026-01-20
- 广东汕头两女生骑车被狗追咬,其中一名女生跟腱被咬断!附近居民:狗是私人养的,狗主人已被警方传唤 每日视讯2026-01-20
- 涨停雷达:AI4S+AI应用+混凝土外加剂+雅下水电 苏博特触及涨停2026-01-20
- 易薪路(eRoad)获批“专精特新”, 以“软件+AI+服务”战略领航HR数智化未来2026-01-20
- 2025年12月份一线城市房价环比降幅收窄2026-01-20
- 每日热点:1月LPR报价出炉:1年期和5年期以上利率均维持不变2026-01-20
- 河南:2025年累计发电量3891.96亿千瓦时,同比增加4.3%2026-01-20
- 今日关注:注意避雷!2026-01-20
- 企业家健康俱乐部受邀参加2026全球可持续发展杰出人物颁奖盛典2026-01-20
- 1月20日生意社沥青基准价为3110.00元/吨 速看料2026-01-20
- 头条:1月20日生意社柴油基准价为5846.60元/吨2026-01-20
- 【干货分享】万兆光网龙头股:共3只!(2026/1/19)-播报2026-01-20
- 高安市荣森建材有限公司成立 注册资本10万人民币2026-01-20
- 上市券商业绩与股价背离-播报2026-01-20
- 价格走势:2h系统均价0.4965元/Wh、2hEPC均价1.18元/Wh;本周21GWh储能招中标项目【储能·周分析】2026-01-20
- 每日热议!必和必拓上半财年铁矿石产量创新高,维持全年产量预期不变2026-01-20
- 最资讯丨患癌老人碰瓷被儿训斥“不要害别人”,引得热心网友众筹治疗费2026-01-20
- 观速讯丨春运首日火车票开售 出行需求燃情释放2026-01-20
- 看点:[快讯]信捷电气42万限售股1月27日解禁2026-01-20
- 丰县朱正杰卤菜店(个体工商户)成立 注册资本10万人民币2026-01-20
- 讯息:TCL科技:聘任王成先生为公司首席执行官(CEO)2026-01-19
- 每日速讯:新 MacBook Pro 的 OLED 屏研发在本月取得了又一进展2026-01-19
- 每日焦点!永杉锂业(603399):永杉锂业关于持股5%以上股东部分股份被司法拍卖的进展公告2026-01-19
- PriceSeek提醒:异丙醇出厂价上调50元2026-01-19
