专利名称:一种基于语句改写的面向端到端对话的数据增强方
法
专利类型:发明专利
发明人:胡若云,王正国,沈然,吕诗宁,江俊军,丁麒,朱斌,孙钢,
金良峰,汪一帆,谷泓杰
申请号:CN202010151751.9申请日:20200306公开号:CN111522921A公开日:20200811
摘要:本发明公开了一种基于语句改写的面向端到端对话的数据增强方法,涉及一种数据处理方法。目前现场增强难以实现系统层面的整体优化。本发明通过构建并训练一个语句改写模型来扩充对话生成模型的训练数据,通过定义用户语句的对话功能来构造语句改写模型的训练参考;采用基于序列到序列的框架,使用两个解码器依次解码前一轮系统对话动作和改写后的用户语句,前一轮系统对话动作可以为用户语句的改写提供对话历史背景,使得生成的改写语句更加符合对话语境。本技术方案在语句改写模型和对话生成模型的解码器之间加入了注意机制,实现端到端对话系统的搭建,并使得改写语句可以直接辅助对话生成,同时对话生成的结果也可以监督语句改写模型的训练。
申请人:国网浙江省电力有限公司电力科学研究院,国网浙江玉环市供电有限公司
地址:310014 浙江省杭州市下城区朝晖八区华电弄1号
国籍:CN
代理机构:浙江翔隆专利事务所(普通合伙)
代理人:王晓燕
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容