网站首页 > 技术文章 正文
如今,预训练的序列到序列模型,如BERTSUM和BART,在抽象概括方面显示出最先进的成果。在这些模型中,在微调过程中,编码器将句子转化为潜在空间中的上下文向量,解码器则根据上下文向量学习摘要生成任务。在我们的方法中,我们考虑了突出的和非突出的上下文向量的两个集群,利用这些集群,解码器可以更多地关注突出的上下文向量来生成摘要。为此,我们在编码器和解码器之间提出了一个新的聚类转换层,它首先生成两个突出的和非突出的向量聚类,然后对聚类进行归一化处理,使它们在潜空间中分开。我们的实验结果表明,通过学习这些不同的聚类模式,所提出的模型优于现有的BART模型,在CNN/DailyMail和XSUM数据集中平均提高了4%的ROUGE和0.3%的BERTScore。
《Learning Cluster Patterns for Abstractive Summarization》
论文地址:http://arxiv.org/abs/2202.10967v1
猜你喜欢
- 2024-10-23 人手一个!微软开源Deep Speed Chat,人人拥有ChatGPT!
- 2024-10-23 减轻幻觉新SOTA,7B模型自迭代训练效果超越GPT-4,上海AI lab发布
- 2024-10-23 讯飞云港|讯飞联合团队荣登国际文本摘要国际比赛榜首
- 2024-10-23 康奈尔开源近10万份审稿意见,未来论文发表或将由AI定夺
- 2024-10-23 BRIO:抽象文本摘要任务新的SOTA模型
- 2024-10-23 打脸“AI灭绝伦”!新研究反驳:GPT不会威胁人类生存?
- 2024-10-23 一举夺魁!讯飞联合团队荣登生成式文本摘要国际比赛榜首
- 2024-10-23 打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
- 2024-10-23 一文看尽LLM对齐技术:RLHF、RLAIF、PPO、DPO……
- 2024-10-23 如何评估预测值与真实值之间的匹配质量
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)