网站首页 > 技术文章 正文
作为一个多年的微信公众号作者,了解微信公众号文章打分的机制是十分有必要的。微信在后台其实有一整套的打分机制,今天基于腾讯的这篇Paper《Cognitive Representation Learning of Self-Media Online Ariticle Quality》为大家介绍下文章质量打分背后的算法理论。
在这篇paper中其实重点分享了两个方面,一方面是文章质量分的深度学习模型设计方法,另一方面是训练数据的构造法。
1 文章质量分模型架构设计方法
整个模型的设计分为两层,第一层是蓝、粉、绿这三个模块,作为基础的文章质量embedding生成层。第二层是最上方的FC Layer全连接层,这一层主要是做评分。
论文里把上面这个网络架构叫做CoQAN,文章质量分的训练模式被当成了二分类问题。
在模型设计上分为三个独立的模块(Subnetwork),分别是:
- Layout Organization Subnetwork:布局结构判断网络,用来生成布局相关的评分
- Writing Characteristics Subnetwork:写作风格判断网络,用来评估文章的写作风格
- Text Semantics Subnetwork:语意深度判断网络,用来评估文章内容的质量
(1)Layout Organization Subnetwork
在布局评估网络中,主要通过循环网络算法GRU去判断图片、文本、视频的布局结构。
每段文章或者视频或者图片叫做一个block,GRU算法用来表述上下block结构pattern,用CNN表述block内部的布局。然后GRU和CNN综合起来
(2)Writing Characteristics Subnetwork
这个网络主要解决的是如何评估文章的写作风格,更多的是NLP方面的一些特征的挖掘,比如标题长度、核心词的个数、文章长度、n-gram、图片和文章的比例、图片数量、文章数量等。
然后利用one-hot编码就可以得到原始特征,然后还可以用一些特征交叉去生成一些交叉特征。
(3)Text Semantics Subnetwork
语意理解模型,通过优化bert模型形成hi-bert模型。hi-bert模型可以挖掘句子和词之间语意关系,找到主题和文章的语意深度。
2 文章质量分模型训练数据
上文介绍了文章评分模型的结构,在Paper的结尾片段还介绍了训练数据的构建方式。文章质量分训练可以看作是一个二分类问题,所以需要选择正样本和负样本。
正样本的标准是高等级的账号发表,具备比较高的喜欢、分享次数,不符合标准的被作为负样本。最终Paper中的模型训练使用了22054篇文章作为正样本,16194篇文章作为负样本。
最终在与其它文章质量分模型的比较中,CoQAN取得了比较好的结果:
- 上一篇: 深度学习视频理解(分类识别)算法梳理
- 下一篇: 一文了解人工智能该如何入门 学人工智能的步骤
猜你喜欢
- 2024-10-12 一文了解人工智能该如何入门 学人工智能的步骤
- 2024-10-12 深度学习视频理解(分类识别)算法梳理
- 2024-10-12 「网易云音乐」歌单推荐算法:技术同学体验反推
- 2024-10-12 深度神经网络GRU模型实战:教你两小时打造随身AI翻译官
- 2024-10-12 基于GWO灰狼优化的CNN-GRU-Attention
- 2024-10-12 基于PSO优化的CNN-GRU-Attention的时间序列
- 2024-10-12 时域卷积网络TCN详解:使用卷积进行序列建模和预测
- 2024-10-12 计算机,通信,算法 通信算法和计算机算法
- 2024-10-12 基于GA优化的CNN-GRU-Attention的时间序列
- 2024-10-12 基于PSO粒子群优化的CNN-GRU的时间序列回归预测
你 发表评论:
欢迎- 最近发表
-
- 在 Spring Boot 项目中使用 activiti
- 开箱即用-activiti流程引擎(active 流程引擎)
- 在springBoot项目中整合使用activiti
- activiti中的网关是干什么的?(activiti包含网关)
- SpringBoot集成工作流Activiti(完整源码和配套文档)
- Activiti工作流介绍及使用(activiti工作流会签)
- SpringBoot集成工作流Activiti(实际项目演示)
- activiti工作流引擎(activiti工作流引擎怎么用)
- 工作流Activiti初体验及在数据库中生成的表
- Activiti工作流浅析(activiti6.0工作流引擎深度解析)
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)