文档章节

拓端数据|机器学习洞察公众号“吸睛”话题

glttom
 glttom
发布于 2017/07/15 12:12
字数 1400
阅读 3
收藏 0

 

当手机称为人们的随身设备,改变人们的通讯习惯时,“公众号”这一种新媒体形式渗透进人们的生活。处在社交媒体时代,公众号推送已然成为我们获取信息的一个重要途径。

自然而然,软文营销成为新媒体的主要广告手段和创收形式。阅读量和点赞数无疑是衡量一篇公众号文章推广效果最直接的指标,而什么样的公众号文章最容易获得人们的关注呢?

tecdat利用文本挖掘手段,深度挖掘三大娱乐公众号的16年度的历史文章,用 LDA 模型提取主题,发现最“吸睛”的话题模式,指导公众号打好推广的“组合拳”。

 

解读脉络

 

■娱乐公众号都在聊些什么?

■哪些话题、哪些明星最受娱乐公众号的青睐?热门话题中谁是头条MVP?

■话题与涉及明星等因素是否显著影响文章点击热度?

 

公众号都在讨论哪些话题?

 

机器学习洞察公众号“吸睛”话题

从以上词云图可以看出公众号话题反映出来的数据现象:恋情绯闻、运动健身、私人感情生活、颜值相关联的内容提及率非常高;(微博/网红/直播等)从这些高频词可以发现,借助社交媒体平台“网红”达到了非常可观的影响力。

■ 数据统计:来自tecdat数据分析平台

■ 讨论度计算:在微信渠道中,主题被提及到的总文章数量。

机器学习洞察公众号“吸睛”话题

从提及高频主题可以看出,自 2016 年 1 月 22 日至 2016年 12 月 18 日之间各个时间段,公众号对于各个话题均有不同数量的报导内容。根据每条公众号所匹配的各个主题,其数量从多到少依次为话题:演技评论、恋情绯闻、微博爆料、男神颜值、感情生活、颜值、电视剧、综艺、吃吃吃拍拍拍、私人生活、离婚八卦、演唱会、造型、网红、电影票房、家庭、直播、运动健身、投资经济、相声。

 

热门话题

 

我们基于这段周期微信公号平台数据来看,筛选出热门话题发现:

机器学习洞察公众号“吸睛”话题

公众号最喜欢讨论的主题是演技(话题 13)、感情绯闻(话题 2)、微博话题爆料(话题 1)以及颜值(话题 8)。

提及“演技”占 9.1%;

提及“感情绯闻”占 8.8%;

提及“微博爆料”等占 8.4%;

提及“颜值”等占 7.8%;

这四个话题的讨论度占据了总话题讨论度的 34%。

 

谁是公众号最青睐的明星?

 

当从数据中提取公众号最频繁提到的明星时,发现无论是从上面最热的 4 个话题中提取(选取被提到次数大于 4000次的明星),还是从所有话题中提取(选取被提到次数大于9000次的明星),最受公众号青睐的 10 个明星都分别为:范冰冰、胡歌、黄晓明、霍建华、李易峰、林心如、文章、杨幂、杨洋与赵丽颖。包括与其他明星一起被提到的话题,这十个明星就占据了总话题量的 68.56%。

机器学习洞察公众号“吸睛”话题

■ 数据统计:来自tecdat数据分析平台

■ 讨论度计算:在微信渠道中,主题被提及到的总文章数量。

 

最热的十位明星一般出现在哪些话题中

 

机器学习洞察公众号“吸睛”话题

在案例所包括的时间内,娱乐圈出了许多爆炸新闻,例如:“霍建华(HJH)和林心如(LXR)公布恋情、大婚”等。因此,霍建华与林心如频繁出现感情绯闻类的话题中。

机器学习洞察公众号“吸睛”话题

机器学习洞察公众号“吸睛”话题

 

从最热的十位明星最频繁出现在的话题,我们发现,最常出现在微博话题爆料的明星是杨幂和刘亦菲,大约为 59.12%;占据感情绯闻话题(话题 2)大的明星是霍建华与林心如,大约为 41.76%;胡歌、霍建华和杨洋占据男神颜值榜话题(话题 8)的 42.5%;而频繁出现在演技话题(话题 13)中的明星是胡歌、刘亦菲和杨幂,大约为 42.55%。

 

热门主题+热门明星+原创性的组合拳

 

数据观察之后,我们发现话题主要涉及微博爆料、恋情绯闻、网红等。以范冰冰、胡歌、霍建华为代表的十位明星成为娱乐公众号关注的焦点。

主题-明星组合(例如:颜值-胡歌)成为各大公众号的老生常谈。原创性和热门明星成为点击量的保证,而不同主题之间也表现出明显的差异。

主题类别与涉及明星之间存在交叉效应,热门主题+热门明星的组合带来了阅读量、点赞量的显著提升,最易获得订阅读者支持。

经营公众号的推广业务,需要娱乐公众号紧追微博爆料、家庭、离婚娱乐、演技评论等保证流量的话题,尤其是几位热门明星的相关娱乐新闻。此外,原创性也是公众号持续获得关注的重要因素。

 

【拓端数据tecdat.cn】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。

© 著作权归作者所有

共有 人打赏支持
glttom
粉丝 0
博文 3
码字总数 4260
作品 0
宝山
荐号 | 与其焦虑成疾,不如静心学习

我一直在学习、做事,做了一件,又做了一件,为什么和鲁迅先生门前的两棵枣树一样,总是没啥用呢?(From MacTalk) 当处于这种焦虑状态时,你再怎么做事是无法得到你预期的效用的,只会更加...

mbx8x9u
04/16
0
0
飔拓荣获“2017年度ECI智能交互类大数据应用创新奖”

12月27日下午,“2017 ECI Festival国际数字商业创新节——大数据应用创新峰会在北京中国大饭店隆重举行并取得圆满成功。本届ECI Festival以“创新无界”为活动主题,通过洞察时代创新趋势,...

武汉飔拓科技
2017/12/29
0
0
独行快、众行远,一场架构师的专场汇

对软件开发、架构设计和系统运维人员来说,在技术日新月异发展的时代,必须及时补充新的知识,储备技能,才能在职场竞争中处于优势地位。架构师更是如此,不但要追求技术深度,还要兼顾技术广...

btb5e6nsu1g511eg5xeg
2017/12/18
0
0
Oracle NetSuite推出全球首款智能云套件

为了满足企业业务快速发展的需求、提供工具和洞察,Oracle NetSuite今天发布了全球首款智能云套件。通过将基于人工智能和机器学习的强大功能集成入领先的云业务管理套件中,NetSuite可为企业...

玄学酱
05/01
0
0
独行快、众行远,推荐几个优秀的原创公众号

对软件开发、架构设计和系统运维人员来说,在技术日新月异发展的时代,必须及时补充新的知识,储备技能,才能在职场竞争中处于优势地位。架构师更是如此,不但要追求技术深度,还要兼顾技术广...

bjweimengshu
2017/12/19
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

c语言之内存分配笔记

先看一个数组: short array[5] = {1,2} // 这儿定义的一个int类型的数组,数组第1和第2个元素值是1和2.其余后面默认会给值为0; 或者 short array[] = {1,2};//这儿数组第1和第2个元素,数组...

DannyCoder
今天
2
0
Shell | linux安装包不用选择Y/N的方法

apt-get install -y packageOR echo "y" | sudo apt-get install package

云迹
今天
2
0
Hadoop的大数据生态圈

基于Hadoop的大数据的产品圈 大数据产品的一句话概括 Apache Hadoop: 是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支持MapReduce分布式计算的软件架...

zimingforever
今天
5
0
八大包装类型的equals方法

先看其中一个源码 结论:八大包装类型的equals方法都是先判断类型是否相同,不相同则是false,相同则判断值是否相等 注意:包装类型不能直接用==来等值比较,否则编译报错,但是数值的基本类型...

xuklc
今天
2
0
NoSQL , Memcached介绍

什么是NoSQL 非关系型数据库就是NoSQL,关系型数据库代表MySQL 对于关系型数据库来说,是需要把数据存储到库、表、行、字段里,查询的时候根据条件一行一行地去匹配,当量非常大的时候就很耗...

TaoXu
昨天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部