文档章节

网站流量初步分析

cassia_
 cassia_
发布于 2017/08/03 13:47
字数 4548
阅读 24
收藏 0
点赞 0
评论 0

      开发不可能脱离用户存在,在了解运营需求的同时,深入的理解业务需求,决定是否开发和怎样开发是开发的本分。本文主要从开发的角度上总结了一些基础的网站流量分析的方法和途径,是对运营、算法工作的铺垫,为其提供了基础、概述的用户分析数据,并使开发了解客户行为,对项目开发进行调整优化。


事件驱动的网站流量监控


      用户在网站的活动,是由一系列的事件构成的。例如鼠标的点击、拖拽、滑动,键盘的输入等。用户行为一般由5个要素构成:谁、何时、何地、发生动作和动作内容。
      举个例子,用户a在8月1号下午2点于iphone 7客户端点击了购买商品的按钮。这一用户行为可以分为几个要素:

  1. 谁:用户a

  2. 何时:8月1号下午2点

  3. 何地:iphone 7客户端

  4. 动作:点击按钮

  5. 动作内容:购买商品

      核心的事件是动作,而谁、何时、何地、动作内容都是作为事件的属性。
 


 

因此, 用户在网站的流量行为由一个个带有访问属性的操作事件构成。
      

     本文使用友盟+旗下的udplus和uweb做流量统计工具,详见官网:www.umeng.com。友盟+工具定义了默认的事件和事件属性。用户通过打点和属性设置可以设置自定义事件和属性。
 

Web端默认事件:

WEB访问(预置):用户从web端进入互联网的动作称为“WEB访问”。用户从进入网站到离开网站的过程记为一次访问,也称会话(Session)。30分钟内无动作,再次操作时访问量会增加一次。

访问时长(预置):用户每次访问(会话)在网站上的停留时间,从进入网站开始计时,到离开网站结束统计。如果时间跨度超过30分钟,则访问时长记为30分钟。

浏览页面(预置):浏览器加载网页的行为称为“浏览页面”,一次访问(会话)中可出现多次浏览器加载网页的行为。即浏览次数>=访问次数。

Web端默认属性如下:

分辨率宽度 (screen_width):设备的分辨率宽度,如1080。

分辨率高度 (screen_height):设备的分辨率高度,如1920。

操作系统 (os):设备的操作系统,例如window7、window8、linux等。

设备品牌 (device_brand):设备的品牌,例如apple、xiaomi、oppo、vivo等,此属性仅支持应用端,网站端默认为“未知”。

设备型号 (device_version):设备的型号,例如iPhone5、iPhone6、iphone7等,此属性仅支持应用端,网站端默认为“未知”。

设备类型 (device_type):设备的类型,如“手机,PAD,PC”,网站端一般为“pc”。

国家 (country):设备所在国家,从IP中解析出的国家名称,不能手动设定。

省 (region):设备所在省份 从IP中解析出的省份名称,不能手动设定。

市 (city):设备所在城市,从IP中解析出的城市名称,不能手动设定。

新老用户 ($ne_ol):新老用户标识,新访客仅当天内作为新用户。

浏览器 (browser):设备发送事件时使用的的浏览器名称,如chrome、搜狗高速浏览器、UC等。

来路页面 (referrer):事件发生页面的来路页面URL。

来路域名 (referrer_domain):事件发生页面的来路页面域名。


网站基础流量数据

 

PV(page view):

      页面访问次数,即网站页面被访问的总次数。PV值总体上反映了网站的流量。

UV(Unique Visitor):

      独立访客,访问您网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只会被计算一次。

IP:

      拥有特定唯一IP地址的计算机访问您的网站的次数。与UV不同的是通常对于有相同网关的学校用户、公司用户,Ip只会统计一次。

新UV:

      当天新访问网站的独立访客,新UV值反映了网站的用户增长数。

访问次数:

      用户每次访问网站到离开网站算一次完整的访问。

对于PV,UV,IP,访问次数4个值,通常他们之间的关系为:

 

pv > 访问次数 > UV > IP

 

  • PV、访问次数比例反映了用户的访问深度。数值越大,用户在网站浏览量越大。数值越小,开发者就越需要考虑跳出率高的原因。网站内容大致有几个影响访问深度的原因:原创性价值内容,相关推荐内容,图片格式内容。

  1. 什么的内容才是有用呢?一是能帮助用户解决问题,二是要原创性,这就是原创性价值内容。

  2. 用户访问内容时,都希望有更好的内容出现在自己的眼前,比如其他用户热访的内容、推荐内容、置顶内容等这些都可以很好的提高用户访问深度。

  3. 一般用户长时间上网都会产生审美疲劳的,通过图片内容就能有效地改观。这就是有图有真相。

  • 访问次数、UV比例反映了每个用户的来访次数,也可以提现用户的留存情况。数值越大,代表用户越“忠诚”。反之,就需要反思为什么留不住用户。用户留存率越高,意味着用户使用产品的时间越长,他们能够为产品带来现金流和资本估值也就越高。内容留人、功能留人、好友留人、物质激励、情感留人、个人品牌推荐、线下活动等都是常见的提升用户留存率的运营手段。

  • UV、IP比例大部分情况下都依赖于业务的市场定位。面向企业用户的b2b平台显然比例相对较大,面向学生的平台同理,因为这部分客户大多使用公共IP访问。这就需要结合业务具体分析。


来源分析


    来源分析包含了站外来源分析和站内来源分析。

外部来源:


    外部来源一般如下图所示:




     

    外部来源总体上分为PC端和移动端,在此基础上,大部分流量来自于搜索引擎、推广渠道、直接访问、网站外链和其他来源。占比能有效地帮助开发分析功能开发的重心在哪儿,对搜索引擎的重要性有一个底儿,对推广渠道的效果有直观的提现。


    1.搜索引擎。

      搜索引擎分析可以得出流量来源的搜索引擎占比。



     

    搜索引擎占比能够很好的帮助我们了解用户的来源分布,进一步在seo优化时多搜索引擎分布进行一定的倾斜。

    除了占比之外,搜索词也能很好的反映用户的需求和目的性。、

    例如上图为qq粉丝网的搜索数据。可以看出来自搜索引擎数据大部分是来查火车票的(真够奇怪的),看来对于火车票查询这块,开发需要多费费脑筋了。

    

    2.网站外链

    网站外链可以分析用户来源的域名和来源的网页。排名高的来源域名需要运营去寻找原因,和其他来源域名进行对比分析。

   

    一般来说,外链来源包含了推广渠道。需要我们通过筛选拿到正常外链和推广链接相应的数据做统计分析。

 

内部来源

    网页流量的内部来源就是客户在网站上到达该页面的路径分析。开发人员应该很清楚来访路径有哪些,对于热门页面。过长的访问路径会大大降低页面的来访。缩短访问路径,提高页面PV的最佳方案是热门推荐类功能。通过首页或关键页面的推荐功能,吸引用户的访问(例如电子商务网站的促销),将内部来源大部分锁定在首页,将大大提高业务收益。

    上图是mafengwo网站的内部来源页面。当然,直观的数据或许不容易分析,但是分析内部来源路径比较复杂,uweb没有相应功能,甚至自定义事件分析的udplus也未提供。我们需要通过open API拿到原始数据进行绘图分析。

 

到访分析

    到访分析有简单的分析过程也有复杂的分析过程。基础分析通常只能获得用户访问的页面占比、趋势,以及某一页面的热点分布。复杂的分析需要详细的用户行为事件,这通常需要进行事件打点监控,将在后面继续介绍。

受访页面分析

    简单分析,就是受访页面PV量和页面占比,简单的数据并不能得到什么有用的数据。可以对比以前的受访页面,进行趋势分析。

    页面占比很能说明用户的兴趣内容。例如对新闻网站来说,对于军事、社会、科技、娱乐、游戏等类型新闻占比分析,可以知道大部分用户的兴趣方向。方便运营更有效可靠的对板块投递推广广告等等。

    针对PV量的趋势分析可以看出用户对某类页面的兴趣趋势。结合推广信息、推荐信息来看,可以知道推广、推荐的效果,再具体分析其原因等等。

常见的流量较高的受访页面包括如下几类:

1)网站首页:流量高低直接反映您网站在网民中的熟知程度

2)频道首页、目录列表页:流量越高说明此频道(或目录版块)的内容越热门

3)活动推广页(例如搜索引擎推广的直达页):流量越高、推广效果越好

4)热门文章页:流量反映网民兴趣关注点、社会热点

5)功能流程页:流量反映此功能的用户量

    当我们在分析“受访页面”时,可以结合网页类型及作用综合分析,从而更好地发现哪些页面最热门、哪些页面存在潜在问题。

热点图

    热点图是一种非常直观的查看用户关注热点的统计图像。从热点图可以直观地得到很多信息。

●用户的关注点与您的期望是否相同?

页面上不同的内容间往往重要性不同,但有时由于设计失误,期望的重要内容可能并没有受到用户更多的关注,这样损失的流量相当得不偿失—热点图帮您监控您的页面设计是否符合访客喜好,访客点击效果是否达到预期。

●哪些区域破坏了用户体验?

优秀的网站内容也要通过良好的体验设计展现给用户。如果设计不合理,用户使用时就会迷惑、不方便,体验值下降。 热点图帮您发现网站页面哪些区域可能破坏了用户体验,需要改进。

●不同来源类型的访客关注点是否相同?

您可将访客按照来源类型进行细分,发现不同来源访客行为的差异,进而区别对待、优化网站。

●广告位放在哪更赚钱?

下次规划广告位时,可以考虑选择热点区域的周边位置,更多的将广告转化成收入。

 

出口分析

    出口分析就是分析用户跳出网站的行为。一般来说网站出口分为外链和退出。出口为用户访问的最后一个页面。比如访客付款成功后就离开网站,那么付款成功页即为次此访问的站内出口页。页面成为站内出口,就意味着访客浏览此页后流失了。

重要指标分析:

    离开次数:该页面作为访问(会话)中的最后一个页面的次数。对于离开次数高的页面,您需要根据页面类型分析具体原因:比如如果功能流程的最后一个页面离开次数较高,您可以考虑在该页面增加其它服务链接,以留住访客;如果是首页离开次数较高,您就需要对页面内容、用户体验进行详细分析,找到用户离开的原因。

外链

    用户通过外链离开一般是在网站人员的预测范围内。例如用户通过相关广告跳转到其他域名,或者通过友链跳转至其他网站。通过友链的类型可以分析出用户的目的,知道用户的目的就是一切分析行为的目的。接下来要考虑的就是怎么根据用户目的留住用户了。

退出

    直接退出除了用户已经逗留很久之外,大部分意味着网站达不到用户的目的。跳出率很高意味您的某些页面虽然引入了较多访客,但访客只看了这一个页面就立即离开,这时您就需要分析:是否因为这些页面内容不够吸引访客,或者内容与访客打开页面的初衷不一致。从而优化您的推广方案、页面内容、用户体验等。

 

漏斗分析

    漏斗分析是一个强大的分析工具。总体来说和用户访问路径比较想象。但是漏斗的更强大之处是利用打点功能监控用户的具体行为进行分析。

    打点功能是udplus提供的自定义事件监控的功能,具体内容可以查看官方文档。这里只说两个用处很大的功能。

  1. 可以使用dplus.track发送自定义事件数据,例如在用户点击播放视频按钮的控件上:
dplus.track(event_name, properties, callback);

event_name – {必须} [String] 自定义事件名称。
properties – {可选} [Object] 随该事件一起发送的事件属性。每个属性包括属性名和属性值;一个事件可以包含多个不同的属性,写成JSON“键-值”对格式。
callback – {可选} [Function] 事件发送后的回调函数。

    2. 通过register方法为用户标记超级属性:只需调用一次register,之后他触发的所有事件都将自动包含该属性。例如:

dplus.register({
    "age" : 29,
    "gender" : "male"
})

接着如果用户触发事件:

dplus.track("Login");  

该事件就会自动带上超级属性,它等效于:

dplus.track("Login",{
    "age" : 29,
    "gender" : "male"
})

    进行页面打点后,除了预制的网站访问、页面浏览事件之外,用户自定义了多种事件,例如:

    通过对事件的统计分析,反映出用户的关注点。

    漏斗分析是对用户使用流程中用户数量的转化和流失的分析工具。网站/APP在设计时,都会设计一个流程来引导用户完成网站/APP的使用,这个流程就是网站/APP的产品使用逻辑。网站/APP的设计者都希望所有用户在使用产品时能完成流程中的所有步骤,但是事实上这个流程中每一步骤都会发生用户流失,这时就有了用户转化率和流失率的概念。漏斗分析工具就是对这种转化和流失进行数据监控和分析。

    

    结合具体的业务,例如用户访问网站->查看商品->加入购物车->订单结算,通过这条事件链,可以得到每一个转换的用户数量和转换率,结合具体业务分析,需要在哪一步进行优化服务。

 

用户画像

    用户画像是友盟+的最突出的一个功能。因为用户画像不是仅仅对用户的客户端、浏览器版本、区域等等浏览器标识信息进行统计分析,更重要的是,其利用全网数据,对某一用户进行精确标识,得到用户全网数据。

    怎么做到精确标识呢?对独立访客(UV):1天(00:00-24:00)内访问网站的不重复用户数(以浏览器cookie为依据),一天内同一访客多次访问网站只被计算1次。无法获取访客A的cookie信息:新版结合该访客的IP和UA(浏览器标志)进行识别,即使访客A多次访问该网站,也只被计数一次。

    统一标识用户后,通过cnzz庞大的客户网站,用户的所有属性都将一览无余。

应用偏好:

    

用户活跃度:

婚姻状态:

消费能力:

年龄阶段:

性别:

    剩下该干什么,不用多说了吧。。。

 

总结

    网站用户行为监控是一个很庞大的话题,涉及普通的工具、算法、大数据甚至机器学习、人工智能方面,这里只利用简单的数据采集工具对一些用户行为做了简单的分析介绍,提供基础概要的分析思路,帮助开发人员更好的理解业务场景和用户行为。

© 著作权归作者所有

共有 人打赏支持
cassia_

cassia_

粉丝 6
博文 33
码字总数 29996
作品 0
朝阳
架构师
有针对分布式系统中节点负载平衡的开源软件或者框架吗?

现在实验室有两个项目,一个项目是对大量的网络数据流量进行分析的系统。其中一台机做为主节点,用于分发数据流量和数据初步整理,其他的机器是用来对数据流量进行最终处理。还有一个是对P2P...

Mitisky
2013/09/17
125
3
记一次惊心动魄的黑客攻击

一直知道有黑客的存在,一直知道有“黑产”的存在,但没想到过有一天我如此近距离的接触黑客以及所谓的黑产。 事情的经过大概是这样的,昨天晚上10点登录系统突然收到告警短信,告警信息表明...

DearNicole
2017/12/06
0
0
美国田纳西州地方选举网站遭受DDOS攻击

        近日,据外媒报道称,用于显示美国田纳西州诺克斯维尔市初选结果的网站,一度因遭遇分布式拒绝服务(DDOS)攻击而被迫中断服务。此举造成选民访问网站及查看选举结果受限。但诺...

嘶吼RoarTalk
05/10
0
0
掌握4项指标,轻松搞定网站流量分析【长沙IT培训】

【湖南优就业 导读】网站流量是影响电商转化率的一个重要因素,也是判定一个网站好与坏的重要标准。一般来说,网站流量分析包含四部分:流量来源分析、流量效率分析、站内数据流分析和用户特...

湖南优就业
2017/11/24
0
0
粗糙的贝叶斯转化概率预测模型

转化率是网站分析中最受关注的指标之一,如何设定转化率目标?哪些用户最有可能转化?他们有哪些特征?如何发现并找到这些用户?这些都是负责网站运营和市场营销的同学最关注的问题。本篇文章...

ShualLiu
2016/11/14
26
0
购买阿里云ECS服务器配置如何选择?2018新手教程

不知道怎么购买ECS?还在烦恼没有人指导购买?以下机型推荐给正在纠结的你! 阿里云为您拎出几款常用机型,帮您配好相关配置,您只要简单的选择地域、镜像、时间和台数信息即可轻松购买。 还...

qq1695381214
03/29
0
0
快讯 新浪新闻首页疑似被劫持长达数小时,跳转博彩网站

  网页劫持是博彩推广链中惯用的手段之一,而对于新浪、腾讯这种级别的大型成熟门户网站,虽然是博彩网站劫持的最佳目标,但往往不太可能成功。日均数千万PV,即便被劫持几分钟也足够给博彩...

FreeBuf
今天
0
0
SEO优化:网站优化的五大步骤

我们在做SEO优化的过程中,不能毫无头绪得去做,不然取得的效果很差,做任何事情,都要有一个好的策划,完整的方案才能做的更好。今天搜客大伟讲讲做网站优化的五大步骤:   1、关键词分析...

大伟_sem
07/02
0
0
栖与谁邻解析:网站收录很高但是为什么网站不仅排名低流量也少

一个网站靠SEO能带来多少流量数,可以说这个跟该网站的被收录数还有快照数没有直接的关系。百度快照或者其他快照更新的快只能说明搜索引擎暂时对我们的网站比较重视,产生了兴趣这确实对于网...

qq_41897682
04/05
0
0
SEO六大环节

进行搜索引擎优化学习已经有一段时间,总体上了解的东西很多,但还是缺乏系统性的总结,更没有实际上的进行搜索引擎优化的系统性训练,所以很想找个机会来检验一下自己的。下面总结一下SEO通...

zting科技
2017/01/12
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

数据结构与算法2

一个数组的例子,实现查找,显示和删除的功能。 public class array {public static void main(String[] args){long[] arr;arr = new long[100];int nElems = 0;int j;...

沉迷于编程的小菜菜
12分钟前
0
0
Python3 基于 requests 批量下载图片

Python3 基于 requests 批量下载图片 import requestsheaders = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8','Accept-Encod......

leeyi
12分钟前
0
0
Sparkstreaming and Kafka

简介 Kafka 0.10的Spark Streaming集成设计与0.8 Direct Stream方法类似。 它提供了简单的并行性,Kafka分区和Spark分区之间的1:1对应关系,以及对偏移量和元数据的访问。 但是,由于较新的...

刺猬一号
17分钟前
0
0
java获取当前时间所在一周的周一和周日日期

/** * 当前时间所在一周的周一和周日时间 * @param time 当前时间 * @return */ public static Map getWeekDate(String time) { Map map = new HashedMap(); SimpleDateFormat sdf = new Si......

小弱鸡
44分钟前
0
0
Redis数据的导出和导入(dump和load方式)

网上有些文章已经不再适用,本人也是踩了些坑,在此记录下。 迁移redis数据一般有如下3种方式: 第三方工具redis-dump,redis-load aof机制,需要开启aof功能 rdb存储机制 这里介绍第一种方式...

iplusx
49分钟前
1
0
ElasticSearch 高亮显示大文档搜索结果

2016年12月,我们开始研究Ambar——一个文档搜索系统。Ambar使用ElasticSearch作为核心搜索引擎。 在Ambar开发的过程中,我们处理了很多与ES相关的问题,我们想分享我们得到的宝贵经验。让我...

九州暮云
今天
1
0
Python 使用 pywifi 模块 破解wifi密码

git https://github.com/awkman/pywifi 常见常量 from pywifi import const# Define interface status.IFACE_DISCONNECTED = 0IFACE_SCANNING = 1IFACE_INACTIVE = 2IFACE_CONNEC......

阿豪boy
今天
2
0
phpstorm使用Iedis

phpstorm的redis插件Iedis是真好用 看了网上挺多的文章,但是由于我系统还是ubuntu,就有点尴尬了,现在破解之后,留个笔记,即使自己之后有需要也可以很快翻阅 先下载资源 资源下载 zip压缩...

贤郎--均灵
今天
0
0
第三章 spring-bean之FactoryBeanRegistrySupport(4)

前言 从FactoryBeanRegistrySupport类的名字可以看出FactoryBeanRegistrySupport负责FactoryBean的注册与支持。如果想知道FactoryBean相关的资料,请阅读spring-bean中关于FactoryBean的解读...

鸟菜啊
今天
0
0
CentOS “Destination Host Unreachable”问题解决办法

挑战极速安装CentOS时遇到局域网主机不能通信的情况: [root@zjd network-scripts]# ping 8.8.8.8PING 8.8.8.8 (8.8.8.8) 56(84) bytes of data.64 bytes from 8.8.8.8: icmp_seq=1 ttl=......

wffger
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部