文档介绍:数据统计分析调研需求: 有 5 分钟统计需求,目前 LOG 平台不满足。目前问题: 1 :后端的日志格式收集, 汇总。 2 :数据统计需求, 报表。统计方案: 1 :背景介绍: 网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析、百度统计和腾讯分析等等。 2 : 数据收集原理分析: 简单来说,网站统计分析工具需要收集到用户浏览目标网站的行为(如打开某网页、点击某按钮)及行为附加数据。早期的网站统计往往只收集一种用户行为:页面的打开。而后用户在页面中的行为均无法收集。这种收集策略能满足基本的流量分析、来源分析、内容分析及访客属性等常用分析视角。图 1. ? 网站统计数据收集基本流程首先,用户的行为会触发浏览器对被统计页面的一个 http 请求,这里姑且先认为行为就是打开网页。当网页被打开,页面中的埋点 Javascript 片段会被执行,用过相关工具的朋友应该知道,一般网站统计工具都会要求用户在网页中加入一小段 Javascript 代码,这个代码片段一般会动态创建一个 S cript 标签,并将 src 指向一个单独的 js文件,此时这个单独的 js文件(图 1中绿色节点)会被浏览器请求到并执行,这个 JS往往就是真正的数据收集脚本。数据收集完成后, js 会请求一个后端的数据收集脚本(图 1 中的 backend ),这个脚本一般是一个伪装成图片的动态脚本程序,可能由 PHP 、 Python 或其它服务端语言编写, js 会将收集到的数据通过 H ttp 参数的方式传递给后端脚本,后端脚本解析参数并按固定格式记录到访问日志,同时可能会在 H ttp 响应中给客户端种植一些用于追我是暝夜 QQ412653331 加我获取更多微商/网赚教程及引流方法和营销技巧踪的 Cookie 。第一步:先预先埋下 JS 代码: <script ?type="text/javascript"> var ?GHP ?= ?{ '_ nid ': ?'1025965074', '_level': ?2, '_logurl': ?'http:// baidunews /img/ ' }; (function() ?{ var ?ghp ?= ?("script"); ? ?= ?'text/javascript'; ?= ?"http://tw./resource/open/st/app. js?st=" ? + ?~(new ?Date()/43200000); var ?ss ?= ?('script')[0]; ? (ghp, ?ss); })(); </script> 数据收集脚本( )被请求后会被执行,这个脚本一般要做如下几件事: 1 、通过浏览器内置 javascript 对象收集信息,如页面 title (通过 )、 referrer (上一跳 url ,通过 )、用户显示器分辨率(通过 wind