用户分析是网站分析中一个重要的组成部分,在分析用户之前我们必须首先能够识别每个用户,分辨哪些是”New Customer”,哪些是”Repeat Customer”。这样不但能够更加清晰地了解到底有多少用户访问了你的网站,分辨他们是谁(用户ID、邮箱、性别年龄等);同时也能够帮助你更好地跟踪你的用户,发现它们的行为特征、兴趣爱好及个性化的设置等,以便于更好地把握用户需求,提升用户体验。
通常当你的网站提供了注册服务,而用户注册并登陆过你的网站,那么用户可以更容易地被识别,因为网站一般都会保存注册用户的详细信息;但是你的网站并不需要注册,而用户的行为以浏览为主,这是用户识别就会显得较为困难,下面提供了几种常用的用户识别的方法:
识别用户的几种方法
当用户并未注册登录的情况下,识别用户的唯一途径就只剩下用户浏览行为的点击流数据,通常情况下它们会保存在WEB日志里面。
1、基于IP的用户识别
IP地址是最容易获取的信息,任何的WEB日志中均会包含,但其局限性也较为明显:伪IP、代理、动态IP、局域网共享同一公网IP出口……这些情况都会影响基于IP来识别用户的准确性,所以IP识别用户的准确性比较低,目前一般不会直接采用IP来识别用户。
获取难度:★
准确度:★
2、基于IP+Agent的用户识别
同样基于最简单形式的WEB日志,我们可以增加一项——Agent,来提高单一IP方式识别用户的准确性。Agent也是WEB日志中一般都会包含的信息,通过IP+Agent的方式可以适当提高IP代理、公用IP这类情况下用户的分辨度,同时通过Agent还可以识别网络爬虫等特殊“用户”,但同样准确度也欠高。
获取难度:★
准确度:★★
3、基于cookie的用户识别
当你通过自定义Apache日志格式或者JavaScript的方法获得用户cookie的时候,其实你已经找到了一个更有效的用户识别的手段。cookie在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个cookie),所以用cookie来标识用户其实指的是用户使用的客户端电脑,而并非用户本身。
用cookie识别用户的方法当然也存在缺陷:最常见的就是cookie被清除而导致用户无法与原先记录实现对应;同时由于客户端电脑会被共用,或者用户会在不同的电脑上访问你的网站,这个时候cookie就无法直接对应到该用户了。
获取难度:★☆
准确度:★★☆
4、基于用户ID的用户识别
基于用户ID的用户识别是最为准确,因为一般情况下用户不同共享他的用户ID,所以我们可以认为数据中的userid唯一地指向该用户,几乎不存在偏差。当然要使用用户ID来识别用户是需要一定的前提条件的:网站必须是提供用户注册登录服务的,并且可以通过一些手段在点击流数据中记录userid。
获取难度:★★
准确度:★★★
所以对于一个需要用户ID注册登录的网站来说,用户唯一标识符的选择可以遵从以下顺序:当用户注册登录时以userid为准,当用户在未登录状态浏览时以用户的cookie为准,当用户未登录且cookie无法获取的情况下以IP+Agent为准;这样就能从最大程度上识别唯一用户。
这里推荐一个网站日志中cookie项的自定义设置方法,以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的,这个文件里面一般在包含一个cookieid的同时也会记下用户在该网站的userid(如果你的网站需要注册登陆并且该用户曾经登录过你的网站且cookie未被删除),所以在记录日志文件中cookie项的时候可以优先去查询cookie中是否含有用户ID类的信息,如果存在则将用户ID写到日志的cookie项,如果不存在则查找是否有cookieid,如果有则记录,没有则记为”-”,这样日志中的cookie就可以直接作为最有效的用户唯一标识符被用作统计。当然这里需要注意该方法只有网站本身才能够实现,因为用户ID作为用户隐私信息只有该网站才知道其在cookie的设置及存放位置,第三方统计工具一般很难获取。
获取用户信息的途径
通过以上的方法实现用户身份的唯一标识后,我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息,然后为每位用户建立起详细的Profile:
1) 用户注册时填写的用户注册信息及基本资料;
2) 从网站日志中得到的用户浏览行为数据;
3) 从数据库中获取的用户网站业务应用数据;
4) 基于用户历史数据的推导和预测;
5) 通过直接联系用户或者用户调研的途径获得的用户数据;
6) 有第三方服务机构提供的用户数据。
识别并获取用户信息的价值
通过用户身份识别及用户基本信息的采集,我们可以通过网站分析的各种方法在网站是实现一些有价值的应用:
基于用户特征信息的用户细分;
基于用户的个性化页面设置;
基于用户行为数据的关联推荐;
基于用户兴趣的定向营销;
……
文章来源:http://webdataanalysis.net/personal-view/web-user-identification/
分享到:
相关推荐
论文研究-一种新的层次结构网站用户兴趣模式变化识别算法.pdf,
2023最新版ChatGPT网站源码+支持ai绘画+GPT4.0+GPT3.5绘画+实时语音识别输入+用户会员套餐+管理后台 新增支持GPT4和Midjourney绘画,正版授权永久更新,前端UI可二次开发! 支持手机电脑不同布局页面自适应! 二、...
Web访问挖掘中的匿名用户识别算法研究,李红波,孟欣赏,有效的用户识别与用户细分是网站用户行为分析的基础。针对现有用户识别算法将注册用户和匿名用户混同识别,导致用户分类不细致的
程序已支持ChatGPT4.0、Midjourney绘画、GPT3.5 API绘画、Prompt角色预设功能(后台自定义添加,用户也可自定义添加)、语音识别输入、用户会员套餐、用户邀请分销功能、用户每日签到功能、系统后台管理、一键更新...
ChatGPT网站是一个以人工智能技术为核心的在线交流平台,其源码可以支持最新的GPT-4模型和AI绘画技术。...ChatGPT网站还支持实时语音识别输入功能,这可以大大提高用户的交流效率。通过该功能,用户
SiMiniOcr.ocr接口(位于siminiocr.dll文件中,按键用户请将其放在plugin目录下,VB,VC用户将其作为COM调用即可)详细说明: 方法: OCR(x1,y1,x2,y2);//识别所设定区域的文字,返回识别到的文字 SetDict("我的字库....
程序已支持ChatGPT4.0、Midjourney绘画、GPT3.5 绘画、语音识别输入、文章资讯发布功能、用户每日签到功能+一键更新版本。支持手机电脑不同布局页面自适应。 1、提问:程序已经支持GPT3.5、GPT4.0接口 2、支持三种Ai...
近年来相关研究提出了浏览器指纹的获取和识别方法,网站通过页面中的动态代码来收集用户的系统字体设置、显示设置、浏览器版本等指纹信息。但由于用户的很多行为能导致浏览器的指纹信息产生变化,而完全静态匹配指纹...
ChatGPT商业网站系统V4.9.2+支持GTP4+支持ai绘画(Midjourney)+ChatGPT3.5key绘画+Prompt面具角色扮演+实时语音识别输入+用户会员套餐+好友邀请分佣功能+支持对接易支付! 一、最新ChatGPT网站源码 程序已支持ChatGPT...
登录网站验证码的生成与识别系统是一个使用Python和Django框架开发的项目,旨在为网站提供安全的用户验证过程。该系统主要包括两个部分:一是服务器端用于生成验证码图片的逻辑,二是客户端(通常包括后端处理和前端...
高清真实网站头像打包下载,可用于虚拟用户场景,测试,头像归类识别,2000张头像打包下载
厦门宸天电子科技有限公司 网站 : http://www.dragonskytech.com 可下载识别演示和sdk开发包。 SupPlate集视频检测卡口,闯红灯电子警察,逆行检测为一体,抓拍率全天候约90%,有效率大于80%。 可很好识别高清照片...
训练数据集一共包括四个文件,用户风险标签,用户通话记录数据,用户短信记录数据,用户网站/App访问记录数据。 测试数据集一共包括三个,用户通话记录数据,用户短信记录数据,用户网站/App访问记录数据。 初赛与...
Captchio1.0 一些网站的登录/应用要求用户输入验证码,而一些用户的应用需要自动完成这些登录/应用这些网站,这个时候,你就需要通用验证码识别(Captchio)来完成这个工作。通用验证码识别(Captchio)不能单独使用,...
训练数据集一共包括四个文件,用户风险标签,用户通话记录数据,用户短信记录数据,用户网站/App访问记录数据。 测试数据集一共包括三个,用户通话记录数据,用户短信记录数据,用户网站/App访问记录数据。 分别使用...
程序已支持ChatGPT4.0、Midjourney绘画、GPT3.5 绘画、语音识别输入、文章资讯发布功能、用户每日签到功能+一键更新版本。支持手机电脑不同布局页面自适应。 1、提问:程序已经支持GPT3.5、GPT4.0接口 2、支持三种Ai...
ChatGPT商业运营网站源码+GPT4+支持ai绘画+实时语音识别输入+用户会员套餐+友邀请分佣功能+支持对接易支付+邀请分佣功能+网站后台管理+永久更新! 一、最新ChatGPT网站源码 程序已支持ChatGPT4.0、Midjourney绘画、...
基于python登录网站验证码的生成与识别系统 近年来随着互联网应用技术的飞速发展,为了确保网站系统平台的安全性,各类网站相继推出了验证码应用技术,通过验证码的应用来帮助缓解暴力破解账户密码、垃圾邮件攻击...
随着智能终端(智能手机及平板电脑)及移动通信(3G)的发展,原来运行在PC上的信息系统(如邮件系统、即时通信、网页浏览、协同办公、网络购物、社交网站、博客等)逐渐转移到智能终端设备上。可以预见未来几年60%...