A/B测试:实现方法

A/B Testing 实现方法

上文介绍了 A/B 测试的基本概念,接下来我们继续探讨如何实现 A/B 测试。

我们先来看一个图:

A/B testing 部署概念图

(注:感谢Algo提供本图。)

上图展示了 A/B 测试的实现原理。从左到右,四条较粗的竖线代表了 A/B 测试中的四个关键角色:客户端(Client)、服务器(Server)、数据层(Data)、数据仓库(Data Warehouse)。从上到下代表了三种访问形式:无 A/B 测试的普通访问流程(Non AB test)、基于后端的 A/B 测试访问流程(Back-end AB test)、基于前端的 A/B 测试访问流程(Front-end AB test)。

一般情况下,用户在一次浏览中,会从客户端(Client)发起一个请求,这个请求被传到了服务器(Server),服务器的后台程序根据计算,得出要给用户返回什么内容(Data),同时向数据仓库(Data Warehouse)添加一条打点信息,记录本次访问的相关信息。这个过程也就是图上横向的流程。数据仓库收集到足够的数据之后,就可以开始进行分析(Analytics)了,这也即是图中右上角的部分。

A/B 测试需要将多个不同的版本展现给不同的用户,即需要一个“分流”的环节。从上图中我们可以看到,分流可以在客户端做,也可以在服务器端做。传统的 A/B 测试一般是在服务端分流的,即基于后端的 A/B 测试(Back-end AB test),当用户的请求到达服务器时,服务器根据一定的规则,给不同的用户返回不同的版本,同时记录数据的工作也在服务端完成。

基于后端的 A/B 测试技术实现上稍微简单一些,不过缺点是需要技术部工程资源介入,另外收集到的数据通常是比较宏观的PV(Page View)信息,虽然可以进行比较复杂的宏观行为分析,但要想知道用户在某个版本的页面上的具体行为往往就无能为力了。

基于前端的 A/B 测试则可以解决上面的问题。它的特点是,利用前端 JavaScript 方法,在客户端进行分流,同时,可以用 JavaScript 记录下用户的鼠标行为(甚至键盘行为,如果需要的话),直接发送到对应的打点服务器记录。这样的好处是不需要技术部(如果你们和我们一样,前端工程师与后端工程师分属不同部门的话)参与,并且可以比较精确地记录下用户在页面上的每一个行为,甚至包括后端方法难以记录到的无效点击!

下面,我将重点介绍一下我们在基于前端的 A/B 测试上的一些实践。

查看更多

A/B测试:基本概念

1-1

网站设计中,我们经常会面临多个设计方案的选择,比如某个按钮是用红色还是用蓝色,是放左边还是放右边。传统的解决方法通常是集体讨论表决,或者由某位专家或领导来拍板,实在决定不了时也有随机选一个上线的。虽然传统解决办法多数情况下也是有效的,但A/B 测试(A/B Testing)可能是解决这类问题的一个更好的方法。

所谓 A/B 测试,简单来说,就是为同一个目标制定两个方案(比如两个页面),让一部分用户使用 A 方案,另一部分用户使用 B 方案,记录下用户的使用情况,看哪个方案更符合设计目标。当然,在实际操作过程之中还有许多需要注意的细节。

查看更多

摘要:在进行互联网用户浏览行为的定量研究中,我们采用数据挖掘的方式对网站日志进行分析,用可视化技术展现日志的有效信息,开发了一个基于网站日志的可视化分析系统。这个分析系统通过用户产生的服务器日志数据自动还原出网站结构,按照页面流量阈值绘制站点地图,并将关键的页面流量数据及其他商业指标进行可视化处理,标注在这张特殊的网站地图上。这个分析系统能够让用户研究员更加实时直观地了解网站用户动态,获得网站重要页面及产品的直观图像甚至健康状态。

关键词:网站日志,数据挖掘,可视化,多维缩放,相关性分析

1. 引言

随着互联网的飞速发展,人们的工作和生活越来越依赖网络,尤其在金融、电子商务等领域里,传统的交易模式已经被快速便捷的网络交易模式所取代。网站用户数量及其访问率随之迅猛膨胀,如何更加快速实时了解用户访问行为模式,帮助改善企业网站的用户体验,成为越来越备受关注的课题。数据挖掘技术和网络信息的可视化为该课题提供了有效的解决途径。

2. 日志数据挖掘

2.1 概述

数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。用户在访问网站过程中,服务器会将用户的访问轨迹记录在网络日志中。对这些日志进行分析,研究者将会发现很多有价值的信息。

我们研究小组研究开发了基于网络日志的网站用户行为可视化系统G2G(the Guide to Galaxy)。在该系统中,我们采取的分析过程主要包含数据预处理,数据提取,数据可视化三个部分。本节我们将分别阐述分析过程以及实现原理。

2.2 数据预处理

数据预处理部分包括数据清理和数据补充。

对于访问量较多的大型网站,日志数据往往也会相对庞大。在提取有效信息之前,我们需要过滤掉无效信息,例如出错记录、图像文件请求记录以及公司内部员工由于工作需要产生的访问记录等干扰记录;另外,如果研究目的不是分析研究网络爬虫行为,我们也需要过滤掉这些非人为产生的记录。

对于用户访问的URL,很多研究者更倾向于从宏观角度研究,更关心这是属于哪一种类型的URL。因此,我们需要在每个URL上补充一个类别标记,以便于我们在可视化展示的过程中,研究者很容易看到各类URL的访问情况。

2.3数据提取

每条访问记录里包含如下信息:当前访问URL、来源Refer(用户访问当前页面的前一个来源页面,例:用户从A页面的某个连接进入B页面,则B页面的Refer是A页面;如用户直接在地址栏输入页面B的URL并转向B页面,或直接从收藏夹打开B页面,则B页面的Refer为空)、访问时间、IP地址、CookieID(用来标识用户)、浏览器信息等。这些正是我们需要提取的信息,经过程序处理,我们将把这些信息读取到数据结构里,图1描绘了数据提取在整个分析过程中的作用。

BI1

1 数据提取过程

在图1中,左边柱状图为网站日志,我们截取某个时间段的日志,提取出以上信息,还原为各单独用户的访问序列,形成索引节点,最终在可视化界面上以多种维度显示有价值的信息。

2.4数据可视化

我们的系统分为三个页面,图2是时间步数序列图,图3是URL分布图,图4是行业用户群关系图。

tu3

2 时间序列图

图2纵坐标为时间:0:00-24:00,横坐标为用户访问步长:1步-800步。每个像素代表用户在一分钟内有多少用户访问过,颜色越红表示访问用户越多。例如,当某个用户的访问步长是100步时,则在横坐标为100处,纵坐标为用户访问时间处标注颜色。如果用户在接连不断的访问网站,则在相应位置会出现一条纵线。

URL分布图

3 URL分布图

图3上的每个圆圈代表网站的一个URL,圆圈大小代表访问量,越大代表访问量越高。颜色代表转换率,越蓝代表转换率越高。基本上,蓝色节点可以看做是起点,橘黄色节点可看做是终点。

URL的排列采取目录结构方式,内圈代表最简单的目录,越往外圈,目录越深。例如,某个URL名称为a/b/c.html,则a作为一个URL在最内圈,a/b在次外圈,a/b/c.html在第三圈。在很多情况中,a和a/b只是纯目录结构,并非实际页面,并没有用户会访问到它们。因此以正方形表示,以此为圆心的空心圆圈大小代表其子节点的总访问量。在上例中,a的空心圆圈的大小就是a/b,a/b/c.html,a/d,a/d.html等等形如“a/*”的页面的访问量之和。

行业用户群关系图

4 行业用户群关系图

图4展示了不同行业用户群之间的互相发送反馈行为的情况,可以作为行业相关性分析的一个重要参考。图中不同的圆代表不同的行业,圆越大代表该行业的用户群越活跃,圆的颜色越偏向红色说明该行业相对被关注得越多,越偏向蓝色则说明该行业相对被关注得越少。最有价值的信息是不同圆之间的距离,距离越近说明两者之间相关度越高。圆与圆之间的连线表示两个行业之间存在足够的联系。

2.5 实现方法及原理

由于涉及到海量日志信息的处理以及大量节点图形的表现,为了在可视化显示上尽可能地做到高效,我们采用Xlib来实现图形展示。

其中,在绘制URL分布图时,由于有些情况下需要快速绘制上万甚至十几万的节点及连线,此时使用Xlib自带的绘图函数已不能满足需求,于是我们采用了内存缓冲的方式,先用高效的算法在内存缓冲区中画出图形,再缓冲区输出到屏幕上图形显示区域。

另外,由于需要表现的信息维度较多,我们从多种角度表现信息,例如视觉角度的颜色、大小、位置关系等,而用户访问路径等信息则通过交互方式来展现。

行业相关性分析的数据来源于不同行业用户之间的发送反馈的记录,我们将一段时间内(比如24小时)所有反馈记录提取出来,得到任意两个用户群之间的联系方向与次数。

提取的反馈结果虽然包含了所有用户群之间的确切联系,但其所表现的关系是一种不直观的高维关系,我们采用了多维缩放方法,在尽可能保持节点(用户群)之间相对关系的情况下将表格转化成为平面二维图形。

3. 日志分析结果

3.1 交互方式

G2G系统除了可以显示网站结构,访问量,转化率等信息之外,还被加入了丰富的交互功能,允许用户研究员选中或者搜索某个页面(节点),查看当前页面的主要用户来源和流向,并打印出URL列表。

URL分布图2

5 URL分布图

图5中显示了样本时间内访问网站内博客用户的下一步去向,在图的最下方显示最主要的几个来源和去向。

同时它也支持按照session或者cookie对用户的群体行为进行多步回溯,从中发现用户浏览网站或者产品使用上的群体行为。

另外,研究员可以在图1中选中某个区域,点击搜索,在图2中将会只显示选中区域时间段内的日志信息,因此我们可以对某些时间段做针对性分析。

在行业相关性分析的界面,研究员可以点击选中某个节点,此时将显示由这个节点发出的指向其它节点的箭头,这些箭头代表当前选中节点所代表的用户群与其它节点用户群之间的主动联系关系。箭头的长短与相关性强度成反比,箭头越长说明相关性越弱。

现在这个系统可以在普通笔记本上在10分钟内处理1000万访问量级别的日志样本。假设再加上实时的日志数据,或许这个系统也将改变网站产品设计和内容运营的方式,让网站运营成为一个“Real Time Game”。

3.2 用户访问模式发现与分析

在利用G2G查看数据的过程中,我们会发现很多用户访问模式。

有些信息很明显,例如从图2上,我们很容易看出一天24时内,何时是访问高峰期或低谷期,因此可以选择合适的时间做一些更换服务器等维护工作。

我们也可以轻松查看到外站的搜索引擎会把用户引导到哪些页面,从而判断哪种搜索引擎更有效。

用户访问步骤对比图

6 用户访问步骤对比图

图6展示了不同搜索引擎所引导的用户在我们网站上的访问路径。研究中发现,左边搜索引擎引导的用户数量偏少,后续访问行为也不强劲,而右边搜索引擎效果相对较好,不仅用户数量多,而且这些用户黏性大,能够在网站上持续访问。

对于本站页面,如果用户没有按照我们引导的路径访问,则可能说明这些页面的用户体验存在问题,我们可以及时发现并做新的尝试。

另外,我们在研究中发现一个有趣的现象,在阿里巴巴十周年时,从淘宝访问阿里巴巴的用户,大部分被引导到阿里巴巴十周年栏目。

研究者如果对数据比较敏感,或者能够从多种角度查找信息,则会发现更多有价值的模式。

3.3 行业相关性分析

不同行业的用户之间互发反馈的行为,也让我们对行业之间的相关性有了量化认识。

来自不同行业的用户群之间存在着许多联系,大部分联系与我们的常识或猜想一致,比如“纺织、皮革”行业与服装行业显示出了高度的相关性。但有时也会发现一些在我们平时的思维中不是那么显而易见的相关性。

另外,除了相关性外,无相关性也是值得关注的信息。比如冶金矿产与家居用品在图中显示出了很弱的相关性,这和我们的常识一致。但有些意外的是,服装和服饰两个行业的相关性也表现得很弱。

通过对行业相关性的分析,我们可以了解不同用户群之间的相关度如何,是否与我们预期的一致,是否有一些我们没有想到的关联,并由此进一步判断用户群的分类是否存在优化的空间,这些信息对于产品陈列相关工作有较大的价值。

3.4 前景展望

在用户研究的过程中,定量研究与定性研究应该是相辅相成的。定性研究对于访谈用户的选择经常会遇到困难,定量研究可以通过数据挖掘,寻找每个行业的活跃用户,或者访问指定路径的用户,定性研究可以有针对性的对这些用户进行访谈分析。同时,定量研究也可以分析这些用户日常在网上的行为轨迹,从而验证访谈结果。

对于指定URL,研究需要了解的不仅仅是上一步下一步的路径,用户是通过哪些路径到达此处,又会转往何处,这一系列的路径更有研究意义,所以需要提取经过指定URL的最健壮的几条路径,从而达到给用户分类的目的。

在网站中,特定用户群体的行为也会备受关注。例如诚信通会员,使用特定浏览器的会员,是否有过网上交易行为的会员,他们的访问行为如何?是否按照我们预期的路径访问?定量研究可以通过在预处理时增加关联数据的方法,挖掘出这些会员的访问路径。

另外,从网站设计者的角度来看,对于设计者预想的流程,有多少用户会买账,在哪个节点被卡住,是非常重要的信息。我们可以通过选定多个URL,列举访问这些URL的用户人次的方法实现。

对于每次比较重要的分析结果,我们可以保存到数据库中,并以图表的形式呈现变化趋势。尤其是改版前后,重要数据的变化趋势可以告诉我们用户对新版本的接受程度。

4. 结束语

在改善用户体验领域,国内外在定量方面的研究还相对较少,而网站用户的行为轨迹对网站来说是一笔很巨大的财富,如果能够充分利用这些信息,将对网站的发展意义重大,我们期待更多研究者参与网站用户行为的可视化研究领域。

参考文献

[1]     C. Shahabi,AM zarkesh,J. Adibi,V. Shah, Knowledge Discovery from Users Web—page NaVigation Proceedings of the 7th International Wbrkshop on Research Issues in Data Engineering (RIDE’97)High Performance Database Management fbr Large—Scale ApplicatiOns,pp.20,April 07. 08,1997.

[2]     J. SriVastaVa, R. Cooley, M. Deshpande,P. N. T. an. Web Usage Mining: Discovery and Applications of Usage Patterns ffom Web Data. SIGKDD Exploration,January 2000,pp: 12—23.

[3]     毛国君. 数据挖掘原理与算法. 清华大学出版社

[4]     Keim D.A. , Information virsualization and visual data mining. IEEE Transactions on Visualization and Computer Graphics, 2002, 8(1),pp: 1—8

[5]     Card S.K., Mackinlay J.D., Shneiderman B., Readings in Information Visualization: Using Vision to Think. New York: Academic Press/Morgan Kaufmann, 1999.

更真实的理解用户

人种志

引言
我们的设计有没有缺陷?
使用者是否会自动按照设计师的意图去使用?
人们真的会产生良好愉悦的感受?

查看更多

数据的可视化

http://www.smashingmagazine.com/2007/08/02/data-visualization-modern-approaches/

http://www.visualcomplexity.com/vc/

 让枯燥的数据可被迅速理解

前段时间跟这suggest项目走,没想到这么一个小小的输入框居然会带来那么多的问题。

首先来比较一下几个主流的搜索引擎的suggest效果。为了更直观地说明问题特列了几个比较点:1、取词规则;2、结果数显示;3、匹配提示;4、右键复制粘贴功能;5、中文输入法下回车键的相应(在中文输入法下按回车键直接输入英文);6、事件响应。 

一、Google:http://www.google.cn

取词规则:前向匹配

结果数显示:有,只保留前三位有效数字,剩余全部补0,不足三位精确显示。

匹配提示:无

右键复制粘贴功能:支持

中文输入法下回车键的相应:支持

事件响应:选词时:鼠标移动不改变输入框内内容,且只支持鼠标事件提交,键盘移动同时改变输入框的内容。提交时:鼠标按键(包括左右键)后将鼠标所对准的词直接提交,键盘上按回车键后将输入框内的词直接提交。

Google不愧为互联网的老大,各个产品在体验上都做得非常的精致。对于像右键(剪切/粘帖)之类的操作提供了完美的支持。

g.jpg
二、Yahoo:  http://www.yahoo.com

y11.jpg

取词规则:全词匹配

结果数显示:无。

匹配提示:有,所匹配的词深色显示.

右键复制粘贴功能:不支持

中文输入法下回车键的相应:英文站点无法测,中国雅虎http:cn.yahoo.com不支持)

事件响应:同Google

 雅虎的提示感觉速度很慢,或许是因为全词匹配所以加上了匹配词提示的功能,这样不会让人觉得很突兀。提示框最多只显示5条记录,在下面加了个“上下”翻页的button,个人感觉不是很方便。因为搜索的目的性是很强的,在前5条的现实中没有的话我想大多数人都会选择继续自己的输入而不是去翻页查找suggest中剩余的内容,谁知道有没有呢!在搜索提示框右上方提供了关闭自动提示的功能,下方也有折叠/展开的功能,个人觉得suggest只是一个辅助功能,没有太大的必要对它本身提供太多让用户操作的功能。不支持右键功能也略显遗憾。

三、网易有道:http://www.yodao.com/

取词规则:前向匹配

结果数显示:有,只保留前三位有效数字,剩余全部补0,不足三位精确显示。

匹配提示:无。

右键复制粘贴功能:不支持

中文输入法下回车键的相应:不支持

事件响应:选词时:鼠标、键盘移动的同时都改变输入框的内容。提交时:鼠标按键(只有左键)、键盘上按回车键后将输入框内的词直接提交。

w.jpg

网易的这个有道出来不久,不过个人感觉体验一般。和雅虎一样有关闭提示功能的选项。不过雅虎在关闭提示功能后还有一个按钮可以开启,这个有道在关闭提示功能后的提示就太不明显了,而且没有状态的改变。就是输入框右侧的那个按钮,点击后又“打开提示功能”的按钮。但是我觉得要真是关闭了想重新开启还真难,因为提示的按钮实在不明显,而且个人觉得文案也有问题。“关闭提示功能”我个人理解只是这一次关闭,即点击后提示框消失,没想到它是一直消失了,在测试的时候还纳闷是不是网易突然不提供这suggest功能了呢。另外对于事件的响应上感觉也很有问题,在中文输入法下每输一个拼音就会向服务器端发送请求,对服务器压力很大(这点用户感觉不到)。

 四、说完了别人再来看看我们自己。http://china.alibaba.com

aa.jpg

取词规则:前向匹配

结果数显示:有,只保留前三位有效数字,剩余全部补0,不足三位精确显示。前面还多了个“约”字。

匹配提示:无

右键复制粘贴功能:不支持

中文输入法下回车键的相应:不支持

事件响应:同Google

因为我们采取的也是前向匹配词的方法,所以匹配提示这块个人觉得也没太大必要,反正就是前面的词么。文案上在结果数前加“约”字是因为我们的后台词典并不是同步的,在匹配数比较少的情况下,显示的数目和实际的结果数可能会有很明显的出入(比如实际只有3条,但因词典没有同步更新,匹配数显示还是为4条),所以加上约字就比较合理。只取前三位数字我想也是这方面的考虑。Google和“有道”的词典不知是怎么设置的,尝试了下好像特别少的情况没有出现过,所以没法判断。在显示上根据rank值而不是数量排序,只显示前10条结果,并且如果结果超过12个字则不显示(12个字够精确了不需要在suggest了,个人理解)。在事件上改成同Google一致即可以事件鼠标选择后直接提交,省去了多按此回车键的麻烦,又可以解决上次谭校长用户测试过程中出现的鼠标放在输入框下而导致直接选中词提交的问题。因为技术上还有些细节没有解决,所以暂时还不支持右键功能和中文输入法下回车键输拼音的相应功能(不好意思)。在与后台的交互上,对比网易,通过“缓存”已输入词和对input内容值的判断减少了很多服务器间的请求,速度上比以前有了很大的提高,基本可以实现同步。

体验上的事情不是很懂,随便写了下希望大家拍砖!呵呵。过几天再付上“技术实现篇”和大家一起交流。

1-我们的产品存在非常严重的可用性问题。这个问题要解决不是UED一个部门解决的。需要引起高层的相关重视。比如搜索的文案,用户不理解。搜索和注册地区下拉菜单,有的是按拼音顺序,有的按热门顺序,引起用户迷惑。注册反馈用户没有或者无法识别。

2-在测试技术上,我们前期的准备还是有漏洞。如长时间的录象对设备要求的困难考虑不足,造成数据无法存储。再如录音设备问题,还有设计任务如何满足用户独特的背景和通用情形问题等。

3-可用性测试的机制化问题。能否作为一个基本环节,由各个交互设计师把关?

最近通过各种途径(如看书、看paper、请教高手等)学习数据挖掘,现将现在的一些基本概念和大家分享。需要说明的是我写的这些仅仅是数据挖掘的基本概念,能够完成让大家了解什么是数据挖掘。进一步的内容还在继续学习中……

1-Web数据挖掘是指从与WWW相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息。 Web信息的多样性决定了Web挖掘任务的多样性,Web数据挖掘总的来说分为内容挖掘、结构挖掘和日志挖掘三类。我们主要是进行日志挖掘。

2-一般Web日志挖掘的过程分为以下三步:
(1)数据准备:对Web日志内容进行预处理,删除无用数据,识别用户会话,完善访问路径。
(2)模式识别:采用相应的数据挖掘算法,对预处理之后的数据进行挖掘,生成模式。
(3)模式分析:排除模式识别中没有价值的规则或模式,将有价值的模式提取出来。

我们的主要工作集中在2-3步,第一步涉及很多算法问题,由数据仓库负责。

3-我们关注的用户模式主要是用户的访问模式。

现在在这个部分的挖掘开发了很多技术。比如统计方法中的频次统计等。另外聚类、分类和关联识别也是常用的方法。具体的工具还有Longest Repeated Subsequence、KMean Clustering、Longest Common Subsequence等。

4-数据挖掘是基于海量数据的,它可以避免现有可用性测试样本量小的局限。但是,数据挖掘也有局限。它不能像可用性测试那样获得用户的所有行为。因此,这两种技术的配合应该是非常理想的选择。

密码保护:日志分析

这是一篇受密码保护的文章,您需要提供访问密码:

用户研究总是有用的吗?

 (同发阿里联盟blog)

是否所有的产品都需要用户研究?用户研究在什么时候对产品有帮助?这几个问题是我一直在思考的。用户研究究竟应该在什么时候进行,有什么作用。就我的经验而言,用户研究并不适用于所有的产品。我简单总结了一下:

用户研究非常适合于:

–产生新产品的idea;

–了解用户和你(设计者)的差异,包括环境、行为、技能水平和动机等;

–深入的基础性研究;

–用户的生活形态。

用户研究比较适合于:

–用户可以操作和描述的多步骤任务;

–完全不了解用户的情况;

相反地,用户研究不很适合于以下情形:

–单步用户行为;

–一个缺乏交互行为的页面设计;

–一个通常性行为,用户和设计者不会有差异的行为;

–证明某个idea或需求。

记得有一次,有PD给我们提出要求,你能否证明一下这个地方用红色好还是蓝色好。我无语。我觉得这样的命题本身就是伪命题,设计本身不是可以证明的,但可以评估。于是他就说了,帮我评估一下。我又评估了一下,觉得在识别性上可能有问题。对了,就是这句话:用户研究可以发现问题,但解决问题,那还是需要设计的。至少目前如此。

今天晚上听了卫总关于市场营销的培训,趁记忆尤新记录下来与大家分享。

1、市场营销(Marketing)工作的核心内容是customer communication,customer communication包括“听”“想”“说”3个部分,之间的关系是先“听”customer的想法,然后通过“想”把我们的卖点与的customer的买点统一,最后才是“说”,在用户需要的时候把他需要的信息告诉他,这样的说才是有效的。这3个部分是通过不断循环的来得到优化

2、倾听用户的心声不是简单的听用户倾泻,那样的往往没有价值,聪明的倾听要学会提问,提问的方法卫总给出了提问6部曲。如下:
1.GIF

日常生活中每个人都会经历这样的步骤:从WC出来-洗手-从纸巾盒中抽取纸巾擦手。但大家在抽取纸巾的一刹那是否会留意纸巾盒上的提醒文案呢?
各位是否注意到,前段时间,创业WC门口的擦手纸巾盒上的提醒文案变了,由原来的“心系环保,我只用一张”改成了“心系环保,请酌情取用”。提醒意图大家应该都很清楚,说白点就是“节约用纸”。但是怎么说才给用户的感觉更好呢?才能起到真正意义上效果呢?
作为一个用户,我有切身的体验:先看“心系环保,我只用一张”。以前洗完手,抽取纸巾的时候每次看到这句文案,抽了一张就不好意思再抽了,尽管手根本就没擦干,只能回到位子上用自己的纸巾再擦一次。这句文案的潜在意思似乎是说:你只能用一张纸,用多了就没有“心系环保”了,如果一旦偶尔多用了一张,就往往有一种内疚感:)
再看“心系环保,请酌情取用”,感觉没有以前那句那么直接了,但是“酌情”是如何酌情?该用一张还是一张,两张还是两张……感觉不痛不痒的提醒,应该也没什么效果吧!我不是个好孩子,每次看到这句文案,都会抽了一张再抽一张,因为我觉得一张纸不能把手擦干:)当然也没有了以前那种内疚感,也我也是“酌情”啊,嘻嘻:)
很有意思的是,有一次去华星时代培训,那边WC门口的纸巾盒上的提醒文案是“用我前先甩手5次哦!”,还配上了可爱的卡通图案。用轻松诙谐的手法把方法告诉了用户,当然效果也达到了。我很乖地照做了,洗完手-甩手5次-再抽取纸巾,果然用了一张纸巾就把手擦干了。
文案的用户体验生活中无处不在,简单的一句文案就会起到不同的感受和不同的效果。我们在做产品文案的时候,也应该站在用户的角度,多考虑用户的感受,以及怎样的文案才能真正起到我们想要的效果。看似小小的文案,也许会给我们带来意外的收获!

营销调研中的度量

最近在阅读营销调研一书, 颇有收获.

首先聊一下营销调研的流程;
1) 确定营销调研的必要性
2) 定义问题
3) 确立营销调研的目标
4) 确立营销调研的设计方案
5) 确立消息的类型和来源
6) 确立收集资料的方法
7) 问卷设计
8) 确立抽样方案和样本容量
9) 收集资料
10) 资料分析
11) 撰写最终调研报告并演示

上面是一个有序的流程. 实际工作中需要看具体的目的,内容,进展,以及手上的资料,资源等情况再展开调研工作.并不是完全按着这个流程去执行. 开展市场调研的一个关键方面是确定调查的必要性,这个步骤应当在任何计划开始前进行.如果这个步骤被很好的实施,它将为营销者节约大量的时,间和精力.调研的目标将帮助我们获得解决问题所需要的信息.这个步骤也很关键,每一条的目标都必须精确,详细,确定并可操作。

入正题,其实度量应用的领域很广泛. 那么,什么是度量? 度量在调研中是调研者对调研对象某些特性的数量或强度的测量.我们度量的是调研对象的特性,有时也称做属性或性质.举个例子, 我很想了解阿里巴巴商人的上网习惯, 那么商人的年龄,收入,性别,对互联网的态度等等都是这些特性都是度量的对象.度量通过什么形式展现出来? 这就需要引出量表, 什么是量表呢? 很简单, 我们之前做用户访谈最后会让用户对我们的产品进行打分,那张打分表其实就是量表. 用专业的话来说,量表就是设计被访问者的主观特性的度量标准.量表具有四个特性,分别是描述性,比较性,程序,起点.我就不展开说明了,有兴趣的朋友可以去查阅相关书籍.

最后想说比较重要的一点是,如何来判别度量的可靠性, 其实我们的谭校长在几个场合都有给我们讲过, 最实用的方法就是测试再测试,一个问题重复的问,以此来确定问卷的真实与可靠性.其他也有许多方法,比如等效形式可靠性分析,表面有效性,预示有效性等等.

营销调研是一门很深的学问,我只是学了一点皮毛, 去年我们公司里有组织过专家的培训,听了之后收益非浅,培训PPT还在我,有兴趣的同学可以问我索取.

 

密码保护:关于注册引导文案的一点研究

这是一篇受密码保护的文章,您需要提供访问密码:

密码保护:记录5.14~5.30

这是一篇受密码保护的文章,您需要提供访问密码:

密码保护:阿里巴巴中文站detail页面相关设计和用户研究的体会

这是一篇受密码保护的文章,您需要提供访问密码:

安全研究人员做了一次研究试验,在Google上登了这个广告Is your PC virus-free? Get it infected here!,广告在6个月内展示了259,723次,有409个人点击了该广告,点击率为0.16%,其中98%用的是Windows,浏览器主要是IE6。广告发布者共花费了$23,平均每次点击 $0.06,也就是说传播恶意程序的费用是如此低廉。

[培训分享] 数据挖掘

不记得是谁说的了,大概意思是,培训是7-2-1的过程。当一次培训结束后,有70%的人都记住了一个大概的意思,70%中有20%的人会在培训后作总结和分享,这20%中只有10%的人会最终吸收并用在今后的工作当中。数据可能有出入,不太记得了。其实意思是说,培训听得多没坏处,但关键是要吸收和运用起来,不然听再多也无用。  

上个月参加了一个数据挖掘的培训,收获挺大的。但由于工作忙,没有及时作总结。现在已经快忘记大半了。乘着现在有些空,回忆着总结一下。

数据挖掘是对结果的一种预料,数据分析是对结果的一种总结。
数据挖掘是从大量的数据中抽取出潜在的、不为人知的有用信息、模式和趋势。

举个例子,我比较喜欢听事例。
淘宝有100万会员。现在有一个需求,要对所有女性,而且是喜欢买衣服的用户做产品推广。推广方式是发DM信。
100M会员我不能所有人都发一封,这样成本过大,对不需要该类产品的用户来说,无用的信息就是垃圾邮件。所以这时候需要用到数据挖掘,在100万会员挖掘出需要买衣服的女性会员。这里有两个变量。从100万会员中挑选出1万的会员样本。建立出样本模型,然后把这个模型放到一个叫sas的软件中跑,得出符合该变量条件的数据排序。最后选择10万个用户进行推广。 大致就是这个意思,这个例子比较简单,只有两个变量,变量更多结果也会更加准确。

在现代社会中,公司大多数商务流程的核心部分是数据。而数据挖掘的任务就是在如此海量的数据中发现有用的数据。但是仅仅发现数据那是不够的。我们必须对这种模型做出一定的反应,并采取行动,最后将有用的数据转换成信息,信息变成行动,行动转换成价值。这个就是数据挖掘在商业应用上的一个完整的流程。

下面给出一个完整数据挖掘过程的四个步骤:

鉴别商业问题

使用数据挖掘技术将数据转换成可以采取行动的信息。

根据信息采取行动。

衡量结果。