美食、阅读和购物等应用如何做好个性化发现与推荐 / 2012-06-19


NTalks第25期以”手机上的个性化发现与推荐服务“为主题的沙龙活动上周六6月16日圆满举行,当天活动的分享嘉宾是豆果网的创始人王宇翔,酷云阅读的创始人李鹏,微精的创始人赵瑞,由推的创始人王晓虎和郭翔,趣逛的创始人张江红以及百分点科技无线业务的负责人李晓东,主持人是中信出版社新媒体事业部的黄锫坚。各位嘉宾先从各自所在的业务领域出发,介绍了技术和产品层面在个性化发现和推荐方面的思考和尝试,并在之后的Panel讨论环节,围绕推荐中的共性与个性、人工编辑与机器抓取、盈利模式等话题展开了讨论,交流碰撞中引申出很多颇有启发和意义的观点。特别感谢此次活动的合作伙伴搜狐应用推广中心的大力支持。

下面简要地总结其中一些主要的观点:

1、豆果网基于美食领域的个性化推荐探索:

美食是一种生活方式。美食领域的个性化也就是差异化,个体差异对于产品也产生差异化需求,

我们对于差异化理解有两点。第一点我们用户碎片化的时间,当遇到海量数据的时候,就必然要诞生差异化的个性化的服务。第二点是我们把菜谱数据,做了一个标准化的分解,分解到最小的食材源。

豆果通过一系列的应用,像豆果美食、夏日冰品等,已经打造出来两个重大的中文数据库,第一个中文数据库超过十万道中文菜谱, 我们真正第一家真正60%以上完全来自于用户自己创建的内容,而且身边很多朋友自己会做饭,分享做饭的方法或者数据。这是我们第一个最大的中文数据库。第二个,有一个最大的中文食材数据库,现在涵盖2.6万个中文食材,一头猪、牛身上不同部位有牛剪子肉,或者里脊,教你详细如何选购,如何储存,如何制作,包括营养成分,适用人群数据都有。 我们基于两个数据库开始为用户提供精准化服务,如何面对用户碎片化时间我们来做这样的服务。

我们做个性化精准到不同的食材和工艺做随机组合,包括用料,包括用量,针对用户做个性化推荐 。任何成功的基于细分化数据挖掘之后产生个性化服务,我认为都要注意以下三点:一是培养起用户依赖的“强迫症”,二是符合用户使用习惯让他们能长久使用,三是根据用户碎片时间的使用习惯从海量数据中选择精品内容推送给用户。

2. 酷云阅读基于阅读领域的个性化推荐探索:

分享了对智能信息流的理解和对这个方向的两次探索。只能信息流的五大块分别是:图书和杂志、TV和视频内容,还有新闻和资讯内容,还有图片,此外是微博和一些段子。这五个方面要把它做成一种智能信息流,首先我们先提一个目标,到底什么是智能?首先满足每个人个性化喜好,第二个要满足特定时间,第三个满足特定场景。

要想做到智能信息流有一个基础,就是把原始的信息流全部转化为文本。利用 文本做了自然语义分析,在云端有一个海量的并且是语义的信息流,一次实现基于兴趣图谱推荐方式。

做推荐也好,做发现也好,就像豆果CEO讲了,必须要经过大量时间数据的积累,我们从来不相信一家公司刚刚成立一个月,突然说要做一个特牛的推荐引擎, 没有数据肯定做不到的。

在做推荐方面,目前市场上大家都基本采用两个方向。第一挖掘用户兴趣和关健词,准备好相关的关健词背后云端内容做推荐,这是一种兴趣纬度推荐。还有一种纬度就是现在有了社交,有了社会化市场之后,第二个推荐就是社交关系所带来的推荐的信息,也包括重磅数据推荐,我们把这个做成同时,两个因素都考虑,不断研究都考虑之下到底哪个纬度更重?我们还在探索当中。

3. 由推介绍基于兴趣图谱的发现与推荐机制:

由推的愿景就是做一个个性化的推荐平台,这个平台里面我们会主动推送基于用户兴趣的信息、产品,还有一个非常关键的目的,就是推荐人。首先把我们上线的产品在目前这个阶段划分了十个兴趣大类,同时不同的方式,通过爬虫、通过用户来进行分享,作为获取信息主要渠道。经过语义分析,语义分析里面实际上包含着不同的技术,其中有分词,有词语信息特征提取。通过一些技术,我们去分析某一个内容,针对某一个人,他有可能对这个信息或者是内容的感兴趣的程度。这个程度可能会用分值来体现,这个对我们挑战是这样的。

作为一个新兴的公司,我们现在用户比较少,刚上线一个月。但是内容也比较多,我们也面临一个最大的问题,就是数据的稀缺。这个问题我想对于每一个初创公司都会存在,所以我们想通过一些技术手段来尽量弥补数据的缺失,提升效果。我们对用户进行推送和推荐之后,也希望用户可以针对我们每一次的推送结果做一个更详尽的反馈。因此我们在下一版推出一个打分机制,通过这个反馈,可以修正或者是改善我们这套体系。这个结果出来以后,目的就是为了得到更好的一个推荐结果,在获得结果的同时,慢慢对用户进行了解,这也是一个归纳总结的过程。

基于对用户的了解,实际上我们真正目的是在做一个兴趣图谱。基本上忽略了人和人之间存在的社交关系,或者社会关系、我们着重于他的喜好厌恶、喜好程度、厌恶程度,以这个为纽带建立人和人之间的联系。这两个人可能认识,可能不认识,对于我们来讲这些都不重要,我们想挖掘的是你和他的兴趣有多相似。你们对于某一个物品,或者是内容喜欢的程度有多相似。 针对个性化推荐我们应该更多探究他们之间最细微的差别,从而建立兴趣图谱。得出来的结果更具有说服力,或者更具有参考价值。

4. 微精基于微博内容开发的个性化产品

我们对手机个性化阅读的理解是手机是一种不同于纸媒,网媒,甚至和Pad上的阅读也不同的随时随地碎片化的阅读形态,是一种阅读的快餐文化,相比较之下,Pad上的阅读更接近传统的阅读,需要的体验也要更好。

除了基于微博内容做语义分析之外,我们还非常关注用户朋友之间的推荐。个性化推荐这个领域,我认为来自朋友可信的人的推荐,价值是很大的,尤其在中国这个社会,商业诚信普遍缺失,水军泛滥,到处都是托儿,我是不太看大众点评上的评论,我认为那个东西可信度非常低。所以我比较相信豆果创始人说的很有道理。如果你在微博上找到一万条评论关于某一个话题,这一万条评论和我没什么关系,但是有三条是我身边人发布评论,这个是很有价值的。

我们的产品叫个性化推荐引擎,我们把你圈子做了一个筛选只取对你影响最大的人,他的言论,他发布的内容,他的兴趣,给你做一个协同过滤。通过朋友之间交叉影响,这个实际上也是我们考虑的,大家都想到一块去了。希望对大家有借鉴。

5. 趣逛基于室内定位技术的精准购物推荐:

趣逛的Slogan是“定制你的专属逛街体验”。属于购物领域的个性化内容推荐,把逛街购物过程变得更有个性化,更精准,年轻购物群体能够及时找到自己喜欢的东西,而不是一些强制推送给我的一些内容。

我们的核心技术是室内定位技术,基于这个技术,解决了用户临时性冲动性购买的有效性和店外营销的精确性和效率。位置营销很重要。位置营销是影响用户做采购决定的一个很重要的因素。如果把这个位置营销做好了,实际上精准营销,时效营销,所谓个性化营销的问题也随之解决了。目前基于LBS的服务大多无法建立商家和用户之间的信任度,商家是不是信任这个用户?是不是到了这个位置,到了这个地方。他愿意为这个用户来投放预算,来为用户花钱。我们正是基于这些问题,建立互联网、移动互联网、云服务,基于这几个概念我们建立了自己的架构。

用我们技术能够实现用户自动的签到。不用用户自己去手动做什么,会自动感知用户到了这个位置,可以推送很个性化新产品,或者新的惊喜,或者优惠,或者积分,可以给他推送很多的价值。随着数据的增多,我们现在产品刚刚发布,用户总是喜欢去什么样的地方,是购物中心,还是百货,喜欢去化妆品柜台,还是服装柜台,希望快时尚,还是高档柜台,这些行为都会自动积累下来。我们会根据这些数据为用户推送他喜欢的。比如他在屈臣氏的时候,当然可以给他推送别的化妆品惊喜都可以。

6、百分点科技提供基于海量数据的个性化推荐引擎

百分点科技目前主要为电商行业的公司提供个性化推荐的技术支持服务。手机是未来公司关注的一个重要方向。为什么手机更需要个性化。因为手机相比于PC它有更小的屏幕,而且有更慢的网速,还有更少的资源,因为你的硬件资源没法跟PC相比。但是另一方面我们会面对更多更丰富的信息,这一对矛盾决定了手机更需要个性化推荐。而且就用户体验来讲,大家刚才也讲了手机应用场景很多都是碎片化时间,在碎片化时间人的耐心是很有限的。

个性化推荐无外乎从以下几个方向来进行:第一个方向是内容 。第二个是行为定向, 第三个方向,地域定向,LBS,基于地理位置信息可以对一个群体提供个性化推荐服务。第四个特征就是人群特征定向,所谓人群特征定向,也就是刚才几位嘉宾讲到从SNS里面抓取一些特征来进行定向。衡量一个手机个性化推荐系统最重要的因素有几个,第一个是精准, 第二个时时,如果做不到时时的话,尤其基于LBS这种服务,可能人走了,离开这个地方再推荐给他是没有意义的。

手机个性化面临的挑战是什么?最大的问题,是缺乏统一的入口和数据的碎片化。现在各个入口发展量不足够大,不足以保持全面的数据。 你是没有办法简单的把一个用户在互联网上的数据传递到移动互联网上,这也是一个手机个性化推荐最大的问题。另一个问题是差异化。现在国内几乎所有的O2O电商都面临一个最大的问题,单位面积用户密度不够,那么它的可用性就差。为什么举步维艰的运营呢?是因为他们无法针对这一部分用户群体提供差异化的服务。因为用户是立体的,尽管他在同样处于一个地理位置,但是他们可能是有不同的需求。而且这个里面在我们用一些基本的冷启动的方法,你也是很难捕捉到这些用户,给他推荐满意的结果。因为基于场景的推荐,他是没有办法向这一部分群体提供满意结果。可能这一分钟去超市买水,但是下一分钟去电影院,这两个场景跨度是非常大的。

Panel讨论阶段的一些精彩观点:

  • 关于推荐中的共性和个性:在做新闻和资讯推荐上面,个性和共性永远同时存在的。我讲两个点吧。第一个点,永远有一些用户不知道自己喜欢什么,所以这个用户看的大家正在看的,他也想看。就是这么一个逻辑。大家都在看,最后结论就是一个共性内容的推荐。
  • 第二个想补充一点,我们做个性的时候,应该有两个阶段最难,第一个阶段冷启动最难。第二个难点则是当你知道这个人喜欢什么的时候难点也来了,因为产生了推荐上面有讲究回音炉现象,这个人喜欢欧洲杯,那你也不能一天到晚推荐欧洲杯。在之外推荐内容当中,可能有一些共性的数据,要做一个参考。答案就是在我来看,共性和个性密不可分的。
  • 没必要过分强调精准。尤其在手机端,第一因为没有很足够数据给你来提取。第二个没有必要精准到个人,只要精准目前业界普通认为精准到群体,他有共同的兴趣,共同的喜好等等这些。把握到这个度就可以了。
  • 关于人工编辑和机器推荐的权重,首先还是那句话,不是一个绝对的选择,你选择机器还是选择人。最后其实两者并存,我觉得人的作用在于提供人工智慧,包括我们算法不断调阅过程中。我相信公司算法打印出来,不是很多行,核心的就是那么几个关键点。这个关键点背后,其实靠的是人工和大量的数据来算出来。这个需要时间,这个不可能是一蹴而就的。所以人的第一个作用在于人工智慧的提供。
  • 其实真正意义上大家都不知道自己喜欢什么,有时候购物也是一样,不知道买什么,就是冲动。这个过程中需要认为的加一些人工编辑在里面,不管是现在做电商导流,还还是我们做阅读,我们产品体会上,希望到了一些特定大事件的时候,能够有人工去推荐,而这个人工推荐是强加给客户的,这个也是我们现在做的一种方式,不是百分之百完全个性化的。也要有人工的编辑在里面。
  • 创意创新是有价值的。所以更多的编辑的职能如果在创意、创新上面,他永远不会被取代的。比如简单的近期做信息聚类的产品很多,但是你可以看到他们下载量基本上到一万次左右瓶颈。实际上简单直接通过机器来做信息聚类是会遇到一个瓶颈,如果想突破这个瓶颈还得靠人,靠内容运营。
  • 第二个问题,刚才都举多美丽说,蘑菇街等等这些。其实这些个性化阅读,或者这些做导购网站客户端,实际上他在做一件事情,实际上是在利用它的应用平台,试图建立用户和内容属性,或者事物属性之间某种关联特征。从两个方面,当然两家侧重点也有不同,它们其实都在尝试着对内容的理解和对用户的识别,在此基础上建立起某种关联来实现个性化推荐。当然美丽说朝着媒体方向在走,蘑菇街朝着SNS方向在走。