编者按:本文是电子科技大学互联网科学中心在读博士刘浩的供稿文章,刘浩的主要研究方向是个性化推荐系统及社交网络的数据挖掘,点
这里关注他的微博。
阅读,作为互联网最基本功能之一,始终是网民获取信息的最重要形式。随着个性化推荐技术在电子商务领域取得巨大成功,个性化开始逐步渗透到互联网的阅读领域。互联网发展到大数据时代,也给个性化阅读提供了合适的温床,国内外互联网围绕着个性化阅读的产品层出不穷。2010年以FLIPBOARD和ZITE为代表的个性化阅读产品的兴起,引起了国内个性化领域的争相跟风。一时间,众人高呼着“个性化时代来了”的口号,各种打着个性化阅读旗号的产品纷纷诞生。
个性化阅读的出现,是外部环境,技术成熟和用户需求三方面共同作用下出现的必然产物。但是,国内个性化阅读产品在使出浑身解数四处突围的同时,我们却鲜见有当年RSS那样具有划时代意义的产品的诞生。个性化作为大数据沙漠里的一个天然绿洲,所有人都在描绘着那里美好的图景,一直看着很美好却不知通往绿洲的捷径。
UGC模式的爆发标着的互联网大数据时代的到来,以用户社交网络为基础和用户信息流为载体的社交媒体已经在自觉不自觉中生长出了个性化的萌芽,然而以此为基础的信息流有着严重的弊端,内容过于杂乱,信息价值不高,信息量过大的问题随着社交网络的日益膨胀显得越来越明显。这些大规模的数据对于个性化阅读来说,却是绝好的冷启动数据训练集。微精和
优微正是怀着这一美好的目的开始了在这方面的尝试,但是在不久前微精的倒下,却给了这一美好愿望一记重拳,排开其他因素不说,单是推荐挖掘需要的大量用户数据和OPEN API各种请求限制之间的矛盾,都让所有在此方向上努力的人们提心吊胆。Twitter不久前修改的API协议和新浪微博推出极具争议的智能排序无疑给出了一个明确的信号——这是一块金矿,但是只能我们来挖。
在大树不可靠的情况下,大部分个性化的阅读产品必须面临一个冷启动的问题。个性化推荐的技术发展到今天,无论是传统而且成熟的协同过滤,还是现在兴起的社会化推荐,抑或采用多种数据挖掘的手段,用户的兴趣的分析都需要基于一定量的数据。获取用户的输入本身就是一个用户体验极不好的过程,这是一个考验用户耐心和推荐精度的博弈。
优推网显然高估了用户的耐心,选完分类还不算还要老老实实回答5个对用户来说莫名其妙问题,即使有耐心完成这些步骤的用户,基于如此少量数据推荐的信息也足以让用户丧失信心。
板报网尽量减少了用户的烦恼,但是一开始满屏幕大杂烩式的推荐很难让用户读懂个性化阅读的含义。
牛赞网,
阅米网的初始化显得稍微人性化一点,分类较为细致让用户容易选择,同时保证在初始推荐的时候内容至少较有关联性。
指阅的初始化显得更加精致,在大分类下还细分了具体的兴趣点,用户输入稍微繁琐但是用户体验设计得很流畅,如此细致的设计也保证了初始推荐时候内容的精确性。
无觅作为最早踏足国内个性化推荐领域的产品,估计在最初做第三方推荐工具时积累了不少珍贵的数据,其初始化以用户订阅RSS开始,显示了无觅稳妥的作风,先做好内容的聚合,然后慢慢挖掘出你的兴趣。
V剪客或是受启发于Pinterest专辑的点子,用户开始的时候需要订阅感兴趣的专辑,但是每个分类下数量众多的专辑让用户又陷入选择的困境。还有一些如
ZAKER,
网易阅读,
极阅,
鲜果,
爬藤等个性化阅读产品大多是以订阅网站的RSS为手段,显得更像是一个美化版的RSS阅读器。
个性化阅读冷启动的完成,只是个性化阅读体验的刚刚开始。用户获取阅读内容的来源又成为一个分水岭。ZAKER,指阅,网易阅读,极阅,鲜果,爬藤,板报网,阅米选择了聚合内容,这些产品更像是一个带过滤器的RSS阅读器升级版,通过聚合各种RSS来源的新闻并经过算法排序(或没有)后推荐给用户。V剪客,简网则选择了一种UGC的方式来获取内容,通过用户提交的形式来充实内容池。牛赞网,无觅则选择了中间道路,采用内容聚合和UGC混搭的模式来获取信息。从用户体验上讲,内容的聚合显然更有利,能够很好地格式化文章内容实现优美的文章排版和阅读体验,因此走上这条路的产品大部分都不约而同的选择了抓住移动端的阅读。但从个性化阅读的本质上讲,内容的聚合还是让用户的视线受限于目前能够收录到的新闻源,然而这些有限来源相对于每天要产生200多万篇博文的互联网来说,并没有从根本上解决帮助用户发现未知的个性化资讯的问题。同时,内容聚合的方式面临的最大危险来自于版权问题,我们可以从ZITE之前的官司和ZAKER最近下线了一些订阅频道嗅到一些味道。相比之下,简网,V剪客,牛赞网,无觅选择的用户提交内容的模式会更加被看好,虽然这几个网站背后的推荐机制各有不同,但是都是试图构建基于用户阅读兴趣的社交图谱,利用阅读兴趣的社交网络获取信息长尾中的内容进行社会化推荐的想法——人的推荐永远比机器靠谱。值得一提的是,简网和指阅都是同一个妈生的,但是选择了不同的内容运营机制,或许是基于的这样思考的一种实验?
个性化阅读毫无疑问是未来互联网关注的一个热点,谁都可以看到当一个产品完全熟悉一个人个性化阅读偏好后潜在的巨大商业价值。但是在大数据的沙漠中,通往个性化绿洲的道路往往都充满着各种海市蜃楼,让我们拭目以待看谁能够坚持到最终的目的地。
感谢在个性化阅读道路上奋斗的人们,就像Alta Vista、Lycos、Excite之于Google,不是每个人都能赢得最终胜利的花环,但是个性化阅读道路上每一步都有你们坚实的脚印。