糟了!算法说它懂你

Lynn 6年前 (2018-08-20)

俗语有云:内容平台,能力越大,责任越大。

2018年夏天的《中国好声音》,清华大学的学霸以改编版的《止战之殇》赢得了周杰伦的转身。在问答环节,这位选手特意向大家介绍了歌曲的“合作者”——AI算法

他说,主体歌词的创作是由AI算法完成的,而他做的事,是“赋予歌词人类的温度”。

算法懂世界,但是不懂人心

这是深度学习算法首次以如此华丽的姿态出现在综艺节目上,像是AI在向世界宣告自己的“霸主”地位。事实上,它对我们生活的渗透早在多年前已经开始。

算法勾魂

2000年,国内互联网时代正式开启。智能算法随着互联网对生活的渗透,也开始进入到各个公司的产品设计中。这种算法从早期的打标签方式开始,强调对用户的“内在个性”的关注,使用户在产品体验过程中释放诉求,进入到特别推荐、社区等被算法充分了解的领域,进一步提升了用户的黏性。

对早期用户而言,这样的算法,是充满新鲜感又刺激的。

文娱领域通过算法实现个性化推荐功能的开山鼻祖,当属于2005年成立的豆瓣。早期,它基于用户社交属性,即人群喜好的重合度因素,利用算法进行分类与关联推荐,实现对书籍、音乐和电影内容的个性化推荐。当时的豆瓣还是社区模式,针对的也是有固定特性的垂直用户,这样的算法非常巧妙地在形成了口碑效应,在短期内用户量急速增长,成为了当时的“流量”大平台。这种由算法带来的超强用户黏性使得在未来十年中,即便豆瓣几经飘摇,也依然有其影响力的重要原因。

算法懂世界,但是不懂人心

令人惋惜的是,虽然如今的豆瓣电影被看成中国的IMDB,但是就整个平台而言,由于十年间计算机覆盖率呈指数级增长,用户覆盖到社会各个角落,广告、不良内容的逐渐渗入,豆瓣曾经引以为傲的算法带动优质内容的初衷也不再存在。同时2010年以后,知乎、网易云音乐等内容平台的出现,借助更加优质的AI智能算法迅速吸粉,瓜分了豆瓣原有的用户阵地。

然而无论是曾经的豆瓣社区,还是现在号称智能算法的各大内容平台,推荐同质化严重的同时,也让人质疑,这些算法开始不懂用户了。

智能算法到底是什么

当下AI推荐机制下催生的内容平台大致可分为四类,分别是以今日头条为代表的新闻内容平台,以知乎为代表的知识问答平台,以抖音、快手为代表的短视频平台和以网易云音乐为代表的流媒体音乐平台。

尽管应用领域有所不同,各款产品的特性和生态布局也有差异,但是在个性化推荐机制的设计上,万变不离其宗,它们的心思如出一辙。

总体来看,AI推荐机制的框架设计基于三个维度。

第一个维度是内容,即基于音视频或文本本身的内容提取标签并以此分类。如在音乐领域,可依据音频中的频率、歌曲名、歌手、音乐风格特征等信息来将内容归类为布鲁斯、蓝调或者摇滚等;

第二个维度是用户,即对用户行为数据进行提取和分析。如在各大平台上,都会见到喜欢、收藏等选项,这里面,用户的操作会折合成一定的权重,并影响最终的算法结果;

第三个维度是场景,这其中包括了时间场景和环境场景。在不同的环境和时间段,同一用户的选择趋向也是不同的。

事实上,算法框架衍进至今,是一步一步完善至此的。内容和用户维度先后出现,最后才是场景,它们三者之间互为牵制和补充,从而避免推荐结果出现偏颇。

单纯基于内容的算法有着明显的问题,因其分析的是大量的数据,算法自然无法推荐新的和非主流的内容,易使推荐趋同。因而,对用户行为的分析,自然就可以利用用户对内容的态度来有效判断新内容的质量,并借助用户的差异化来使得算法推荐保持一种持续更新的状态,这样就弥补了内容算法的局限性。同时,这一维度的直接好处就是,帮助平台快速得获得用户的喜好信息。而场景的融入,则帮助算法更加精准的把握用户选择的变化规律,以实现人性化。

这里面,内容与用户行为两项维度占主导因素,前者受限历史数据,后者受制于用户行为。而两者融合,则相得益彰。

人工管理与AI算法之间的博弈

今天,将推荐机制用到极致的平台中,不得不提今日头条。它通过将用户分享和AI智能推荐机制很好的融合在一起,并以此“上位”。而随着影响力的扩大,今日头条的算法推荐漏洞亦于无形中被放大,终被推上了风口浪尖。

但是历经四次改版的今日头条算法依然有着AI无可避免的通病,包括对语境的判断、对边界性信息的筛选等,也因此虽然它在海量信息中为用户做出了选择,但这样的选择缺乏用户意愿的反馈,缺乏词义多重理解带来的有效信息判断,可能用户在某一时刻看了一篇具备反讽意味的文章,通篇采用了魔幻主义写作手法,而算法就会基于这样的无差别判断,持续不断地为他推送与其意愿不符的内容,而忽略了其真正想要获得信息。

在这个层面上,算法的存在,不但没有真的懂用户,反而在更广的范围内,试图以技术的途径承担媒体的职责,却忽略了媒体社会价值的根本在于信息的全面性、观点的多样性,而不是重复在某一个舒适的维度。

算法懂世界,但是不懂人心

在过去将算法设为主要运行机制,人工为辅助,今日头条平台的运行成本确实得到大幅的降低,商业利益得以最大化,但也因此凸显了弊端。当然,今日头条也在通过建立“青云计划”等机制,广招审核员去试图扭转内容的走势,但正如其资深算法架构师曹欢欢博士所言,“平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预” 。

事实上,完全驱除人工管理根本是个伪命题。任何一种算法都是基于平台价值与利益而产生的,它代表的也是平台管理者的价值观。在某种程度上,算法可以不动声色地让你充分了解这个平台的气质、个性甚至是追求。

而关于二者之间的对峙,则有个经典的故事。自2015年开始,因立场不一,老牌流媒体音乐服务平台Spotify与Apple Music之间就一直处于对峙状态。作为坐拥7500万用户的音乐服务平台,Spotufy坚持用大量的数据进行个性化推荐,而人工挑选和推荐音乐一直是Apple Music的重要卖点。库克认为,“我们担心音乐正在失去人性,担心它正在变成一个字节一样的世界,而不再是一个艺术和技艺的世界”。

然而,从目前的统计数据来看,位居第一的Spotify的用户数是Apple Music(第二位)的两倍,却是不争的事实。

智能反被智能误,你并不懂我

而用户,没有纠结,简单直接。

作为资深音乐爱好者和网易用户,小乙对平台主打的智能推荐其实存有不满,“网易云音乐会给我推荐不同的歌单,但我只会偶尔点开,而且点开后我大致‘看’了一下,发现基本不是我想要的,它也并不懂我,很少能触碰到我的点。”

对于今日头条头条的推荐机制,小甲也有类似的感受,“我只是有那么一次点开了娱乐新闻,结果平台就狂推娱乐八卦给我,看不到我想看的,我非常反感。”

这不是算法引发的个例。如上文所言,算法在某种程度上试图承担媒体的介质作用,它当然也可以从设计上,通过融入用户和场景两项因素弥补单纯基于内容分析带来的信息同质化问题,但是,算法的设计未考虑理想与现实之间的差距因素。

受用户群体素养、不同领域用户行为、人性原始欲望等因素影响,长久下来,平台推荐的内容自然就会渐渐养成为是偏于大众趣味的。驯化后的平台带来不了阅读惯性之外的信息,无法增加技术的新鲜感,同时也“刻意”地流失了很多优质内容。优质内容的参与度低,算法的正向反馈会在无形中被削弱,而这也将极大地削弱内容创作者的动力和创新性。

算法懂世界,但是不懂人心

当下,虽然各大平台一直在通过资本运作等措施去阻止“个性化推荐”剑走偏锋,但事实是,大众文化的力量终还是把平台的“棱角”抹平,成为了一个吸引新用户和“懒人”的聚集地。

最后

在互联网时代,碎片化信息无可避免成为了主流,在这样的境况下形成有效的认知与思想体系不是一件简单的事。AI算法也毋庸置疑,是当今各个平台的主流技术手段,然而其弊端和优势一样,都在朝相反的方向撕扯平台的核心价值和用户。

内容型平台最重要的作用不见得是信息的聚拢,更多的应该是引导,广泛的、多维度的、有温度有思想的内容引导。这显然不是单纯的算法一统天下能够达成的,也不是加入人工干预就能周全的。

AI算法是天然趋势,它懂用户的前提是,尊重用户。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到