关于大数据推送的问题,仅从技术上来说(暂时涉及心理、社会、政治和哲学),其实我认为是一个从“主动搜索信息”到“被动接受信息”的一个过程,或者说倒退。当代互联网最大的问题无非是垃圾信息的泛滥和信息茧房的形成,从而让用户沉溺在虚伪的认同感和党同伐异的快感中,而如果我们将时间拉回互联网建设的初期,我们或许可以看到一个概念——”图书馆“。
如果没有互联网,人类是如何存储大量信息和知识的呢?一个最经典的媒介就是书籍,而存放大量书籍并提供查询和阅读服务的机构就是图书馆。而如果我们回看早期互联网的构想就会发现,其实所谓的”网页“,一开始的设计思路就是”并不存储在本地主机硬盘上的文档“。也就是说,建设互联网的初衷之一,就是让一个计算机可以读取存储在其它计算机上的文档,从而构成一种分布式的信息存储系统,在这个系统中,任何一个主机都可以访问其他主机中的信息,从而做到高效的信息存储和交流。只是后来,人们发现用于存储信息供其他主机访问的机器可能需要更高的性能和更专门的功能/服务,所以才有了如今的客户端/服务器的区别。实际上所谓的服务器也是就是一个计算机嘛,只不过为了应对大量的访问请求和处理的需要,用作服务器的计算机和家用计算机之间的硬件和软件确实很不一样。
截止到这个阶段,互联网其实也就是一个分布式的图书馆,并且支持更快速的信息检索和查阅。由于分布式的缘故,通过设置对信息的冗余存储,互联网可以增强系统整体的鲁棒性,也就是在部分节点丢失的情况下重新恢复整个系统的信息的能力,这也是一开始美国国防部发展互联网这个新事物的最最开始的原因。那么,在这个阶段,人们是如何使用互联网的呢?其实也很简单,就是通过类似于输入网址的方式(很多不同的网络连接方式本质上都是通过一个类似于”资源定位符“的东西来定位和访问的)来获取自己想要的信息。而这个过程,是一个极其主动的过程,它要求用户知道”信息在哪“。同样的,图书馆也是一样,传统的图书馆只是陈列了众多的书籍,读者需要自己走进对应的房间,在对应的书架上搜寻自己需要的书本。
在图书馆和互联网的发展中,有一个技术是极其类似的,那就是检索系统。对于图书馆来说,由于可能存放了过多的书籍,导致读者无法快速定位,于是就发展出了“图书分类法”,而每个图书馆也会把不同类别的书和不同的阅览室/楼层绑定起来做一个表,这样读者就可以根据这些索引快速找到需要的书籍了。而互联网也是如此,在早期的时候,用户需要记住具体的网页节点在整个互联网域名树状结构中的位置,才能精确打开对应的网页/在线文档,而后来也出现了利用超链接的快速索引网页。用户可以像查看读书馆的引导指南一样,搜寻自己感兴趣的信息,并且找到对应的超链接,一键进入想要的网页。直到搜索引擎的出现。
搜索引擎的出现改变了很多东西,但我觉得最重要的一点是它对用户屏蔽了那样一个全局的信息索引,仅仅向用户呈现了用户所关注的信息的相关内容。举个例子就是,当读者进入图书馆的时候,图书馆中没有任何关于楼层/阅览室的索引信息,读者只能去前台询问是否馆藏中有自己感兴趣的书,而前台服务人员则会通过内部的索引来帮助读者查询,并且仅仅告知读者查询的结果,而不会透露查询的过程。虽然搜索引擎依然提供了用户一个“主动查询信息”的机会,但是用户已经没有办法去在新的信息间“漫游”了,而我觉得这种“漫游”或许至关重要。
想象一下,在久远的过去,一个古希腊贵族(不用下地干活也饿不死,有人养着没事就思考问题打发时间的那种)走进了城邦的学院或者神庙,他的目光被一列列的书卷/泥板所吸引。他发现了一摞摞关于航海贸易如何坑对方的记载,也发现了一摞摞关于宙斯如何到处留种的神话记载,又发现了一堆堆关于过去10年内的祭祀情况的记载。接下来他会怎么做?如果他家里曾经从商,他可能会一开始就翻阅关于海洋贸易的文献。但是就在他集中注意力阅读了一上午之后,他可能会觉得有点累,有点饿,于是他回去找吃的,然后“看点别的什么东西来调剂一下”。而这个“看 点 别 的 什 么 东 西 来 调 剂 一 下”的想法,正是拓宽这个贵族的眼界/知识储备/世界观的钥匙,也就是从这个微小的想法出发,他开始走出了曾经的“舒适区”。
当人们漫游在书架之间的时候,人们是可以以一种近似随机的方式,与这个世界上的不同的知识和信息进行相遇,而这些相遇是自己所不可控的,也就充满了未知和可能性。而如果出现了一个前台代理人/搜索引擎将这种全局的知识索引藏了起来,那么我相信,上文中的那个希腊贵族,不会想要去阅读海洋贸易以外的著作,因为他根本就不知道,这间神庙里面除了海洋贸易以外的著作还有什么。除非……他让前台给他推荐一下其他的书籍……
于是,事情就更糟糕了,大数据推荐算法出现了。在这里,前台可以向这个贵族推荐他最想看的希腊神话,也可以推荐关于街头巷尾的故事的记载,但是前台也可以故意隐瞒关于过去10年内的祭祀情况的记载。于是,信息被垄断了。更可怕的是,如果这个贵族觉得前台小哥推荐的很好,可能从此以后他都不会去主动询问他想看的书籍了,他会直接要求前台小哥给他推荐他想看的书,而这就是当代互联网的现状:人们甚至连搜索引擎也不愿意使用了,反正主页上可以得到自己想看的内容。
于是……信息茧房出现了,回音壁出现了。人们变得越来越自我肯定,乃至最终变得极端。毕竟,推荐算法的底层原理,就是找到用户的倾向/偏好,然后去满足这种倾向/偏好,而这一切最终又加强了用户原有的倾向。最后,这种满足的螺旋就将人推向了极端。
所以,就目前来讲,或许重回图书馆的古典时代,是一个可行的方案(甚至无需开发新的技术和工具)。我们应该重新将知识和信息的索引还给用户,我们应该在主页上呈现一个全局的信息索引以供用户漫游,并创造无数个用户和全新的知识、见解、观点、领域之间相遇的机会,从而面对一个真实的世界。
当然,从细节上来说,可能仅仅将索引放在主页上,依然不足以引起用户的好奇心,因为光看一个类型的标题(“水区”、“日记”、“分享”等等)可能无法让用户理解这里面到底是什么。所以,一等程度上的展现某个标题下的内容或许是必须的,用户需要通过对这个分区/类型的帖子有一个大概的印象,才会得出“是否要点进去看看”的结论。那么,这里的部分内容展示需要使用到“推荐算法”以来达到“最具代表性”的展示吗?我觉得还是不需要的,一个随机算法就够了,在每次用户刷新主页的时候在每个分区下随机抽取固定数量的帖子,我觉得就够了。毕竟,漫游的关键是随机性。
不过,这种重回图书馆时代的方式,是比无法吸引到更多的用户。在推送为王的当下,还想要主动思考和主动搜寻信息的人本就不多。不过,或许很多时候就是这样:自救者,人恒救之。
PS:有感而发打了很多字,内容没有经过二次校对,可能会有大量的笔误。感谢阅读~😝