神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:哈佛大学法学与计算机科学教授乔纳森·齐特林(Jonathan Zittrain)于《大西洋月刊》发表评论长文,他详细介绍了互联网目前面临着的存在大量死链(腐烂链接)或被修改过的链接可能造成的严重后果,他认为应该建立一套完善的记录和追踪系统,以便让公众知道每一次修改或删除的内容与目的。原文标题The Internet Is Rotting。
相关文章:
为什么说互联网正在腐烂(一)
为什么说互联网正在腐烂(二)
为什么说互联网正在腐烂(三)
现在,没有简单的方法可以为后人引用许多来源,而那些可以引用的资料又太容易改变。
我们的互联网之所以取得惊人的成功,是因为作出了一个明智的决定:即倾向于好的而不是完美的,赞成一般的而不是具体的。我曾钦佩地称其为 “拖延原则”,即一个优雅的网络设计不会因为试图解决每一个可能在未来出现的问题而变得过于复杂。我们在维基百科中看到了这一原则,它最初的宣传似乎很荒谬:“我们可以通过允许世界上任何一个人创建一个新的页面,以及世界上任何一个人都可以修改的页面,来产生一个完全彻底和大部分可靠的百科全书。”
我们很自然地会问,什么会促使人们对维基百科这样的事物做出建设性的贡献,以及如何防范无知或恶意的编辑。如果维基百科获得了足够多的流量,难道不会有一些二流的供应商有动力将每篇文章变成劳力士手表的垃圾广告吗?
事实上,维基百科饱受破坏行为的困扰,而且随着时间的推移,维护维基百科的社区已经开发出了一些工具和做法来处理这些行为,而这些工具和方法在维基百科创建时并不存在。如果这些工具和做法过早地实施,可能会阻止许多让维基百科最初的运作和发展。拖延原则得到了回报。
同样,万维网发明者蒂姆·伯纳斯·李也不打算按照真实性、可靠性或其他任何标准来审查新网站。人们可以建立和提供任何他们想要的东西,只要他们有硬件和连接能力来建立一个网络服务器,其他人就可以按照他们的意愿自由访问该网站或忽视它。网站会来来去去,个别网页可能被重新安排,这是一个特点,而不是一个漏洞。正如互联网本可以被构造成一个大型的CompuServe,由中央调解,但它并不是这样。泰德·尼尔森的Xanadu项目考虑了更多,包括 “双向链接”,每当有人选择链接到一个网站时,就会提醒该网站,但Xanadu从未成功。
拖延者知道,迟一点并不意味着不会发生,互联网和万维网的灵活性所带来的好处(包括允许在其上建立完全拒绝URL概念的围墙式应用花园)现在对更大的企业来说是有很大风险和成本的,用谷歌早期的话来说,就是 “整合全球信息,供大众使用,使人人受益”。
谷歌创始人谢尔盖·布林和拉里·佩奇的想法是崇高的,以至于把它托付给一家公司,而不是社会上长期磨练的机构(如图书馆)是不公平的。事实上,当谷歌的创始人第一次发布描述他们所发明的搜索引擎的论文时,他们在附录中提到了 “广告和混合动机”,结论是 “广告问题引起了足够多的混合动机,因此拥有一个透明的、学术领域的竞争性搜索引擎是至关重要的”。2021年没有这样透明的、学术性的竞争搜索引擎。通过使信息的存储和组织成为每个人的责任,互联网和网络可以增长,空前地扩大访问量,同时使所有的信息变得脆弱。
我们要如何应对我们所处的危机?没有人比布鲁斯特·卡勒更敏锐地意识到互联网的转瞬即逝问题,他是一位技术专家,在1996年创立了互联网档案馆(Internet Archive),作为一项非营利性机构来保存人类的知识,特别是互联网上的内容。布鲁斯特曾开发了一个名为WAIS的网络先驱,然后是一个名为Alexa的网络流量测量平台,最终被亚马逊收购。那次收购使布鲁斯特个人有能力帮助资助互联网档案馆的最初运作,包括Wayback机器,专门用于收集、保存和提供网页,即使网页本身已经消失了。它通过挑选多个入口点开始 “刮取”网页,而不是仅仅在浏览器中显示其内容,然后尽可能多地跟踪这些网页上的连续链接,以及这些网页的链接网页。
像布鲁斯特这样一个有公民意识的人站了出来,而不是我们现有的机构,这并不是巧合。部分原因是潜在的法律风险,这些风险往往会减缓或阻止成熟的租住。抓取、存储和展示网络的版权问题起初并没有得到解决,一般来说,这种行为要么留给那些可以低调处理的人,他们只为自己保存他们所抓取的东西;要么留给像搜索引擎这样的大型和强大的商业机构,他们的商业需要使他们只显示最新的、活跃的网页,这是他们工作的核心;要么留给具有创业心态的技术型个人。后者的一个例子是Clearview AI的工作,在那里,一个狡猾的企业家从Facebook、LinkedIn和Instagram等社交网站收集了数十亿张图片和标签,以建立一个能够识别几乎任何照片或视频片段的面部识别数据库。
布鲁斯特表面上也属于这一类,但本着互联网和网络发明者的精神,他这样做是因为他相信做的事情的价值,而不是其经济潜力。Wayback Machine的方法是尽可能多地保存,而在实践中,这意味着每隔一段时间就要保存很多东西。这是至关重要的工作,它应该得到更多的支持,包括政府补贴和更多的基金会支持。互联网档案馆是麦克阿瑟基金会 “100与变革 "(100 and Change)倡议的半决赛选手,该倡议向有价值的事业单独颁发1亿美元。
通过独立搜刮来 ”保存一切 “的另一个补充方法是,无论谁在创建链接时,都要确保在创建链接时保存一份副本。我共同创办的伯克曼·克莱因互联网与社会中心的研究人员,用一个名为Amberlink的开源软件包设计了这样一个系统。互联网和万维网邀请任何形式的建设,因为没有人正式批准新的补充。Amberlink可以在一些网络服务器上运行,使其在Amberlink授权的服务器上捕捉到链接的内容。然后,当有人点击一个经过Amber调整的网站上的链接时,如果原来链接不再可用,也能看到Amberlink在该链接上捕获的内容。谷歌等搜索引擎也有这个功能,你通常可以要求查看搜索引擎从搜索结果页面链接的网页的 "缓存 "副本,而不是去网站。
Amber是一个网站归档另一个的例子。网站也有可能为长存而自我存档。2020年,互联网档案馆宣布与一家名为Cloudflare的公司合作,流行的或有争议的网站使用Cloudflare,以抵御有人恶意攻击,这些攻击可能使网站瘫痪。启用 ”永远在线“服务的网站将看到它们的内容被Wayback Machine自动存档,如果原网站不可用,互联网档案馆保存的页面副本将被替代原网站。
这些方法普遍有效,但并不总是具体有效。当一个司法意见、学术文章或社论专栏指向一个网站或网页时,作者往往有一些非常明确的想法。如果该网页正在发生变化(而且无法知道它是否会发生变化),那么,如果最近的网页副本是在2017年或2024年存档的,那么2021年引用的网页就不可靠了。
从布鲁斯特的工作中获得灵感,并与互联网档案馆合作,我与哈佛大学图书馆创新实验室的研究人员合作,创办了Perma。Perma是一个由150多家图书馆组成的联盟。持久性文件的作者(包括学术论文、报纸文章和司法意见)可以用Perma将其中的链接转换为永久的链接,存档在http://perma.cc;参与的图书馆将在这些链接收藏,并承诺无限期地保存。
研究人员马丁·克莱因、肖恩·琼斯、赫伯特·范·德·索姆佩尔和迈克尔·纳尔逊已经磨合了一项名为Robustify的服务,允许将任何来源的链接档案,包括Perma,纳入新的 ”双重用途“链接,以便它们可以指向一个当下有效的页面,同时在原始页面失效时提供一个存档的替代品。这可以使来自各种档案的链接快照形成一个滚动的目录,一个网络化的历史,它既是谨慎的分布,又有互联网风格,同时由长期存在的机构管理(图书馆),这些机构都是为了至关重要的公共利益目的而存在。
作者和出版商可以通过技术基础设施保存他们所利用的链接,这是一个必要的开始。但数字可塑性的问题超出了技术层面,还涉及法律问题。
出版商应该制定明确的原则性政策,反对在公众压力下进行出版物的更改,因为公众压力并没有达到法律规定的侵权行为。而且,在很多情况下,出版商也应该顶住法律压力。
在某些情况下,追溯改正是有好处的,比如修正食谱中的印刷错误,或者屏蔽出于骚扰目的而分享的某人的电话号码。公众希望看到改变的内容,或者至少知道已经做出了改变以及改变的原因,这既是合法的,也是分散的。因为它是分散的,所以很少有人能代表它发言。
在审查被认为是正确做法的时候,应该对被修改的内容进行细致的记录。这些记录应该向公众开放,就像Lumen会对谷歌搜索中的版权删除的记录一样,除非这种公开违背了删减的目的,例如,到目前为止,当谷歌在网络搜索中删除有关某人的负面条目时,并没有向Lumen公司报告,以免保护个人隐私。
在这些情况下,应该有一种保存记录的手段,公众不能随意获取,但研究人员应该可以得到。约翰·鲍尔斯、伊莱恩·塞登伯格和我已经建议图书馆可以再次作为公共和私人在线审查的半封闭式档案馆。我们可以建立德国人所说的 “礼物柜”,一个包含危险作品的 “毒药柜”,但这些作品在某些情况下还是应该被保存和使用。
通过假装错误从未发生来掩盖错误,这确实是很诱人的。我们现在的技术让这样的行为更简单。我们应该减少一点效率,多一点惯性,因为印刷品的性质,以前的惯性为自己提供了充足的质量。即使是最高法院也不排除对其法令中的不准确之处进行一些追溯性的调整。正如法律教授杰弗里·费舍尔在我们的同事理查德·拉扎勒斯发现变化后所说:”在最高法院的意见中,每个字都很重要......当他们改变意见的措辞时,他们基本上是在改写法律。“
如果这篇文章有一个错误,我们都应该希望在底部有一个作者或编辑的说明,指出在哪里进行了更正,为什么要这样做,而不是那种悄悄的修改。
如果社会不能对自己诚实,就无法了解自己;如果只能活在当下,就无法对自己诚实。我们早就应该确认并制定政策和技术,让我们看到我们已经走过的地方,特别是我们的错误,这样我们就可能对自己的现状和未来有一个一致的认识。
译者:蒂克伟
相关文章:
为什么说互联网正在腐烂(一)
为什么说互联网正在腐烂(二)
为什么说互联网正在腐烂(三)