海量的元素聚到一起之后,它们之间的联系会促成惊人的变化,多细胞生物、蜂群、人类社会都是例证。同人类社会里的六度分隔理论类似的是,网页也有这种规律。近日匈牙利物理学家Barabási发现,在全世界140亿个网页中,从其中任一个到另一个,最多只需19次跳转。
同人类社会一样,大多数网页同其他网页或者文件的连接数都不多,少数几个网页扮演着超级节点的角色,比如搜索引擎、目录和聚合器。我猜这种分布不均的现象会比人类更甚,人毕竟要睡觉吃饭,脑子的记忆力也有限,而搜索引擎可是能日夜不眠的收录各种站点的。这些超级节点的存在也给网络安全带来了隐患,因为攻陷其中一个就会顺带拿下一片,当然这些超级站点通常安全性都会超高的。
六度分隔理论的另一个名称是小世界理论。人类倾向于分群而居,结成内部相似的小社区。有趣的是,网页也有类似的现象,有着不同的层级。这一特质也使得19次点击理论适用于不同尺度下的网页集合,就是说取现有网络的一小部分,这一定律同样适用。
Barabási自03年就开始做这个Opte Project,希望能将网页结构可视化。在上图中,红色代表亚洲网站间的连接,绿色代表欧洲、中东和非洲,蓝色代表北美,黄色代表拉丁美洲,白色是未知IP地址。