长久以来,互联网的顶级域名一直都没怎么变,都是.com、.net、.org等这些老面孔。但是计算机科学家及计算型知识引擎
Wolfram|Alpha的创始人Stephen Wolfram近日发出呼吁:为了实现数据web,建议创建新的顶级域名.data。
Stephen Wolfram近年活跃在数据社区,他认为这些活动聚焦点在于曝光互联网的数据,为组织披露数据提供动力,从而可以令用户可以更有效地发现和访问数据。
Stephen Wolfram在开发Wolfram|Alpha时要处理海量的数据,但是那些数据大部分不是直接从可见的互联网中获取的,而是来自与复杂的数据文件及数据库备份的混合物。
所以他提出,如果有一种标准的方式来获取结构化数据是不是很好呢?
目前的现状是,网站用网站地图(sitemap)来告诉网络蜘蛛(web crawler)如何浏览自己,关于网站是怎样组织这方面存在许多宽松的约定。但是结构化数据却没有任何约定。
今天的web主要是面向两类受众:人和搜索引擎爬虫。但是他认为对于Wolfram|Alpha和计算型知识来说,应该还存在着第三类受众:可计算东西的自动系统。
产品目录、存储信息、事件日历、递交监管、库存数据、历史文献资料、联系方式—许多东西对于计算来说都是非常有用的。但是即便网站里面有这些信息,尽管这些信息也是标准的结构化格式,但是由于缺乏标准的检索手段,使得获取这些信息仍然十分困难。
Stephen Wolfram因此提出了.data这个顶级域名的概念。用它来创建“数据web”—一个跟原来的web并行的web,主要面向的是结构化数据,供计算使用。其主要思路是除了每一个原始web网站都有一个.data的数据网站。
如果人访问.data网站,网站会提供其希望展示的数据的结构化摘要。如果是计算系统访问,只需直奔其所需的信息即可,然后开始计算。
其设想的.data域是要提供一种统一的机制—可访问任何类型和规模的组织,以便曝光其底层数据。
也许有人会提出这样一种概念,即在网站根放置类似“/datamap.xml”的文件,或者就用站点地图这些轻量级的方案来替代整个.data网站。但是Stephen Wolfram认为引进新的.data顶级域能够令创建数据web的工作更加突出,还能为获得各种质量上乘、传播广泛、标准规范的数据提供动力。
至于这些跟语义web的关系。语义web的中心概念是为人类可读的网页引入标记,使计算机更易于理解和处理。这跟数据web的概念有一些交集。不过数据web主要目的是为大量结构化数据提供安身之所,那种地方没人会想直接去访问。
Stephen Wolfram说自己10年前曾向搜索引擎先驱提出建议,通过定义从数据库展示数据的标准来深挖互联网。有一段时间大家曾经非常热衷于展现“web服务”,现在各种API已经是遍地开花了。
经过近几年参与数据社区的观察,Stephen Wolfram认为目前已经到达了一个关键点,即决定以标准的方式提供大规模结构化数据的组织已经大量出现。因此他认为创建.data顶级域名的时机应该成熟了。
Stephen Wolfram说尽管自己不能确定.data顶级域名的所有问题,但是他认为这是建设这个域是个重要的机会,他愿意身先士卒发挥领袖作用,并号召更多人参与进来,为加快数据web的诞生贡献力量。
Via:
stephenwolfram