人工智能研究科学家公布数据集搜索


谷歌,从第一天开始,通过寻找信息的业务而变得很大 。几年后,谷歌开始严肃地讨论数据集 。谷歌推出了一个新的搜索引擎来帮助科学家找到他们需要的数据集 。
周三,谷歌人工智能研究科学家娜塔莎·诺伊宣布谷歌启动数据集搜索 。现在,如果你是科学家,或者只是另一种类型的追求中的数据“极客”,你就可以很容易地访问数据集,为你的工作、你的故事和你的求知欲寻找数据 。

目标是为您带来更多的单一接口 。乔恩·芬格斯(Jon Fingas)在《瘾科技》(Engadget)上报道了它如何有益于数据搜索 。
【人工智能研究科学家公布数据集搜索】该工具提供了对数据的更直接的访问,这些数据以开放标准呈现,明确了谁创建了这些信息,如何收集这些信息,以及如何允许您使用这些信息 。你不仅可以为一份报告追踪气候数据,还可以确保它是相关的、合法的 。”
这是一个全球性的(在国际)推动工作在多种语言与支持其他语言即将到来 。James Vincent在The Verge网站上引用了Noy的话:“我认为在过去的几年里,储存库的数量确实激增了 。”
她说:“只要输入您要查找的内容,我们将帮助您在存储库提供商的网站上找到已发布的数据集 。”目前,数据集和相关数据往往分布在多个数据存储库中,人们可能会发现,关于这些数据集的信息既没有被搜索引擎链接,也没有被索引 。对于进行搜索的人来说,数据发现最多也就是单调乏味 。
她说,他们认真地支持这样一个生态系统,即通过谷歌开发的指导方针,鼓励数据集的提供者以“谷歌(和其他搜索引擎)能够更好地理解其页面内容的方式”来描述他们的数据 。
他们使用开放标准schema作为他们的方法 。Noy的愿望清单:所有的数据集提供者都要支持这个通用标准 。希望更多的数据存储库将使用schema标准来描述它们的数据集 。诺伊斯说,这样一来,数据集就是一个“强健的生态系统”的一部分 。
“像这样的搜索工具只能和数据发布者愿意提供的元数据一样好 。我们希望看到你们中的许多人使用开放标准来描述你们的数据,使我们的用户能够找到他们正在寻找的数据 。”
乔恩·芬格斯(Jon Fingas)在Engadget网站上说:“目前,它还远远不是决定性的资源 。然而,这只是一个开始,谷歌无疑希望这将鼓励其他人使他们的公共数据更易于搜索 。”
如果这一切还不够,谷歌还将开辟一些途径,最大限度地利用关于数据的数据,关于数据的数据 。

    推荐阅读