内容摘要:“谷歌”打造世界上最大知识库“谷歌”公司正在打造人类历史上最大的知识库。这个被冠以“Knowledge Vault”之名的知识库无需任何人工干预,就能自动搜集源自互联网的信息并将其整合成单一的事实库,内容涉及世界、人物以及相关对象。这种知识采集机制达到的广度和精度,正在日益成为各种便于机器人和智能手机理解人们对其提问的系统的基础。它有望让“谷歌”超越搜索引擎功能,像“甲骨文”(Oracle)数据库那样回答问题,甚至还能从新的视角来考察人类历史。譬如你把“歌星麦当娜出生于何处”键入“谷歌”时,它给出的地点便采集自“谷歌”现存的知识库。这恐怕也是“微软”、“脸谱”等世界上最大的技术公司步趋“谷歌”纷纷建立类似知识库的原因。
关键词:知识库;谷歌;数据库;搜集;采集;智能;手机;机器人;人类历史;分析
作者简介:
“谷歌”打造世界上最大知识库

“谷歌”公司正在打造人类历史上最大的知识库。这个被冠以“Knowledge Vault”之名的知识库无需任何人工干预,就能自动搜集源自互联网的信息并将其整合成单一的事实库,内容涉及世界、人物以及相关对象。这种知识采集机制达到的广度和精度,正在日益成为各种便于机器人和智能手机理解人们对其提问的系统的基础。它有望让“谷歌”超越搜索引擎功能,像“甲骨文”(Oracle)数据库那样回答问题,甚至还能从新的视角来考察人类历史。
Knowledge Vault知识库,是一种存储信息以供机器和个人阅读的系统。如果说数据库处理的是数字,那么知识库应对的则是事实。
譬如你把“歌星麦当娜出生于何处”键入“谷歌”时,它给出的地点便采集自“谷歌”现存的知识库。这种现存的所谓“知识图谱”库是靠众包来扩展信息的,虽然眼下的规模仍大于Knowledge Vault,但只包含手动整合的源数据。相比之下,Knowledge Vault为“谷歌”提供的知识扩展既便捷又自动,而且速度正在日益加快。除了分析网页上的文本外,“谷歌”还能潜入网络表面底下搜寻隐藏的数据源,将原始数据转变成可用的知识片段。到目前为止,Knowledge Vault搜集的事实已达到16亿条,其中有2.71亿条被定级为真实性超过90%的“可信事实”。







