您的位置:首页>科技 >内容

什么是知识图表以及对它们的所有炒作是什么

2019-05-09 15:42:42来源:
导读什么是知识图表,以及对它们的所有炒作是什么?如果你想成为世界上的Airbnbs,Amazons,Google和LinkedIns,学会分辨现实炒作,定义不同类型

什么是知识图表,以及对它们的所有炒作是什么?如果你想成为世界上的Airbnbs,Amazons,Google和LinkedIns,学会分辨现实炒作,定义不同类型的图表,为你的用例挑选合适的工具和数据库是必不可少的。知识图表被大肆宣传。我们现在可以正式说这个,因为Gartner在2018年的新兴技术炒作周期中包含了知识图表。虽然我们不必等待Gartner -宣称这是“图表年”是我们2018年的揭幕战。像活跃在这个领域的任何人一样,我们看到了机会,以及这方面的威胁:炒作带来了混乱。

知识图是真实的。他们至少已经过去20年了。知识图在其原始定义和化身中一直是关于知识表示和推理的。诸如受控词汇表,分类法,模式和本体之类的东西都是其中的一部分,建立在标准和实践的语义Web基础之上。

那么,改变了什么?为什么Airbnb,亚马逊,谷歌,LinkedIn,Uber和Zalando等公司在其核心业务中运用知识图表?亚马逊和微软如何加入图形数据库供应商及其最新产品?你怎么能做这个工作?

知识图表很酷之前

知识图听起来很酷。但究竟是什么呢?这可能听起来像一个天真的问题,但实际上正确定义是如何构建知识图。从分类法到本体论 - 本质上是模式和不同复杂性的规则 - 这就是人们多年来一直在做的事情。

RDF是用于编码这些模式的标准,具有图形结构。因此,调用在图形结构之上编码的知识“知识图”听起来很自然。这样做的人,数据建模者,被称为知识工程师或本体论者。

这些知识图可以有许多应用 - 从编目项目到数据集成和在Web上发布,再到复杂的推理。对于一些最着名的,你可以看看schema.org,Airbnb,亚马逊,Diffbot,谷歌,LinkedIn,优步和Zalando。这就是为什么知识图表中经验丰富的人会嘲笑炒作。

因此,知识图现在处于新兴技术的炒作周期中。对于拥有超过20年历史的技术来说,这不错。(图片:Gartner)

像任何数据建模一样,这是一项艰巨而复杂的工作。它必须考虑到许多利益相关者和世界观,管理起源和模式漂移等等。加入混合推理和网络规模,事情很容易失控,这可以解释为什么直到最近,这种方法在现实世界中并不是最受欢迎的。

另一方面,走向无架构已经并且仍然很受欢迎。无模式可以让你快速入门;它更简单,更灵活,至少达到某一点。不使用模式的简单性可能会欺骗。因为,无论您的域名是什么,都会存在架构。架构上阅读?精细。但根本没有架构?

您可能不会事先了解您的架构。它可能很复杂,而且可能会发展。但它会存在。因此,忽略或淡化模式并不能解决任何问题,只会让事情变得更糟。问题将潜伏,并花费您的时间和金钱,因为它们将阻碍开发人员和分析人员,他们将尝试开发应用程序并获得对模糊数据的洞察力。

然后,重点不是抛弃架构,而是使其功能性,灵活性和可互换性。RDF非常擅长这一点,因为它也是数据交换的标准化格式的基础,例如JSON-LD。顺便说一下,RDF还可以用于轻量级模式和无模式方法以及数据集成。

将知识输入或输出图表

那么,炒作是什么?20年前的技术如何能够在臭名昭着的炒作周期中出现?炒作也是真实的,原因也是如此。这与人工智能炒作的迅速崛起是同一个故事:并不是因为方法中的事情发生了变化,而是现在的数据和计算能力使它大规模地发挥作用。

此外,AI本身也有帮助。或者,更准确地说,这种自下而上的基于机器学习的人工智能最近得到了大肆宣传。知识图基本上也是人工智能。只是另一种。不是一些大肆宣传的AI,而是一种象征性的,自上而下的,基于规则的类型。迄今为止不受欢迎的那种。

这并不是说这种方法没有局限性。很难以功能的方式编码关于复杂域的知识,并且大规模地对其进行推理。因此,机器学习的做事方式,就像无模式的方式,受欢迎。并且有充分的理由。

知识图表起初可能很难,但不要放弃。实践是完美的。

随着大数据爆炸以及NoSQL的兴起,其他事情也开始发生。非RDF图的工具和数据库出现在市场上,并开始寻找成功。这些标记属性类型(LPG)的图表更简单,更简洁。与RDF相比,它们缺少模式或具有基本模式功能。

它们通常在运营应用程序,图形算法或图形分析方面表现更好。最近,图表也开始用于机器学习。这些都是非常有用的东西。

算法,分析和机器学习可以提供有关图表的见解,一些常见的用例是欺诈检测或推荐。因此,您可以说这些技术和应用程序从图形中获取知识,自下而上。另一方面,RDF图从上到下将知识引入图形。

那么,自下而上的图知识图也是吗?

另外:在不破坏数据的情况下快速行动:用于管理机器学习中的风险的治理

正如知识工程师所说,这是一个语义问题。骑知识图表炒作很诱人。但最终,缺乏清晰度可能证明服务很少。图形算法,图形分析和基于图形的机器学习和见解都是良好,准确的术语。它们也不与“传统”知识图相互排斥。

我们前面提到的所有突出用例都是基于多种方法的组合。例如,拥有知识图并使用机器学习填充它有助于构建最大的知识图- 至少在实例方面,如果不是实体的话。这也是像DeepMind这样的AI先驱正在研究的东西。

有些东西陈旧,有些东西是新东西,有些东西借用于图形数据库

像往常一样,用于图表的方法和工具的选择取决于您的用例。这也适用于图形数据库,我们随着它们的发展一直在密切监控,新的供应商和功能正在迅速增加。

上周在Strata,获得最具颠覆性创业奖的获奖者和亚军都是图形数据库:TigerGraph和Memgraph。如果您需要更多证据证明在该领域取得了快速进展,那么您就拥有它。顺便说一句,两家创业公司的年龄不超过两年。

对于2017年9月秘密出现的TigerGraph来说,这是一个非常活跃的一年。今天,TigerGraph宣布推出新版本。它有一些陈旧的东西,一些新东西,一些借来的东西 - 虽然我们无法发现任何蓝色的东西。

淹没数据与大数据不同。以下是大数据的真实定义,以及如何使用它来为数字化转型提供动力的强大示例。

阅读更多

新事物是少数。他们都在解决TigerGraph现有的痛点。TigerGraph增加了与流行数据库和数据存储系统的集成,包括:RDBMS,Kafka,Amazon S3,HDFS和Spark(即将推出)。TigerGraph表示github存储库将在TigerGraph推出时托管开源连接器。

当然,没有社区,github存储库不值得。TigerGraph正在努力,并宣布了一个新的开发人员门户网站和电子书。该版本还带来了更多部署选项,为现有Amazon AWS添加了对Microsoft Azure的支持。为了跟上容器化趋势,还增加了对Docker和Kubernetes的支持。

我们之前提到了图算法,这可能是该版本中最有趣的方面,并结合了查询语言。TigerGraph增加了对图形算法的支持,例如PageRank,Shortest Path,Connected Components和Community Detection。有趣的是,这些都是通过TigerJraph自己的查询语言GSQL支持的。

我们已经提到了查询语言对图数据库的重要性。最近,根据DB-Engines,领先的图形数据库供应商Neo4j提出了为LPG图形数据库创建标准查询语言的建议。这在LPG世界中不存在,而不是SPARQL附带的RDF。

TigerGraph最初回应了Neo4j的电话。然而,现在情况正在发生变化。TigerGraph刚刚宣布了一个Neo4j Migration Toolkit,它主要基于将Cypher(Neo4j的查询语言)转换为GSQL。这是我们与TigerGraph详细讨论的一点。

TigerGraph这样做是有道理的,因为必须在Neher4j的查询语言Cypher中迁移现有的查询体,这将是一个障碍。有趣的部分是TigerGraph如何选择实现这一点:作为一次性,批量翻译过程,而不是以交互方式。

这是一个战略选择。TigerGraph希望人们切换到GSQL,而不是在TigerGraph之上使用Cypher。传统上,开发人员一直不愿意学习新的查询语言。TigerGraph有一些故事可以分享这对他们有多大的影响,但这将如何发挥作用是任何人的号召。

TigerGraph公告中的旧部分是基准测试。这些基准测试实际上是新的,但TigerGraph已经进入基准测试,因为它是隐形的。对于声称由于其MPP架构而声称比其他任何东西更快的解决方案,这也是有意义的。该基准测试将TigerGraph与Neo4j,亚马逊海王星,JanusGraph和ArangoDB进行了比较,并且不出所料,它发现它比所有这些更快。

借来的部分?为什么,当然知识图。TigerGraph的员工也证实了客户对此表现出极大的兴趣,例如中国的知识图事件吸引了超过1000人。什么知识图?好吧,现在你知道了。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章