免费信息发布

NLPIR大数据Protege知识图谱软件智能展现

来源:灵玖软件 浏览:293次 时间:2018-06-04

  近年来,随着互联网快速的全面展开,语义万维网数据源的数量激增,大量的资源描述框架数据开始被发布。互联网正从仅包含网页和网页之间超链接的“文档万维网”演进为包含大量描述各种实体和实体之间丰富关系的“数据万维网”。为了改进搜索质量,国内外互联网搜索引擎公司纷纷以此为基础构建知识图谱,,从而拉开了语义搜索的序幕。

  目前知识图谱的建立通常采用自顶向下和自底向上相结合的方式。自顶向下的方式是指通过本体编辑器预先构建本体。当然这里的本体构建不是从无到有的过程,而是依赖于从百科类和结构化数据得到的高质量知识中所提取的模式信息。图谱模式定义了领域, 类别和主题(即实体)。每个领域有若干类别,每个类别包含多个主题且和多个属性或关系关联,这些属性或关系规定了属于当前类别的那些主题需要包含的属性和关系。自底向上的方式则通过上面介绍的各种抽取技术,特别是通过搜索日志和万维网表格(Web)来抽取所发现的类别、属性和关系,并将这些置信度高的模式合并到知识图谱中。自顶向下的方法有利于抽取新的实例,可保证抽取质量;而自底向上的方法则能发现新的模式。

  知识图谱一经推出,就为语义搜索带来了新的活力。毋容置疑,知识图谱已经在搜索的查询理解和基于知识的问题回答上初显出其强大的威力。

  Protege软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件。这个软件主要用于语义网中本体的构建,是语义网中本体构建的核心开发工具。相比与其他的本体构建工具而言,Protégé最大的好处在于支持中文,在插件上,用Graphviz可实现中文关系的显示。为了方便大家,灵玖软件工程团队在吸收protege原版的基础上,对protege汉化后又对webprotege进行了汉化,并成功上线,使大家可以在线进行知识图谱语义本体的自动构建。成功升级的protege汉化版和webprotege汉化版都将对外免费使用。

  知识图谱语义本体已经成为当今在大数据应用领域共同关注的前沿课题,目前被广泛应用于自然科学与人文科学领域。相比较以往的可视化技术存在一系列缺点,新兴的知识图谱可将某个学科领域或者知识单元间错综复杂的交互关系用节点与链接等现代可视化大数据技术进行处理与展示,使人们可以清晰直观的了解某个学科或者领域发展进程中的知识结构、研究趋势等。运用知识图谱能够有效的从众多数据中获取知识,也是目前人们从浩如烟海的数据中获取知识的一种有效方法。

  灵玖软件作为大数据搜索挖掘分析技术领域的领导者,在技术方面不断精进,拥有完整的大数据技术链条,protege的汉化开发并成功实践运用,标志着灵玖软件在知识图谱语义本体建设方面取得重大进展。

  此外,知识图谱的构建是多学科的结合,需要知识库、自然语言处理、机器学习和数据挖掘等方面的知识融合。有很多开放性问题需要学术界和产业界一起解决。我们有理由相信学术界在上述方面的突破将会极大地促进知识图谱的发展。