原始信息框属所有属性提取哪些来自维基百性 金属材料的一些性质。 Dbr:British_Steel dbp:foundation “1967” 信息,使用不同的语言来dbr:Alloy_steel owl:sameAs dbes:Acero_aleado 描述相同的材料。 金属材料的wiki页面的ID。 dbr:Alloy_steel \"6186026 \" . dbr:Alloy_steel dbo:wikiPageRedirects dbo:wikiPageID科所有信息框。 不同语言间的Interwiki提取链接。 链接 页面ID 文章提取页面id。 重定向 重定向,维基百科上的文章都是金属材料的wiki页面重提取之间的联系。 定向。 维基百科文章提取的修订ID。 金属材料的wiki页面修订ID。 相应的文章的链接在维基百科金属材料在维基百科上中提取。 的文章的链接。 dbr:High_alloy_steel 修订ID dbr:Alloy_steel dbo:wikiPageRevisionID “547258385” dbr:British_Steel foaf:isPrimaryTopicOf < http://en.wikipedia.org/wiki/Alloy_steel l> Wiki页面
图二:金属材料局部图
步骤3。收集不同属性列表数据和实体匹配。然后将三重数据主题相匹配的实体进行比赛。金属材料的数据被获得。
算法1显示了我们如何在DBpedia中提取实体。在CLIST列表每个实体与三重数据文件类别匹配,并且新的实体放入CLIST。由新实体调用递归算法,我们可以得到所有实体金属材料。
金属材料的数据提取主要包括金属材料和金属材料公司的实例,和不同的实例属性。提取的实例可以通过不同的属性,连接在一起,形成一个当地的知识地图。图2是连锁图的一部分金属材料的数据。类别类型:钢材由RDF发现:type属性,我们使用抽取算法来寻找其中涉及到合金钢,例如实例:低合金钢和Eramet公司。有关该公司的信息可以通过不同的属性文件中找到。 表2
提取金属材料算法算法1:ExtractME(StmtIterator categoryFile,列表CLIST)
输入:categoryFile,CLIST 输出:CLIST
1.如果CLIST是空的则返回CLIST 2. ELSE FOR CLIST中的每个实体 3.在categoryFile EACH统计 4. IF(stat.subject等于实体)THEN 5. stat.object加CLIST;
6. IF(stat.object等于实体)THEN 7. stat.subject加CLIST; 8. END FOR
8. ExtractME(categoryFile,newclist); 9. END FOR 10.END IF
V.金属材料的推荐系统
图3。原型系统
A计算语义距离算法的使用
通常,我们可以直接查询我们想要的结果,但没有推荐。DBpedia官方
网站提供了在线查询功能,可以查询相关信息的金属材料SPRAQL[9]。但SPARQL查询没有推荐功能。例如: 前缀dbpedia:< http://dbpedia.org/resource/ > SELECT *
在{ dbpedia:Alloy_steel ?本文?非公有objcet。}
它只可以查询一些属性Alloy_steel的信息。它不能推荐我们其他金属材料与Alloy_steel公司协会。维基百科网站也没有推荐,它只提供了一些信息Alloy_steel[10]。
而不是依靠一个完整的DBpedia数据集,我们旨在建立金属材料根据提取的数据集从DBpedia推荐。例如,Alloy_steel之间的语义距离可以计算和其他金属材料。我们可以得到一些其他金属材料实体(High-alloy_steel,Low-alloy_steel等等)与Alloy_steel,和一些公司名称(镍、等等)。有许多类型的语义距离算法,本文使用语义距离计算公式如公式1所示[8]。之间的语义距离的值是[0,1]。在公式中,如果有一个实体的李从实体ra实体rb,Cd(ra,rb)等于1;否则Cd(ra,rb)等于0。如果有一个实体n满足(ra,n)和(rb,n),Cio(ra,rb)等于1;否则Cio(ra,rb)等于0。如果有一个实体n满足(n,ra)和(n,rb),本次(ra,rb)等于1;否则Cii(ra,rb)等于0。
Cd(li, ra, rb) Cd(li, ra, rb) LDSDcw(ra, rb) =1/(1 +i +i
1+log(Cd(li, ra, n))1+log(Cd(li, rb, n)) Cii(li, ra, rb) Cio(li, ra, rb)
+
i
+
i
)
1+log(Cii(li, ra, n)) 1+log(Cio(li, ra, n)) 公式1。LDSD措施 B.实验原型系统
从DBpedia的实体在金属材料之间的联系。这些知识地图形成了一个局部的金属材料知识基础,以及如何利用这些宝贵的知识应该考虑。 如图3所示, 我们已经开发了一个实验性质的原型系统,适用于金属材料的信息建议。用户可以选择金属材料的名称来查询详细的相应信息。例如,当Alloy_steel被选择时,用户可以查询该金属材料的性质:描述信息(DBO:摘要),图像信息(DBP:hasPhotoCollection),维基ID信息(DBPO:wikiPageID)等。另外,这些信息sameAs的属性:由各种语言由DBP描述,并且可以发现Alloy_steel的不同语言描述的URL。然后,用户可以通过语义距离计算Alloy_steel找到其他语义相关的金属材料和公司名称,用户可以分别查询推荐资源的详细信息。
VI.结论
在本文中,有关基于DBpedia中领域知识的提取和应用的方式呈现。一种算法设计成从DBpedia中提取金属的材料的知识和语义距离计算用于推荐相关的信息为金属材料。实验样机已经初步展示了我们方法的有效性。在未来中,提取算法将进一步改善,以获取有关金属材料更完整的认识。此外,所提取的知识将被填充到正被开发出一种新设计的金属本体。 致谢
这项工作是由中国国家自然科学基金项目(No.51271033),河北省自
然科学基金(No.F2013208107),河北省教育厅(No.QN20131138,No.ZD2014027)科学基金会的支持。
参考
[1](2011)链接开放数据云图。 [在线] LOD社区:HTTP:// LOD云。净/ [2] A.霍根A.哈思,A.帕桑特,S.德克尔和A. Polleres,“编织迂腐网络”,在第三届国际研讨会关联数据在网络上(LDOW2010)在WWW2010,2010。 [3] PN门德斯,M.雅各布和C. Bizer,“DBpedia中:一个多语种的跨域知识库”中LREC,2012年,第1813至1817年。
[4] J.莱曼,R. Isele,M.雅各布,A. Jentzsch,等人,“DBpedia中-A大规模,多语言的知识基础,从维基百科中提取,”语义Web,第2210-4968,2014年11月。 [5] A.帕桑特,“使用DBpedia中Dbrec音乐的建议,”
斯普林格柏林海德堡,第一卷。 97,第209-224,2010年11月。 [6] J.莱曼,J.Schüppel和S.奥尔,“发现未知的连接,在DBpedia中关系Finder中,”在慈善社,2007年,造纸113,第99-110。
[7] FM苏查内克,J. Hoffart,E. Kuzey和E.刘易斯 - 凯勒姆,“YAGO2s:模块化高质量的信息提取与应用程序进行飞行计划,”在BTW,2013年,515-518页。
[8] A.帕桑特,在AAAI春季研讨会“测量距离的语义上链接数据和使用它的资源的建议”:关联数据符合人工智能,2010。
[9] B. Quilitz和U. LESER,语义网的研究与应用:分布式查询RDF数据源与SPARQL。德国柏林:施普林格,2008年,第一卷。 5021。
[10] D.托雷斯,P. Molli,H. SKAF-Molli和A.迪亚兹,“从DBpedia中维基百科:通过发现维基百科约定填补这一缺口,”在Web Intelligence和智能代理技术(WI-IAT) 2012年,卷。 1,第535-539。
[11] C.贝克尔和C. Bizer,“DBpedia中移动:一个定位功能的关联数据浏览器”,在LDOW,2008年。