JSON和XML 这组cp好新鲜

日期: 2016-01-24 作者:Jack Vaughan翻译:冯昀晖 来源:TechTarget中国 英文

随着互联网和大数据应用的蓬勃发展,JSON格式被广泛应用在不同系统、Web服务器和浏览器之间处理数据交互。不过,饱受恶评的前任技术XML仍有用武之地。 举例来说,虽然JSON(javascript对象表示法的简称)已经成为一种重要的数据格式,应用于心理学专业协会、教育者和学生。但IT架构师及语义数据资深人士Beverly Jamison认为,XML(扩展标记语言)在专门的数据集成需求方面仍然扮演着重要角色。

曾在美国心理协会(APA)担任IT架构和出版解决方案的高级总监Jamison说:“XML在学术出版界数据交换方面应用很广。很多b2b交互仍然在大量使用XML。”她在2015年底离开了这家位……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

随着互联网和大数据应用的蓬勃发展,JSON格式被广泛应用在不同系统、Web服务器和浏览器之间处理数据交互。不过,饱受恶评的前任技术XML仍有用武之地。

举例来说,虽然JSON(javascript对象表示法的简称)已经成为一种重要的数据格式,应用于心理学专业协会、教育者和学生。但IT架构师及语义数据资深人士Beverly Jamison认为,XML(扩展标记语言)在专门的数据集成需求方面仍然扮演着重要角色。

曾在美国心理协会(APA)担任IT架构和出版解决方案的高级总监Jamison说:“XML在学术出版界数据交换方面应用很广。很多b2b交互仍然在大量使用XML。”她在2015年底离开了这家位于华盛顿的机构,成为了一名独立IT咨询顾问。

在接受采访时她还在APA,Jamison说,过去这几年,JSON帮助专业协会为大约八万会员在网络上更快速地传递信息。

Jamison负责管理学术出版系统的改进,该系统目前管理16万期刊文章和三百万摘要信息,包括一些参考文献可以追溯到100多年前。她说:“我们学术文章的外部引用信息往往用JSON格式表示。”

不同数据格式引发的碰撞

JSON格式支持开发者保持相当程度的设计独立,对数据的描述非常简单,前期结构约束限定做到了最小化。JSON走向了前沿,成为XML的替代品。尽管如此,一些学术文档还是从XML的标记功能中受益,因为XML更加结构化,文档元素数据定义更严格。正因为如此,XML很自然地成为APA需要的交互机制。

此外,在APA环境中这两种数据格式并不是相互排斥的。某些情况下,JSON用于传输嵌套的XML载荷。用Jamison的话说,就是:“对另一端的要求不是那么苛刻,假定他们仍然在使用XML文档。”

Jamison和她的团队开发的API支持出版系统以JSON或者XML两种格式发起请求,根据特殊需要使用即可。

她说:“我们最喜欢内容系统中的XML和JavaScript,简直是两全其美。内容只作为结构存在一次,但它可以表现为XML或者Java。”

软件供应商MarkLogic公司设计的同名数据库(MarkLogic数据库)充当APA出版系统的开发和运行平台。2008年开始就在用了,那时候协会正把早期的数据

MarkLogic公司的软件最早是在十多年前开发的,定位是管理XML文档的数据库。但是,为了满足新数据架构的需求,MarkLogic已添加的功能超出了XML支持,现在归类为NoSQL数据库。在2014年该公司发布的MarkLogic 8支持原生JSON功能。

Joe Pasqua是MarkLogic公司产品战略副总裁,他说JSON和XML这两种格式在程序员中应用都很广,只是用于不同的场合。JSON经常用于Web API,擅长表示编程对象;在他看来,JSON并不像XML那样可以更好地展示标记文档。

用于语义的数据三元组

2015年八月,MarkLogic公司在发布的第8版产品中增强了对语义数据的处理。这样一来,现在该数据库可以与Apache Jena和Eclipse Sesame语义API协作了。Jena和Sesame都是为帮助开发人员使用资源描述框架(RDF)而设计的,这种框架是图形风格的数据结构,采用三元组的存储格式,更好地表达不同数据元素之间的关系。

三元组描述数据关系使用主语、谓词和宾语的结构。有很多独立的RDF数据库,图形数据库技术的变体专为存储三元组开发出来。但是MarkLogic公司在数据库产品中提供了对三元组存储的原生支持。该技术加上SPARQL语义查询语言技术,都很好地支持了APA团队使用MarkLogic的软件环境创建和管理数据图。

Jamison说:“APA的元数据研究其实就是对关系的研究。三元组存储大体是捕

展望未来,APA可能会继续利用各种各样的数据格式,包括JSON格式、XML、RDF以及其它格式。Jamison说,对于整个APA来说,“最重要的事是建立高度模块化的数据流管道。”

作者

Jack Vaughan
Jack Vaughan

TechTarget新闻记者和网站编辑,主要关注数据管理领域的技术趋势和动态。

相关推荐