10分钟掌握XML、JSON及其解析

  • 2022-07-22 21:51:13

引言

nokia 有句著名的广告语:“科技以人为本”。任何技术都是为了满足人的生产生活需要而产生的。具体到小小的一个手机,里面蕴含的技术也是浩如烟海,是几千年来人类科技的结晶,单个人穷其一生也未必能掌握其一角。不过个人一直认为基本的技术和思想是放之四海而皆准的,许多技术未必需要我们从头到尾再研究一遍,我们要做的就是站在巨人的肩膀上,利用其成果来为人们的需求服务。

随着移动互联网时代的大潮,越来越多的app不光是需要和网络服务器进行数据传输和交互,也需要和其他 app 进行数据传递。承担app与网络来进行传输和存储数据的一般是xml或者json。在移动互联网时代,xml和json很重要。

最近一段时间,个人综合了之前对xml、json的一些了解,参考了相关资料,再结合视频的代码,把自己的一些思考融入了这篇总结文档中,同时尝试用通俗诙谐的语言风格来阐述,期望能给感兴趣的读者带来帮助。

为了不和时代落伍,我们必须要学习 xml 和 json,但同时它们也很容易学习,let's start:–)

一、xml

xml即可扩展标记语言(extensible markup language)。标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如html,也可以使用象xml这样由相关人士***决定的标记语言,这就是语言的可扩展性。xml是从sgml中简化修改出来的。它主要用到的有xml、xsl和xpath等。

上面这段是对xml的一个基本定义,一个被广泛接受的说明。简单说,xml就是一种数据的描述语言,虽然它是语言,但是通常情况下,它并不具备常见语言的基本功能——被计算机识别并运行。只有依靠另一种语言,来解释它,使它达到你想要的效果或被计算机所接受。

记住以下几点就行了:

  • xml是一种标记语言,很类似html
  • xml的设计宗旨是传输数据,而非显示数据
  • xml标签没有被预定义。您需要自行定义标签。
  • xml被设计为具有自我描述性。
  • xml是w3c的推荐标准

总结:

xml是独立于软件和硬件的信息传输工具。 目前,xml在web中起到的作用不会亚于一直作为 web 基石的 html。 xml无所不在。xml是各种应用程序之间进行数据传输的最常用的工具,并且在信息存储和描述领域变得越来越流行。

1.1 xml属性

1.1.1 xml与html的主要差异

  • xml不是html的替代。
  • xml和html为不同的目的而设计。
  • xml被设计为传输和存储数据,其焦点是数据的内容。
  • html被设计用来显示数据,其焦点是数据的外观。
  • html旨在显示信息,而 xml 旨在传输信息

1.1.2 xml是不作为的。

也许这有点难以理解,但是xml不会做任何事情。xml被设计用来结构化、存储以及传输信息。

下面是john写给george的便签,存储为xml:

<note>
<to>george</to>
<from>john</from>
<heading>reminder</heading>
<body>don't forget the meeting!</body>
</note>

上面的这条便签具有自我描述性。它拥有标题以及留言,同时包含了发送者和接受者的信息。但是,这个 xml 文档仍然没有做任何事情。它仅仅是包装在xml标签中的纯粹的信息。我们需要编写软件或者程序,才能传送、接收和显示出这个文档。

1.1.3 xml仅仅是纯文本

xml没什么特别的。它仅仅是纯文本而已。有能力处理纯文本的软件都可以处理xml。 不过,能够读懂 xml 的应用程序可以有针对性地处理 xml 的标签。标签的功能性意义依赖于应用程序的特性。

1.1.4 xml允许自定义标签

上例中的标签没有在任何xml标准中定义过(比如和)。这些标签是由文档的创作者发明的。这是因为xml没有预定义的标签。

在html中使用的标签(以及html的结构)是预定义的。html文档只使用在html标准中定义过的标签(比如<p>,<h1> 等等)。

xml允许创作者定义自己的标签和自己的文档结构。

1.1.5 xml不是对html的替代

xml是对html的补充。

xml不会替代html,理解这一点很重要。在大多数 web 应用程序中,xml用于传输数据,而html用于格式化并显示数据。

1.2 xml的语法

xml的语法规则很简单,且很有逻辑。这些规则很容易学习,也很容易使用。

1.2.1 所有元素都必须有关闭标签

在xml中,省略关闭标签是非法的。所有元素都必须有关闭标签。 在html,经常会看到没有关闭标签的元素:

<p>this is a paragraph
<p>this is another paragraph

在xml中,省略关闭标签是非法的。所有元素都必须有关闭标签:

<p>this is a paragraph</p>
<p>this is another paragraph</p>

注释:您也许已经注意到xml声明没有关闭标签。这不是错误。声明不属于xml本身的组成部分。它不是xml元素,也不需要关闭标签。

1.2.2 xml标签对大小写敏感

xml元素使用xml标签进行定义。

xml标签对大小写敏感。在xml中,标签与标签是不同的。

必须使用相同的大小写来编写打开标签和关闭标签:

<message>这是错误的。</message>
<message>这是正确的。</message>

1.2.3 xml标签对大小写敏感

在 html 中,常会看到没有正确嵌套的元素:

<b><i>this text is bold and italic</b></i>

在 xml中,所有元素都必须彼此正确地嵌套:

<b><i>this text is bold and italic</i></b>

在上例中,正确嵌套的意思是:由于<i>元素是在<b>元素内打开的,那么它必须在<b>元素内关闭。

1.2.4 xml文档必须有根元素

xml文档必须有一个元素是所有其他元素的父元素。该元素称为根元素。

<root>
 <child>
 <subchild>.....</subchild>
 </child>
</root>

1.2.5 xml的属性值须加引号

与 html 类似,xml 也可拥有属性(名称/值的对)。 在 xml 中,xml 的属性值须加引号。请研究下面的两个 xml 文档。第一个是错误的,第二个是正确的:

<note date=08/08/2008>
<to>george</to>
<from>john</from>
</note> 

<note date="08/08/2008">
<to>george</to>
<from>john</from>
</note>

1.2.6 实体引用

在 xml 中,一些字符拥有特殊的意义。 如果你把字符 “<” 放在 xml 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。 这样会产生 xml 错误:

<message>if salary < 1000 then</message>

为了避免这个错误,请用实体引用来代替 “<” 字符:

<message>if salary < 1000 then</message>

在 xml 中,有 5 个预定义的实体引用:

< < 小于
> > 大于
& & 和号
' ' 单引号
" " 引号

注释:在 xml 中,只有字符 “<” 和 “&” 确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。

1.2.7 xml中的注释

在 xml 中编写注释的语法与 html 的语法很相似:

<!-- this is a comment -->

在 xml 中,空格会被保留 html 会把多个连续的空格字符裁减(合并)为一个:

html: hello   my name is david.

输出: hello my name is david. 在 xml 中,文档中的空格不会被删节。

1.2.8 以 lf 存储换行

在 windows 应用程序中,换行通常以一对字符来存储:回车符 (cr) 和换行符 (lf)。这对字符与打字机设置新行的动作有相似之处。在 unix 应用程序中,新行以 lf 字符存储。而 macintosh 应用程序使用cr来存储新行。

1.3 xml cdata

所有xml文档中的文本均会被解析器解析。

只有cdata区段(cdata section)中的文本会被解析器忽略。

1.3.1 pcdata

pcdata指的是被解析的字符数据(parsed character data)。

xml解析器通常会解析xml文档中所有的文本。 当某个xml元素被解析时,其标签之间的文本也会被解析:

<message>此文本也会被解析</message>

解析器之所以这么做是因为 xml 元素可包含其他元素,就像这个例子中,其中的元素包含着另外的两个元素(first和last):

<name><first>bill</first><last>gates</last></name>

而解析器会把它分解为像这样的子元素:

<name>
 <first>bill</first>
 <last>gates</last>
</name>

1.3.2 转义字符

非法的xml字符必须被替换为实体引用(entity reference)。

假如您在xml文档中放置了一个类似 “<” 字符,那么这个文档会产生一个错误,这是因为解析器会把它解释为新元素的开始。因此你不能这样写:

<message>if salary < 1000 then</message>

为了避免此类错误,需要把字符 “<” 替换为实体引用,就像这样:

<message>if salary < 1000 then</message>

在 xml 中有 5 个预定义的实体引用:

< < 小于
> > 大于
& & 和号
' ' 省略号
" " 引号

注释:严格地讲,在xml中仅有字符”<“和”&“是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。

1.3.3 cdata

术语cdata指的是不应由xml解析器进行解析的文本数据(unparsed character data)。

在 xml 元素中,”<“ 和 ”&“ 是非法的。

“<” 会产生错误,因为解析器会把该字符解释为新元素的开始。 “&” 也会产生错误,因为解析器会把该字符解释为字符实体的开始。

某些文本,比如 javascript 代码,包含大量 “<” 或 “&” 字符。为了避免错误,可以将脚本代码定义为 cdata。 cdata 部分中的所有内容都会被解析器忽略。 cdata 部分由 “<![cdata[” 开始,由 “]]>” 结束:

<?xml version="1.0" encoding="utf-8"?>
<response> 
 <header> 
 <respcode>0</respcode> 
 <total>1736</total> 
 </header> 
 <result> 
 <album> 
  <album_id>320305900</album_id> 
  <title> <![cdata[ 电影侃侃之初恋永不早 ]]> </title> 
  <tag> <![cdata[ 18岁以上 当代 暧昧 华语 ]]> </tag> 
  <img>http://pic9.qiyipic.com/image/20141016/ec/e0/v_108639906_m_601_120_160.jpg</img> 
  <img180236>http://pic9.qiyipic.com/image/20141016/ec/e0/v_108639906_m_601_180_236.jpg</img180236> 
  <img11577>http://pic9.qiyipic.com/image/20141016/ec/e0/v_108639906_m_601_115_77.jpg</img11577> 
  <img220124>http://pic9.qiyipic.com/image/20141016/ec/e0/v_108639906_m_601_284_160.jpg</img220124> 
  <category_id>1</category_id> 
  <score>0.0</score> 
  <voters>0</voters> 
  <tv_sets>0</tv_sets> 
  <duration>00:38:57</duration> 
  <year> <![cdata[ 2014 ]]> </year> 
  <tv_focus>跟爱情片学把妹心经</tv_focus> 
  <episode_count>1</episode_count> 
  <directors> <![cdata[ 关雅荻 ]]> </directors> 
  <mainactors> <![cdata[ 关雅荻 ]]> </mainactors> 
  <actors> <![cdata[ ]]> </actors> 
  <vv2> <![cdata[ 15 ]]> </vv2> 
  <timetext> <![cdata[ 今天 ]]> </timetext> 
  <first_issue_time> <![cdata[ 2014-10-16 ]]> </first_issue_time> 
  <up>0</up> 
  <down>0</down> 
  <download>1</download> 
  <purchase_type>0</purchase_type> 
  <hot_or_new>0</hot_or_new> 
  <createtime>2014-10-16 12:25:08</createtime> 
  <purchase>0</purchase> 
  <desc> <![cdata[
本期节目主持人介绍新近上映的口碑爱情片,。主持人轻松幽默的罗列出胡鳄鱼导演拍摄的爱情片越来越接地气,博得观众的认同和追捧,更提出“初恋永远不嫌早”的口号。观众可以跟着爱情片学习把妹心经。
]]> </desc> 
  <ip_limit>1</ip_limit> 
  <episodes/> 
 </album> 
 </result> 
</response>

这是展示一部电影的具体数据,包括标题、介绍、内容、导演、演员、时长、上映年份等很多内容。

1.5 xml树结构

xml文档形成了一种树结构,它从“根部”开始,然后扩展到“枝叶”。

1.5.1 一个xml文档实例

xml使用简单的具有自我描述性的语法:

<?xml version="1.0" encoding="iso-8859-1"?>
<note>
<to>george</to>
<from>john</from>
<heading>reminder</heading>
<body>don't forget the meeting!</body>
</note>

第一行是xml声明。它定义xml的版本(1.0)和所使用的编码(iso-8859-1=latin-1/西欧字符集)。

下一行描述文档的根元素(像在说:“本文档是一个便签”):

<note>

接下来 4 行描述根的 4 个子元素(to, from, heading 以及 body):

<to>george</to>
<from>john</from>
<heading>reminder</heading>
<body>don't forget the meeting!</body>

最后一行定义根元素的结尾:

</note>

从本例可以设想,该xml文档包含了john给george的一张便签。

xml具有出色的自我描述性,你同意吗?
xml文档形成一种树结构
xml文档必须包含根元素。该元素是所有其他元素的父元素。
xml文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。

所有元素均可拥有子元素:

<root>
 <child>
 <subchild>.....</subchild>
 </child>
</root>

父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。

所有元素均可拥有文本内容和属性(类似html中)。

1.6 xml dom

想到这里,大家都有点迫不及待了,xml 文件到底如何解析呢?

但是,别急,让子弹先飞会儿:–)

在xml解析之前,我们必须系统性的学习一下 xml dom 知识:

1.6.1 定义

xml dom(xml document object model) 定义了访问和操作xml文档的标准方法。

dom把xml文档作为树结构来查看。能够通过dom树来访问所有元素。可以修改或删除它们的内容,并创建新的元素。元素,它们的文本,以及它们的属性,都被认为是节点。

xml dom是:

  • 用于xml的标准对象模型
  • 用于xml的标准编程接口
  • 中立于平台和语言
  • w3c的标准

xml dom定义了所有xml元素的对象和属性,以及访问它们的方法(接口)。

换句话说:

xml dom是用于获取、更改、添加或删除xml元素的标准

dom将xml文档作为一个树形结构,而树叶被定义为节点。

1.6.2 总结

xml dom其实比较复杂,在这么短的篇幅里也无法一一进行讲解。想详细了解xml dom可以好好去学习下

1.7 xml如何解析?

上面讲了这么多关于xml的东西,那么xml文件应该如何解析呢?

终于到了我们的重头戏了

下面以视频项目为例,展示如何解析xml文件:

1.7.1 step 1

xml文件是一棵树,首先需要找到对应的节点,然后从节点开始解析,比如搜索找到的就是result/weights/weight 和result/weights/weight 2个节点,分别从这个开始解析:

public resultinfo onparser(element rootelement) {
 int resp = -1;
 try {
  string elname = "header/respcode";
  resp = integer.parseint(selectnodestring(rootelement, elname));
 } catch (numberformatexception e) {
  e.printstacktrace();
 }

 log.d(tag, "resp= " + resp);

 if (resp != 0) {
  return null;
 }

 resultinfo searchresultinfo = new resultinfo();

 // parse search weight
 @suppresswarnings("rawtypes")
 final list weights = rootelement.selectnodes(rootelement.getpath() + "/"
   + "result/weights/weight");

 resultinfo[] resultfilterinfos = parsevideos(weights);
 if (resultfilterinfos != null) {
  resultinfo weight = new resultinfo();
  weight.putresultinfoarray(resultinfo.key_videos, resultfilterinfos);
  searchresultinfo.putresultinfo(resultinfo.key_weight, weight);
 }

 // parse albums
 @suppresswarnings("rawtypes")
 final list albums = rootelement.selectnodes(rootelement.getpath() + "/"
   + "result/albums/album");

 resultinfo[] resultinfos = parsevideos(albums);
 if (resultinfos != null) {
  resultinfo album = new resultinfo();
  album.putresultinfoarray(resultinfo.key_videos, resultinfos);
  searchresultinfo.putresultinfo(resultinfo.key_search, album);
 }

 return searchresultinfo;
}

1.7.2 step 2

 找到了对应的node,即从对应的node开始递归的查找,直到找到最小的节点,也就是最基本的单元element。再对每一个element进行解析:

private resultinfo[] parsevideos(final list nodes) {
 if (nodes != null && nodes.size() > 0) {
  final int size = nodes.size();
  final resultinfo[] vis = new resultinfo[size];
  int i = 0;
  for (object o : nodes) {
   if (o instanceof element) {
    final element videoelement = (element) o;
    resultinfo vi = parsevideo(videoelement);
    vis[i] = vi;
   }
   i++;
  }
  return vis;
 }
 return null;
}

1.7.3 step 3

 针对获取到的element,解析出对应的string将数据传递给videoinfo这个类:

private resultinfo parsevideo(final element videoelement) {
 final string id = videoelement.elementtext("album_id");
 final string title = videoelement.elementtext("title");
 final string categoryid = videoelement.elementtext("category_id");
 final string categoryname = videoelement.elementtext("category_name");
 final string count = videoelement.elementtext("count");
 final string imgurl = videoelement.elementtext("img180236");
 final string duration = videoelement.elementtext("duration");
 final string mainactors = videoelement.elementtext("mainactors");
 final string sitename = videoelement.elementtext("site_name");
 final string videourl = videoelement.elementtext("vedio_url");
 final string sort = videoelement.elementtext("sort");
 final string tv_id = videoelement.elementtext("tv_id");
 resultinfo vi = new resultinfo();
 vi.putstring(videoinfo.id, id);
 vi.putstring(videoinfo.title, title);
 vi.putstring(videoinfo.category_id, categoryid);
 vi.putstring(videoinfo.category_name, categoryname);
 vi.putstring(videoinfo.count, count);
 vi.putstring(videoinfo.img_url, imgurl);
 vi.putstring(videoinfo.duration, duration);
 vi.putstring(videoinfo.mainactors, mainactors);
 vi.putstring(videoinfo.sitename, sitename);
 vi.putstring(videoinfo.videourl, videourl);
 vi.putstring(videoinfo.sort, sort);
 vi.putstring(videoinfo.tv_id, tv_id);
 return vi;
}

1.7.4 step 4

 当使用xml解析器将xml数据解析出来之后。需要将这些数据提取出来,也是通过连续2层提取,将数据定位到每个video, 将每个video里的数据传递给searchvideoinfo这个arraylist,然后将arraylist中的数据和对应的adapter数据关联起来:

public static arraylist<searchvideoinfo> getsearchvideoinfo(resultinfo searchresultinfo) {

 resultinfo resultinfo = null;
 resultinfo[] videos = null;
 arraylist<searchvideoinfo> searchvideoinfos = null;

 if (searchresultinfo != null) {
  resultinfo = searchresultinfo.getresultinfo(resultinfo.key_search);
 }

 if (resultinfo != null) {
  videos = resultinfo.getresultinfoarray(resultinfo.key_videos);
 }

 if (videos != null && videos.length > 0) {

  searchvideoinfos = new arraylist<searchvideoinfo>(videos.length);

  for (resultinfo video : videos) {
   searchvideoinfo searchinfo = new searchvideoinfo();

   searchinfo.setalbum_id(video.getstring(videoinfo.id));
   searchinfo.settitle(video.getstring(videoinfo.title));
   searchinfo.setchannel_id(video.getstring(videoinfo.category_id));
   searchinfo.setimgurl(video.getstring(videoinfo.img_url));
   searchinfo.setduration(video.getstring(videoinfo.duration));
   searchinfo.setmainactors(video.getstring(videoinfo.mainactors));
   searchinfo.setsitename(video.getstring(videoinfo.sitename));
   searchinfo.setvideo_url(video.getstring(videoinfo.videourl));
   searchinfo.setorder(video.getstring(videoinfo.sort));
   searchinfo.settv_id(video.getstring(videoinfo.tv_id));
   // searchinfo.setcontinuetype(video.getstring(videoinfo.continuetype));

   searchvideoinfos.add(searchinfo);
  }
 }

 if (searchvideoinfos == null) {
  mylog.e(tag, "error, getsearchvideoinfo, can not get info");
 }

 return searchvideoinfos;
}
以上就是搜索数据的xml的解析和数据展示过程。

二、json

xml很好很强大,但是最近有另外一个时代弄潮儿,这就是json。现在json的光环已经逐渐超越了xml,各大网站提供的数据接口一般都是json。下面我们就来学习下json。

2.1 json是什么?

json:javascript对象表示法(javascript object notation), 是一种轻量级的数据交换格式, 易于人阅读和编写, 同时也易于机器解析和生成。

json是存储和交换文本信息的语法,类似xml。

json采用完全独立于语言的文本格式,但是也使用了类似于c语言家族的习惯(包括c, c++, c#, java, javascript, perl, python等)。 这些特性使json成为理想的数据交换语言

2.2 json格式

json构建于两种结构:

  1. “名称/值”对的集合(a collection of name/value pairs)。不同的语言中,它被理解为对象(object),纪录(record),结构(struct),字典(dictionary),哈希表(hash table),有键列表(keyed list),或者关联数组(associative array)。
  2. 值的有序列表(an ordered list of values)。在大多数语言中,它被理解为数组(array)、矢量(vector), 列表(list)或者是序列(sequence)。

json具有以下这些形式:

  • 对象是一个无序的“'名称/值'对”集合。一个对象以“{”(左括号)开始,“}”(右括号)结束。每个“名称”后跟一个“:”(冒号);“‘名称/值' 对”之间使用“,”(逗号)分隔。

10分钟掌握XML、JSON及其解析

数组是值(value)的有序集合。一个数组以“[”(左中括号)开始,“]”(右中括号)结束。值之间使用“,”(逗号)分隔。
json array

10分钟掌握XML、JSON及其解析

值(value)可以是双引号括起来的字符串(string)、数值(number)、true、false、 null、对象(object)或者数组(array)。这些结构可以嵌套。

10分钟掌握XML、JSON及其解析

字符串(string)是由0到多个unicode字符组成的序列,封装在双引号(”“)中, 可以使用反斜杠(‘\')来进行转义。一个字符可以表示为一个单一字符的字符串。

10分钟掌握XML、JSON及其解析

数字(number)类似c或者java里面的数,没有用到的8进制和16进制数除外。

10分钟掌握XML、JSON及其解析

2.3 举个例子

上面关于json讲了这么多,大家都表示一头雾水了吧?

没关系,我们来举个栗子,让大家有个直观的感受:–)

以目前视频使用的iqiyi提供的频道接口为例:

iqiyi提供的电影频道的json电影数据如下:

"code": 1, 
 "data": 0, 
 "albumidlist": [
   {
     "totalidnum": 2000, 
     "idlist": [
       "319281600"
     ]
   }
 ], 
 "albumarray": {
   "319281600": {
     "_as": "", 
     "_blk": 0, 
     "_cid": 1, 
     "_ct": "2014-10-10 17:55:06", 
     "_da": "", 
     "_dl": 0, 
     "_dn": "7296", 
     "_id": 319281600, 
     "_img": "http://pic2.qiyipic.com/image/20141016/19/ca/v_108628048_m_601_m1_120_160.jpg", 
     "_ip": 1, 
     "_ma": "", 
     "_pc": 2, 
     "_pid": 0, 
     "_reseftv": 959, 
     "_t": "末代***", 
     "_tvct": 1, 
     "_tvs": 1, 
     "_vt": 0, 
     "a_av": 1, 
     "a_pro": "", 
     "bpt": "0", 
     "clm": "", 
     "cn_year": "0", 
     "co_album_id": "0", 
     "ctype": 0, 
     "desc": "", 
     "down": 0, 
     "down2": "0", 
     "drm": 0, 
     "fst_time": "2014-10-16", 
     "h1_img": "http://pic2.qiyipic.com/image/20141016/19/ca/v_108628048_m_601_m1_180_236.jpg", 
     "h2_img": "http://pic2.qiyipic.com/image/20141016/19/ca/v_108628048_m_601_m1_195_260.jpg", 
     "is_h": 0, 
     "is_n": 0, 
     "is_zb": 0, 
     "k_word": "", 
     "language": 0, 
     "live_center": 0, 
     "live_start_time": 0, 
     "live_stop_time": 0, 
     "logo": 1, 
     "m_av": 1, 
     "p_av": 1, 
     "p_s": 0, 
     "p_s_1": 0, 
     "p_s_4": 0, 
     "p_s_8": 0, 
     "qiyi_pro": 0, 
     "qiyi_year": "0", 
     "qt_id": "1005722", 
     "s_tt": "", 
     "songname": "", 
     "t_pc": 1, 
     "tag": "当代 美国 乡村 大片", 
     "tv_eftv": 1, 
     "tv_pha": "", 
     "tv_pro": "", 
     "tv_ss": "", 
     "tvfcs": "雄心壮志背后的真相", 
     "up": 0, 
     "up2": "0", 
     "upcl": "", 
     "v2_img": "http://pic2.qiyipic.com/image/20141016/19/ca/v_108628048_m_601_m1_284_160.jpg", 
     "v3_img": "http://pic2.qiyipic.com/image/20141016/19/ca/v_108628048_m_601_m1_480_270.jpg", 
     "vv": "1", 
     "year": "2007", 
     "tv_id": "0", 
     "vv_p": 0, 
     "vv_f": 2, 
     "vv_m": 0, 
     "_sc": 8
   }
 }, 
 "changealbum": null, 
 "category": null, 
 "before": "2~4~1~7~3", 
 "latest_push_id": "655", 
 "up_tm": "1413441370874", 
 "recommend_attach": "", 
 "preset_keys": null, 
 "category_group": null, 
 "exp_ts": 120, 
 "stfile_path": "/data/view/online5/0/1/2.1.8.5.1.txt"
}

从上面的例子可以很清晰的看出json是如何展示一个电影的数据的,当然这是json格式化之后的数据。json的元数据是不便于阅读的。

2.4 如何解析json?

android json所有相关类,都在org.json包下。

包括jsonobject、jsonarray、jsonstringer、jsontokener、jsonwriter、jsonexception。

<1>. 常见方法

目前json解析有2种方法,分别是get和opt方法,可以使用json

那么使用get方法与使用opt方法的区别是?

jsonobject方法,opt与get建议使用opt方法,因为get方法如果其内容为空会直接抛出异常。不过jsonarray.opt(index)会有越界问题需要特别注意。

opt、optboolean、optdouble、optint、optlong、optstring、optjsonarray、optjsonobject get、getboolean、getdouble、getint、getlong、getstring、getjsonarray、getjsonobject

<2>. android中如何创建json?

在android中应该如何创建json呢?

下面展示了一个如何创建json的例子:

private string createjson() throws jsonexception {
 jsonobject jsonobject = new jsonobject();
 jsonobject.put("intkey", 123);
 jsonobject.put("doublekey", 10.1);
 jsonobject.put("longkey", 666666666);
 jsonobject.put("stringkey", "lalala");
 jsonobject.put("booleankey", true);

 jsonarray jsonarray = new jsonarray();
 jsonarray.put(0, 111);
 jsonarray.put("second");
 jsonobject.put("arraykey", jsonarray);

 jsonobject innerjsonobject = new jsonobject();
 innerjsonobject.put("innerstr", "inner");
 jsonobject.put("innerobjectkey", innerjsonobject);

 log.e("json", jsonobject.tostring());

 return jsonobject.tostring();
}

其输出结果如下所示:

{"intkey":123, "doublekey":10.1, "longkey":666666666, "stringkey":"lalala", "booleankey":true, "arraykey":[111,"second"], "innerobjectkey":{"innerstr":"inner"}}

<3>. 如何解析json?

下面以视频中解析iqiyi的每个视频album数据为例来说明如何解析json:

第一步,需要从网络服务器上发起请求,获取到json数据:

jsonobjectrequest jsonobjrequest = new jsonobjectrequest(request.method.get, url, null,
  new response.listener<jsonobject>() {
   @override
   public void onresponse(jsonobject response) {
    try {
     mylog.d(tag, "response=" + response);
     parseiqiyiinterfaceresponse(response);
    } catch (exception e) {
     e.printstacktrace();
    }
   }
  }, new response.errorlistener() {
   @override
   public void onerrorresponse(volleyerror error) {
    /*
     * if (error instanceof networkerror) { } else if (error
     * instanceof clienterror) { } else if (error instanceof
     * servererror) { } else if (error instanceof
     * authfailureerror) { } else if (error instanceof
     * parseerror) { } else if (error instanceof
     * noconnectionerror) { } else if (error instanceof
     * timeouterror) { }
     */
    mylog.e(tag, "onerrorresponse, error=" + error);
   }
  }) {
 @override
 public map<string, string> getheaders() throws authfailureerror {
  hashmap<string, string> headers = new hashmap<string, string>();
  headers.put("t", iqiyiinterface.getencrypttimestamp());
  headers.put("sign", iqiyiinterface.getsign());

  return headers;
 }
};

第二步,获取到对应的对应的jsonobject数据:

public void getjsonobjectstring(string url) {
 mqueue = videoapplication.getinstance().getrequestqueue();

 jsonobjectrequest jsobjrequest = new jsonobjectrequest(request.method.get, url, null,

 new response.listener<jsonobject>() {

  @override
  public void onresponse(jsonobject response) {
   mylog.e(tag, "response = " + response.tostring());

   jsonarray jsonarray = null;
   jsonobject jsonobject = null;
   try {
    jsonobject = response.getjsonobject("response");
    jsonarray = jsonobject.getjsonobject("result").getjsonarray("album");
   } catch (jsonexception e) {
    e.printstacktrace();
   }

   if (jsonarray == null) {
    return;
   }

   mchannellist = videoutils.parsevideojsonarray(jsonarray);

   if (isloading) {
    isloading = false;
    if (misgrid) {
     mchannelgridadapter.appendchannelvideoinfo(mchannellist);
    } else {
     mchannellistadapter.appendchannelvideoinfo(mchannellist);
    }

   } else {
    if (misgrid) {
     mchannelgridadapter.setchannelvideoinfo(mchannellist);
     showoppogrid();
    } else {
     mchannellistadapter.setchannelvideoinfo(mchannellist);
     showoppolist();
    }
   }
  }
 }, new response.errorlistener() {

  @override
  public void onerrorresponse(volleyerror error) {
   mylog.e(tag, "error = " + error);
  }
 });

 jsobjrequest.settag(tag);
 jsobjrequest.setshouldcache(true);
 mqueue.add(jsobjrequest);
 mqueue.start();
}

获取到json object之后,就对这个jsonobject进行解析:

private arraylist<videoconstant> parsevideoalbumjsonobject(jsonobject albumjsonobject, arraylist<integer> albumidjsonarraylist) {
 mylog.d(tag, "parsevideoalbumjsonobject, length=" + albumjsonobject.length());
 if (albumjsonobject.length() < 1) {
  return null;
 }

 arraylist<videoconstant> videos = new arraylist<videoconstant>();

 try {
  for (int index = 0; index < albumjsonobject.length(); index++) {
   videoconstant video = new videoconstant();

   jsonobject itemjsonobject;

   itemjsonobject = albumjsonobject.getjsonobject(albumidjsonarraylist.get(index)
     .tostring());

   mylog.d(tag, "string=" + albumidjsonarraylist.get(index).tostring());

   video.malbumid = itemjsonobject.optstring(interfaceparametername.id);
   video.matitle = itemjsonobject.optstring(interfaceparametername.title);
   video.mepisodecount = itemjsonobject.optstring(interfaceparametername.update_set);
   video.mtvsets = itemjsonobject.optstring(interfaceparametername.tv_sets);
   video.mdesc = itemjsonobject.optstring(interfaceparametername.description);
   video.mcid = itemjsonobject.optstring(interfaceparametername.category_id);

   video.mimg = itemjsonobject.optstring(interfaceparametername.img);
   video.mhighimg = itemjsonobject
     .optstring(interfaceparametername.high_reso_port_img);
   video.mhoriimg = itemjsonobject
     .optstring(interfaceparametername.high_reso_hori_img);

   video.mscore = itemjsonobject.optstring(interfaceparametername.score);
   video.mmainactors = itemjsonobject.optstring(interfaceparametername.main_actor);

   video.mcreatetime = itemjsonobject.optstring(interfaceparametername.create_time);

   video.mduration = itemjsonobject.optstring(interfaceparametername.duration);

   video.mtag = itemjsonobject.optstring(interfaceparametername.tag);

   mylog.d(tag, "id=" + video.malbumid + ",title=" + video.malbumtitle + ",img="
     + video.mhighimg + ",tvsets=" + video.mtvsets);

   videos.add(video);
  }
 } catch (jsonexception e) {
  e.printstacktrace();
 }

 return videos;
}

<4>. android json解析库

上面介绍都是使用android提供的原生类解析json,最大的好处是项目不需要引入第三方库,但是如果比较注重开发效率而且不在意应用大小增加几百k的话,有以下json可供选择:

  1. jackson
  2. json-lib

大家可以去对应的官网下载并学习:)

三、 json vs. xml

json和xml就像武林界的屠龙刀和倚天剑,那么他们孰强孰弱?

xml长期执数据传输界之牛耳,而json作为后起之秀,已经盟主发起了挑战。

那就让他们来进行pk一下:

<1>. json相比xml的不同之处

没有结束标签
更短
读写的速度更快
能够使用内建的 javascript eval() 方法进行解析
使用数组
不使用保留字
总之: json 比 xml 更小、更快,更易解析。

<2>. xml和json的区别:

xml的主要组成成分:

xml是element、attribute和element content。

json的主要组成成分:

json是object、array、string、number、boolean(true/false)和null。

xml要表示一个object(指name-value pair的集合),最初可能会使用element作为object,每个key-value pair 用 attribute 表示:

<student name="john" age="10"/>

但如个某个 value 也是 object,那么就不可以当作attribute:

<student name="john" age="10">
 <address>
  <country>china</country>
  <province>guang dong</province>
  <city>...</city>
  <district>...</district>
  ...
 </address>
</student>

那么,什么时候用element,什么时候用attribute,就已经是一个问题了。

而json因为有object这种类型,可以自然地映射,不需考虑上述的问题,自然地得到以下的格式。

{
 "name": "john",
 "age" : 10,
 "address" : {
  "country" : "china",
  "province" : "guang dong",
  "city" : "..",
  "district" : "..",
  ...
 }
}

one more thing…

xml需要选择怎么处理element content的换行,而json string则不须作这个选择。

xml只有文字,没有预设的数字格式,而json则有明确的number格式,这样在locale上也安全。

xml映射数组没大问题,就是数组元素tag比较重复冗余。json 比较易读。

json的true/false/null也能容易统一至一般编程语言的对应语义。

xml文档可以附上dtd、schema,还有一堆的诸如xpath之类规范,使用自定义xml元素或属性,能很方便地给数据附加各种约束条件和关联额外信息,从数据表达能力上看,xml强于json,但是很多场景并不需要这么复杂的重量级的东西,轻便灵活的json就显得很受欢迎了。

打个比方,如果完成某件事有两种方式:一种简单的,一个复杂的。你选哪个?

我只想杀只鸡罢了,用得着牛刀?

json与xml相比就是这样的。

四、总结

这篇文章只是对xml和json这2种目前主流使用的数据格式进行了解释,并系统的学习了其中的语法及如何进行解析,同时在最好针对xml和json做了对比,了解其不同点和各自的优势。

期望有需要的朋友有所帮助:–)

猜你喜欢