PHP将汉字转换成拼音的操作类

<?php

class pinyin{
/**
* 将字符串转化为拼音
* EDIT.JENA.20111213
*/
public static function _($_String, $_Code=’gb2312′) {
$_DataKey =”a|ai|an|ang|ao|ba|bai|ban|bang|bao|bei|ben|beng|bi|bian|biao|bie|bin|bing|bo|bu|ca|cai|can|cang|cao|ce|ceng|cha”.
“|chai|chan|chang|chao|che|chen|cheng|chi|chong|chou|chu|chuai|chuan|chuang|chui|chun|chuo|ci|cong|cou|cu|”.
“cuan|cui|cun|cuo|da|dai|dan|dang|dao|de|deng|di|dian|diao|die|ding|diu|dong|dou|du|duan|dui|dun|duo|e|en|er”.
“|fa|fan|fang|fei|fen|feng|fo|fou|fu|ga|gai|gan|gang|gao|ge|gei|gen|geng|gong|gou|gu|gua|guai|guan|guang|gui”.
“|gun|guo|ha|hai|han|hang|hao|he|hei|hen|heng|hong|hou|hu|hua|huai|huan|huang|hui|hun|huo|ji|jia|jian|jiang”.
“|jiao|jie|jin|jing|jiong|jiu|ju|juan|jue|jun|ka|kai|kan|kang|kao|ke|ken|keng|kong|kou|ku|kua|kuai|kuan|kuang”.
“|kui|kun|kuo|la|lai|lan|lang|lao|le|lei|leng|li|lia|lian|liang|liao|lie|lin|ling|liu|long|lou|lu|lv|luan|lue”.
“|lun|luo|ma|mai|man|mang|mao|me|mei|men|meng|mi|mian|miao|mie|min|ming|miu|mo|mou|mu|na|nai|nan|nang|nao|ne”.
“|nei|nen|neng|ni|nian|niang|niao|nie|nin|ning|niu|nong|nu|nv|nuan|nue|nuo|o|ou|pa|pai|pan|pang|pao|pei|pen”.
“|peng|pi|pian|piao|pie|pin|ping|po|pu|qi|qia|qian|qiang|qiao|qie|qin|qing|qiong|qiu|qu|quan|que|qun|ran|rang”.
“|rao|re|ren|reng|ri|rong|rou|ru|ruan|rui|run|ruo|sa|sai|san|sang|sao|se|sen|seng|sha|shai|shan|shang|shao|”.
“she|shen|sheng|shi|shou|shu|shua|shuai|shuan|shuang|shui|shun|shuo|si|song|sou|su|suan|sui|sun|suo|ta|tai|”.
“tan|tang|tao|te|teng|ti|tian|tiao|tie|ting|tong|tou|tu|tuan|tui|tun|tuo|wa|wai|wan|wang|wei|wen|weng|wo|wu”.
“|xi|xia|xian|xiang|xiao|xie|xin|xing|xiong|xiu|xu|xuan|xue|xun|ya|yan|yang|yao|ye|yi|yin|ying|yo|yong|you”.
“|yu|yuan|yue|yun|za|zai|zan|zang|zao|ze|zei|zen|zeng|zha|zhai|zhan|zhang|zhao|zhe|zhen|zheng|zhi|zhong|”.
“zhou|zhu|zhua|zhuai|zhuan|zhuang|zhui|zhun|zhuo|zi|zong|zou|zu|zuan|zui|zun|zuo”;

$_DataValue = “-20319|-20317|-20304|-20295|-20292|-20283|-20265|-20257|-20242|-20230|-20051|-20036|-20032|-20026|-20002|-19990″.
“|-19986|-19982|-19976|-19805|-19784|-19775|-19774|-19763|-19756|-19751|-19746|-19741|-19739|-19728|-19725″.
“|-19715|-19540|-19531|-19525|-19515|-19500|-19484|-19479|-19467|-19289|-19288|-19281|-19275|-19270|-19263″.
“|-19261|-19249|-19243|-19242|-19238|-19235|-19227|-19224|-19218|-19212|-19038|-19023|-19018|-19006|-19003″.
“|-18996|-18977|-18961|-18952|-18783|-18774|-18773|-18763|-18756|-18741|-18735|-18731|-18722|-18710|-18697″.
“|-18696|-18526|-18518|-18501|-18490|-18478|-18463|-18448|-18447|-18446|-18239|-18237|-18231|-18220|-18211″.
“|-18201|-18184|-18183|-18181|-18012|-17997|-17988|-17970|-17964|-17961|-17950|-17947|-17931|-17928|-17922″.
“|-17759|-17752|-17733|-17730|-17721|-17703|-17701|-17697|-17692|-17683|-17676|-17496|-17487|-17482|-17468″.
“|-17454|-17433|-17427|-17417|-17202|-17185|-16983|-16970|-16942|-16915|-16733|-16708|-16706|-16689|-16664″.
“|-16657|-16647|-16474|-16470|-16465|-16459|-16452|-16448|-16433|-16429|-16427|-16423|-16419|-16412|-16407″.
“|-16403|-16401|-16393|-16220|-16216|-16212|-16205|-16202|-16187|-16180|-16171|-16169|-16158|-16155|-15959″.
“|-15958|-15944|-15933|-15920|-15915|-15903|-15889|-15878|-15707|-15701|-15681|-15667|-15661|-15659|-15652″.
“|-15640|-15631|-15625|-15454|-15448|-15436|-15435|-15419|-15416|-15408|-15394|-15385|-15377|-15375|-15369″.
“|-15363|-15362|-15183|-15180|-15165|-15158|-15153|-15150|-15149|-15144|-15143|-15141|-15140|-15139|-15128″.
“|-15121|-15119|-15117|-15110|-15109|-14941|-14937|-14933|-14930|-14929|-14928|-14926|-14922|-14921|-14914″.
“|-14908|-14902|-14894|-14889|-14882|-14873|-14871|-14857|-14678|-14674|-14670|-14668|-14663|-14654|-14645″.
“|-14630|-14594|-14429|-14407|-14399|-14384|-14379|-14368|-14355|-14353|-14345|-14170|-14159|-14151|-14149″.
“|-14145|-14140|-14137|-14135|-14125|-14123|-14122|-14112|-14109|-14099|-14097|-14094|-14092|-14090|-14087″.
“|-14083|-13917|-13914|-13910|-13907|-13906|-13905|-13896|-13894|-13878|-13870|-13859|-13847|-13831|-13658″.
“|-13611|-13601|-13406|-13404|-13400|-13398|-13395|-13391|-13387|-13383|-13367|-13359|-13356|-13343|-13340″.
“|-13329|-13326|-13318|-13147|-13138|-13120|-13107|-13096|-13095|-13091|-13076|-13068|-13063|-13060|-12888″.
“|-12875|-12871|-12860|-12858|-12852|-12849|-12838|-12831|-12829|-12812|-12802|-12607|-12597|-12594|-12585″.
“|-12556|-12359|-12346|-12320|-12300|-12120|-12099|-12089|-12074|-12067|-12058|-12039|-11867|-11861|-11847″.
“|-11831|-11798|-11781|-11604|-11589|-11536|-11358|-11340|-11339|-11324|-11303|-11097|-11077|-11067|-11055″.
“|-11052|-11045|-11041|-11038|-11024|-11020|-11019|-11018|-11014|-10838|-10832|-10815|-10800|-10790|-10780″.
“|-10764|-10587|-10544|-10533|-10519|-10331|-10329|-10328|-10322|-10315|-10309|-10307|-10296|-10281|-10274″.
“|-10270|-10262|-10260|-10256|-10254″;
$_TDataKey = explode(‘|’, $_DataKey);
$_TDataValue = explode(‘|’, $_DataValue);

//array_combine:创建一个数组,用一个数组的值作为其键名,另一个数组的值作为其值
//PHP_VERSION:表示PHP的版本
$_Data = (PHP_VERSION>=’5.0′) ? array_combine($_TDataKey, $_TDataValue) : self::_Array_Combine($_TDataKey, $_TDataValue);
//arsort:对数组进行逆向排序并保持索引关系
//reset:将数组的内部指针指向第一个单元
arsort($_Data);
reset($_Data);

if($_Code != ‘gb2312′) $_String = self::_U2_Utf8_Gb($_String);#假如编码不是gb2312,则启用utf-8
$_Res = ”;
for($i=0; $i<strlen($_String); $i++) {
$_P = ord(substr($_String, $i, 1));
if($_P>160) {
$_Q = ord(substr($_String, ++$i, 1));
$_P = $_P*256 + $_Q – 65536;
}
$_Res .= self::_Pinyin($_P, $_Data);
}
return preg_replace(“/[^a-z0-9]*/i”, ”, $_Res);
}

private static function _Pinyin($_Num, $_Data) {
if($_Num>0 && $_Num<160 )
return chr($_Num);
elseif($_Num<-20319 || $_Num>-10247)
return ”;
else {
foreach($_Data as $k=>$v) {
if($v<=$_Num)
break;
}
return $k;
}
}

private static function _U2_Utf8_Gb($_C) {
$_String = ”;
if($_C < 0×80) {
$_String .= $_C;
}
elseif($_C < 0×800) {
$_String .= chr(0xC0 | $_C>>6);
$_String .= chr(0×80 | $_C & 0x3F);
}
elseif($_C < 0×10000) {
$_String .= chr(0xE0 | $_C>>12);
$_String .= chr(0×80 | $_C>>6 & 0x3F);
$_String .= chr(0×80 | $_C & 0x3F);
}
elseif($_C < 0×200000) {
$_String .= chr(0xF0 | $_C>>18);
$_String .= chr(0×80 | $_C>>12 & 0x3F);
$_String .= chr(0×80 | $_C>>6 & 0x3F);
$_String .= chr(0×80 | $_C & 0x3F);
}
return @iconv(‘UTF-8′, ‘GB2312//IGNORE’, $_String);
}

/**
* 等价PHP5版本的array_combine函数
*/
private static function _Array_Combine($_Arr1, $_Arr2) {
for($i=0; $i<count($_Arr1); $i++) $_Res[$_Arr1[$i]] = $_Arr2[$i];
return $_Res;
}
}
?>

点击下载cls_pinyin

Linux下安装ZendOptimizer3.3.9后页面无法显示〔已解决〕

ZendOptimizer发布了新版本3.3.9 for Linux,于是乎及时跟进。

症状:成功安装后,phpinfo()显示正常,但是网站页面却打不开,显示“访问的页面不存在或输入网址有误,请确认” 。

解决方案:与已安装APC缓存模块有冲突,设置apc.enabled = 0,问题解决。

参考资料:http://kb.zend.com/index.php?View=entry&EntryID=150

php ini_set post_max_size,upload_max_filesize修改方法

ini_set(‘max_execution_time’,’10′);
ini_set(‘memory_limit’,’1024M’);
echo ‘max_execution_time = ‘ . ini_get(‘max_execution_time’) ;
echo ‘memory_limit = ‘ . ini_get(‘memory_limit’) ;
echo ‘post_max_size = ‘ . ini_get(‘post_max_size’);
echo ‘upload_max_filesize = ‘ . ini_get(‘upload_max_filesize’);
ini_set(‘max_execution_time’,’10′);
ini_set(‘memory_limit’,’1024M’);

注意: post_max_size,upload_max_filesize用下面的方法是修改不了的.
ini_set(‘post_max_size’,’1024M’);
ini_set(‘upload_max_filesize’,’1024M’);

正确做法是用.htaccess文件:
php_value upload_max_filesize 50M
php_value post_max_size 100M

前提是该站点在httpd.conf中配置了:
AllowOverride All

补充:
其实在php文档里有说明upload_max_filesize的可修改范围是PHP_INI_PERDIR。PHP_INI_PERDIR的意思是域内指令可以在php.ini、httpd.conf或.htaccess文件中修改。PHP_INI_SYSTEM 域内指令可以在php.ini和httpd.conf文件中修改所以upload_max_filesize用int_set是无法修改的。只有可修改范围是PHP_INI_ALL的才可以用int_set修改。

Flash+PHP文件上传,自定义样式,浏览器兼容,跨域上传

原文参见:http://www.cnblogs.com/kingthy/archive/2008/10/08/flex_file_uploader.html

我这里所做的修改:同一页面中可多次调用FLASH,解决IE,FIREFOX,CHROME,OPERA浏览器传值兼容问题,另外提供可跨域上传的解决办法。
————————————————-
2010-5-21 更新:默认语言为英文,将错误提示工作交给JS,根据错误类型自定义错误信息。
/*
*当Flash出现错误时(如上传文件)将触发此事件。
*error拥有两个属性
*error.type 错误类型
*error.value 错误信息
*/
__SWFUpload_OnError = function(objID, error){
switch(error.type){
case ‘size’:
alert(‘文件大小超出限制:’+error.value);
break;
default:
alert(error.value);
break;
}
__SWFUpload_GetMovie(objID).__SWFUpload_ResetUpload();
}

示例文件下载(Ver 1.1):Flex.FileUploader.1.1

PHP:header详解-页面刷新,页面跳转…

header() 函数会传送一个标题讯息给浏览器。因为这些讯息都遵循 HTTP 的规范, 因此浏览器会依据这些讯息做适当之响应。

header()格式:��int header ( string 标头宣告文字 [, bool 置换 [, int http回应码]])

–[标头宣告文字] 的内容就是传给浏览器的标题文字内容。

–[置换] 是布尔型态的参数。 设定为 True 时, 当有二的相同型态的标题讯息宣告时, 后面的讯息将会覆盖前一个讯息。

–第三个参数会让 HTTP 回应码给指定的值。

Location

Refresh

Content-type

Expires(意思为终止)

Last-Modified等。

Location – 浏览器显示指定的网页。

格式: header(“Location: http://绝对地址”);

Location 的地址必须是一个绝对地址。

Refresh

Refresh – 更新网页。

格式如下:��header(“Refresh : N ; URL=网址”)

–N 代表更新时间, 时间单位为秒。 URL 为更新后连结的网址。 如果省略 URL 就表示更新网页本身。

Content-type

Content-type – 定义网页内容的类型。

格式: Content-Type��= “Content-Type:” media-type

举例如下:

Header(“Content-type: text/html; charset=big5″) 设定网页内容为big5

Header(“Content-type: image/gif”) 设定网页内容为gif格式的图片

Header(“Content-type: application/pdf”) 设定网页内容为pdf档

Cache Control – Cache 的控制。

Cache Control 大致可以分成几种类型

设定过期时间。 当时间超过指定时间就表示网页内容已经失效。 其格式如下

Expires = “Expires:” HTTP-date

例 如: header(“Expires: Fri, 31 Oct 2003 18:00:00 GMT”); 表示2003年10月31日星期五 18时。

header(“Expires: Wed, 30 Jun 2004 09:00:00 GMT”); 表示2004年6月30日星期三 9时。

Last-Modified = “Last-Modified” “:” HTTP-date

例如 header(“Last-Modified: Wed, 01 Jan 2003 12:00:00 GMT”); 上次修改时间2003年1月1日12时

Cache Control

no-cache 使得服务器的数据可以传送到远程的使用者, 而不会被暂存 (cache) 起来。

no-store 是预防不良的版本或者是敏感的信息被保留下来。

must-revalidate 是指必须要再评估信息, 如果暂存 (cached) 的数据是无效的则让服务器与使用者端联机

Date 是说明数据内容的建立日期及时间。 其格式如下: Date = “Date:” HTTP-date

范例: header(“Date: Sun, 15 Feb 2004 08:00:00 GMT”); 建立日期是2004年2月15日8时。

使用 header() 函数认证

基本的认证就是使用账号密码窗体输入HTTP 认证。

窗体认 证:

<?php

if (($_POST['name'] != “john”) or ($_POST['passwd'] != “1234″)):

?>

<html>

<title>登入画面</title>

<body>

<B>未输入账号或密码, 或账号,密码不正确 </B><p>

<form action=<?php echo $_SERVER['PHP_SELF'] ?> method=post>

账号 <input type=text name=name value=”请输入账号” size=10><p>

密码 <input type=password name=passwd size=10><p>

<input type=submit value=” 登入 “>

<input type=reset value=” 清除 “>

</form>

</body>

</html>

<?php

else:

echo “登入成功 …..<p>”;

echo “您登入的账号是 “.$_POST['name'].”<br>”;

echo “您使用的密码是 “.$_POST['passwd'];

endif

?>

HTTP认证

<?php

if (empty($_SERVER['PHP_AUTH_USER'])) {

header(“Content-type: text/html; charset=big5″);

header(‘WWW-Authenticate: Basic realm=”认证范围”‘);

header(‘HTTP/1.0 401 Unauthorized’);

echo ‘请输入正确的账号及密码, 不可以取消!’;

exit;

} else {

echo “您登入的账号是 “.$_SERVER['PHP_AUTH_USER'].”<br>”;

echo “您使用的密码是 “.$_SERVER['PHP_AUTH_PW'].”<p>”;

$correctName=”john”;

$correctpwd=”1234″ ;

if (($_SERVER['PHP_AUTH_USER'] != $correctName) or

($_SERVER['PHP_AUTH_PW'] !=$correctpwd)){

echo “登入失败, 请开启新的浏览器重新登入”;

}else{

echo “登入成功…..”;

}

}

?>

PHP发邮件标题与内容乱码的解决方法

先用函数base64_encode() — 使用 MIME base64 对数据进行编码
标题字符串前加编码类型例如: =?UTF-8?B?
标题字符串后加:?=
邮件header指明Content-type: text/html; charset=utf-8,这样就能防止邮件正文乱码

$to         = ‘zhoz@example.com’;
$subject   = “=?UTF-8?B?”.base64_encode(‘邮件标题’).”?=”;
$headers   = ‘MIME-Version: 1.0′ . “rn”;
$headers .= ‘Content-type: text/html; charset=utf-8′ . “rn”;
// Additional headers
$headers .= ‘To: zhoz <zhoz@example.com>’ . “rn”;
$headers .= ‘From: Admin <admin@example.com>’ . “rn”;
$headers .= ‘Reply-To: zhoz <zhoz@example>’ . “rn”;
mail($to, $subject, $message, $headers);

PHP 错误之引号中使用变量

当看到错误提示
syntax error, unexpected T_ENCAPSED_AND_WHITESPACE, expecting T_STRING or T_VARIABLE or T_NUM_STRING
这个提示,是提示变量使用的问题。
而我出现的是,语句中使用了数组,导致失败。下面看看失败的代码;
<?php
echo “我是数组,$n['x']“;
?>
这样即时双引号是可以解析变量的,但是素组这样的,写法是没办法解析。修改成下面就可以了!
<?php
echo “我是数组,{$n['x']}”;
?>
加上花括号{}可以让语句识别这里面是动态的。

PHP初学者头疼问题总结[Usefull]

【1】页面之间无法传递变量 get,post,session在最新的php版本中自动全局变量是关闭的,所以要从上一页面取得提交过来得变量要使用$_GET['foo'],$_POST['foo'],$_SESSION['foo']来得到
当然也可以修改自动全局变量为开(php.ini改为register_globals = On);考虑到兼容性,还是强迫自己熟悉新的写法比较好。
【2】Win32下apache2 用get方法传递中文参数会出错
test.php?a=你好&b=你也好
传递参数是会导致一个内部错误
解决办法:”test.php?a=”.urlencode(你好).”&b=”.urlencode(你也好)
………….

【3】win32下的session不能正常工作
php.ini默认的session.save_path = /tmp
这显然是linux下的配置,win32下php无法读写session文件导致session无法使用
把它改成一个绝对路径就可以了,例如session.save_path = c:windowstemp Continue reading

javascript用DOM解释XML[转]


在DOM眼中,HTML跟XML一样是一种树形结构的文档,<html>是根(root)节点,<head><title><body><html>的子(children)节点,互相之间是兄弟(sibling)节点;<body>下面才是子节点<table><span><p>等等。如下图:

这个是不是跟XML的结构有点相似呢。不同的是,HTML文档的树形主要包含表示元素、标记的节点和表示文本串的节点。

HTML文档的节点

DOM下,HTML文档各个节点被视为各种类型的Node对象。每个Node对象都有自己的属性和方法,利用这些属性和方法可以遍历整个文档树。由于HTML文档的复杂性,DOM定义了nodeType来表示节点的类型。这里列出Node常用的几种节点类型:

接口
nodeType常量
nodeType值
备注

Element
Node.ELEMENT_NODE
1
元素节点

Text
Node.TEXT_NODE
3
文本节点

Document
Node.DOCUMENT_NODE
9
document

Comment
Node.COMMENT_NODE
8
注释的文本

DocumentFragment
Node.DOCUMENT_FRAGMENT_NODE
11
document片断

Attr
Node.ATTRIBUTE_NODE
2
节点属性

DOM树的根节点是个Document对象,该对象的documentElement属性引用表示文档根元素的Element对象(对于HTML文档,这个就是<html>标记)。Javascript操作HTML文档的时候,document即指向整个文档,<body><table>等节点类型即为Element。Comment类型的节点则是指文档的注释。具体节点类型的含义,请参考《Javascript权威指南》,在此不赘述。

Document定义的方法大多数是生产型方法,主要用于创建可以插入文档中的各种类型的节点。常用的Document方法有:

方法
描述

createAttribute()
用指定的名字创建新的Attr节点。

createComment()
用指定的字符串创建新的Comment节点。

createElement()
用指定的标记名创建新的Element节点。

createTextNode()
用指定的文本创建新的TextNode节点。

getElementById()
返回文档中具有指定id属性的Element节点。

getElementsByTagName()
返回文档中具有指定标记名的所有Element节点。

对于Element节点,可以通过调用getAttribute()、setAttribute()、removeAttribute()方法来查询、设置或者删除一个Element节点的性质,比如

标记的border属性。下面列出Element常用的属性:

属性
描述

tagName
元素的标记名称,比如<p>元素为P。HTML文档返回的tabName均为大写。

Element常用的方法:

方法
描述

getAttribute()
以字符串形式返回指定属性的值。

getAttributeNode()
以Attr节点的形式返回指定属性的值。

getElementsByTabName()
返回一个Node数组,包含具有指定标记名的所有Element节点的子孙节点,其顺序为在文档中出现的顺序。

hasAttribute()
如果该元素具有指定名字的属性,则返回true。

removeAttribute()
从元素中删除指定的属性。

removeAttributeNode()
从元素的属性列表中删除指定的Attr节点。

setAttribute()
把指定的属性设置为指定的字符串值,如果该属性不存在则添加一个新属性。

setAttributeNode()
把指定的Attr节点添加到该元素的属性列表中。

Attr对象代表文档元素的属性,有name、value等属性,可以通过Node接口的attributes属性或者调用Element接口的 getAttributeNode()方法来获取。不过,在大多数情况下,使用Element元素属性的最简单方法是getAttribute()和 setAttribute()两个方法,而不是Attr对象。

使用DOM操作HTML文档

Node对象定义了一系列属性和方法,来方便遍历整个文档。用parentNode属性和childNodes[]数组可以在文档树中上下移动;通过遍历childNodes[]数组或者使用firstChild和nextSibling属性进行循环操作,也可以使用lastChild和 previousSibling进行逆向循环操作,也可以枚举指定节点的子节点。而调用appendChild()、insertBefore()、 removeChild()、replaceChild()方法可以改变一个节点的子节点从而改变文档树。

需要指出的是,childNodes[]的值实际上是一个NodeList对象。因此,可以通过遍历childNodes[]数组的每个元素,来枚举一个给定节点的所有子节点;通过递归,可以枚举树中的所有节点。下表列出了Node对象的一些常用属性和方法:

Node对象常用属性:

属性
描述

attributes
如果该节点是一个Element,则以NamedNodeMap形式返回该元素的属性。

childNodes
以Node[]的形式存放当前节点的子节点。如果没有子节点,则返回空数组。

firstChild
以Node的形式返回当前节点的第一个子节点。如果没有子节点,则为null。

lastChild
以Node的形式返回当前节点的最后一个子节点。如果没有子节点,则为null。

nextSibling
以Node的形式返回当前节点的兄弟下一个节点。如果没有这样的节点,则返回null。

nodeName
节点的名字,Element节点则代表Element的标记名称。

nodeType
代表节点的类型。

parentNode
以Node的形式返回当前节点的父节点。如果没有父节点,则为null。

previousSibling
以Node的形式返回紧挨当前节点、位于它之前的兄弟节点。如果没有这样的节点,则返回null。

Node对象常用方法:

方法
描述

appendChild()
通过把一个节点增加到当前节点的childNodes[]组,给文档树增加节点。

cloneNode()
复制当前节点,或者复制当前节点以及它的所有子孙节点。

hasChildNodes()
如果当前节点拥有子节点,则将返回true。

insertBefore()
给文档树插入一个节点,位置在当前节点的指定子节点之前。如果该节点已经存在,则删除之再插入到它的位置。

removeChild()
从文档树中删除并返回指定的子节点。

replaceChild()
从文档树中删除并返回指定的子节点,用另一个节点替换它。

接下来,让我们使用上述的DOM应用编程接口,来试着操作HTML文档。

A、遍历文档的节点

DOM把一个HTML文档视为树,因此,遍历整个树是应该是家常便饭。跟之前说过的一样,这里我们提供两个遍历树的例子。通过它,我们能够学会如何使用childNodes[]和firstChile、lastChild、nextSibling、previousSibling遍历整棵树。

例子1– sample3_1.htm:

这个例子使用了childNodes[]和递归方式来遍历整个文档,统计文档中出现的Element元素总数,并把Element标记名全部打印出来。需要特别注意的是,在使用DOM时,必须等文档被装载完毕再执行遍历等行为操作文档。sample3_1.htm具体代码如下:


onClick="alert('标记总数:' + countTotalElement(document) + ‘rn全部标记如下:rn' + elementName);elementName=";">开始统计

运行效果如下:

例子2 – sample3_2.htm:

接下来使用firstChile、lastChild、nextSibling、previousSibling遍历整个文档树。修改一下countTotalElement函数,其他跟sample3_1.htm一样:


function countTotalElement(node) { //参数node是一个Node对象

var total = 0;

if(node.nodeType == 1) { //检查node是否为Element对象

total++; //如果是,计数器加1

elementName = elementName + node.tagName + "rn"; //保存标记名

}

var childrens = node.childNodes; //获取node的全部子节点

for(var m=node.firstChild; m!=null;m=m.nextSibling) {

total += countTotalElement(m); //在每个子节点上进行递归操作

}

return total;

}

B、搜索文档中特定的元素

在使用DOM的过程中,有时候需要定位到文档中的某个特定节点,或者具有特定类型的节点列表。这种情况下,可以调用Document对象的getElementsByTagName()和getElementById()方法来实现。

document.getElementsByTagName()返回文档中具有指定标记名的全部Element节点数组(也是NodeList类型)。Element出现在数组中的顺序就是他们在文档中出现的顺序。传递给getElementsByTagName()的参数忽略大小写。比如,想定位到第一个<table>标记,可以这样写:document.getElementsByTagName("table")[0]。例外的,可以使用document.body定位到<body>标记,因为它是唯一的。

getElementsByTagName()返回的数组取决于文档。一旦文档改变,返回结果也立即改变。相比,getElementById() 则比较灵活,可以随时定位到目标,只是要实现给目标元素一个唯一的id属性值。这个我们在《AJAX开发简略》的"级联菜单"例子中已经使用过了。

Element对象也支持getElementsByTagName()和getElementById()。不同的是,搜索领域只针对调用者的子节点。

C、修改文档内容

遍历整棵文档树、搜索特定的节点,我们最终目的之一是要修改文档内容。接下来的三个例子将使用Node的几个常用方法,来演示如何修改文档内容。

例子3 — sample4_1.htm:

这个例子包含三个文本节点和一个按钮。点击按钮后,三个文本节点和按钮的顺序将被颠倒。程序使用了Node的appendChild()和removeChild()方法。


第一行

第二行

第三行

onClick="reverseNode(document.body)">

例子4– sample4_2.htm:

例子1通过直接操作body的子节点来修改文档。在HTML文档中,布局和定位常常通过表格<table>来实现。因此,例子4将演示操作表格内容,将表格的四个单元行顺序颠倒。如果没有使用<tbody>标签,则<table>把全部的<tr>当做是属于一个子节点<tbody>,所以我们采用数组缓存的方式,把行数据颠倒一下。这个例子同时也演示了如何使用DOM创建表格单元行。


第一行
第二行
第三行
第四行

例子5 — sample4_3.htm:

正如我们在Node节点介绍部分所指出的那样,appendChild()、replaceChild()、removeChild()、insertBefore()方法会立即改变文档的结构。下面的例子包含两个表格,我们试着把表格二的内容替换表格一的内容。


表格一

表格二

注意,当执行kid1.replaceChild(repKid,kid1.firstChild);的时候,table2的子节点已经被转移到 table1了,table2已经没有子节点,不能再调用table2的子节点。看看代码的注释,试着运行一下,应该就知道文档是怎么改变的了。

D、往文档添加新内容

在学会遍历、搜索、修改文档之后,我们现在试着网文档添加新的内容。其实没有什么新意,只是利用我们上述提到的Node的属性和方法而已,还是操作<table>标记的内容。有新意的是,我们要实现一个留言簿。是的,留言簿,你可以往里面留言,只是不能刷新噢。

例子6 – sample5_1.htm:


网友留言列表:

我们之前说过,<table>的子节点是<tbody><tbody>的子节点才是<tr><tr><td>的父节点,最后<td>内部的TextNode节点。所以,往<table>增加单元格行要逐级形成,就像往树里面添加一个枝桠一样,要有叶子有径。看看,这个留言簿是不是很简单啊。这个例子同时也演示了往<table>表格标记里面增加内容的另一种方法。

E使用DOM操作XML文档

在数据表示方面,XML文档更加结构化。DOM在支持HTML的基础上提供了一系列的API,支持针对XML的访问和操作。利用这些API,我们可以从XML中提取信息,动态的创建这些信息的HTML呈现文档。处理XML文档,通常遵循"加载XML文档à提取信息à加工信息à创建HTML文档"的过程。下面的例子演示了如何加载并处理XML文档。

这个例子包含两个JS函数。loadXML()负责加载XML文档,其中既包含加载XML文档的2级DOM代码,又有实现同样操作的 Microsoft专有API代码。需要提醒注意的是,文档加载过程不是瞬间完成的,所以对loadXML()的调用将在加载文档完成之前返回。因此,需要传递给loadXML()一个引用,以便文档加载完成后调用。

例子中的另外一个函数makeTable(),则在XML文档加载完毕之后,使用最后前介绍过的DOM应用编程接口读取XML文档信息,并利用这些信息形成一个新的table表格。

例子7 — sample6_1.htm:


供读取调用的XML文档 – employees.xml:


Programmer

32768

Sales

70000

CEO

100000

处理XML文档

脱离XML文档的AJAX是不完整的。在本部分未完成之前,有读者说AJAX改名叫AJAH(H应该代表HTML吧)比较合适。应该承认,XML文档在数据的结构化表示以及接口对接上有先天的优势,但也不是所有的数据都应该用XML表示。有些时候单纯的文本表示可能会更合适。下面先举个AJAX处理返回XML文档的例子再讨论什么时候使用XML。

7.5.1、处理返回的XML

例子8 — sample7_1.htm:

在这个例子中,我们采用之前确定的AJAX开发框架,稍微修改一下body内容和processRequest的相应方式,将先前的employees.xml的内容读取出来并显示。

body的内容如下:


processRequest()方法修改如下:

// 处理返回信息的函数


function processRequest() {

if (http_request.readyState == 4) { // 判断对象状态

if (http_request.status == 200) { // 信息已经成功返回,开始处理信息

var returnObj = http_request.responseXML;

var xmlobj = http_request.responseXML;

var employees = xmlobj.getElementsByTagName("employee");

var feedbackStr = "";

for(var i=0;i

var employee = employees[i];

feedbackStr += "员工:" + employee.getAttribute("name");

feedbackStr +=

" 职位:" + employee.getElementsByTagName("job")[0].firstChild.data;

feedbackStr +=

" 工资:" + employee.getElementsByTagName("salary")[0].firstChild.data;

feedbackStr += "rn";

}

alert(feedbackStr);

} else { //页面不正常

alert("您所请求的页面有异常。");

}

}

}

运行一下,看来效果还不错:

7.5.2、选择合适的XML生成方式

现在的web应用程序往往采用了MVC三层剥离的设计方式。XML作为一种数据保存、呈现、交互的文档,其数据往往是动态生成的,通常由 JavaBean转换过来。由JavaBean转换成XML文档的方式有好几种,选择合适的转换方式往往能达到事半功倍的效果。下面介绍两种常用的方式,以便需要的时候根据情况取舍。

A、类自行序列化成XML

类自行序列化成XML即每个类都实现自己的toXML()方法,选择合适的API、适当的XML结构、尽量便捷的生成逻辑快速生成相应的XML文档。显然,这种方式必须要求每个类编写专门的XML生成代码,每个类只能调用自己的toXML()方法。应用诸如JDOM等一些现成的API,可以减少不少开发投入。例子9是一个利用JDOM的API形成的toXML()方法。

例子9 — toXml() 的 JDOM 实现 — Employ类的toXml()方法:


public Element toXml() {

Element employee = new Element("employee");

Employee.setAttribute("name",name);

Element jobE = new Element("job").addContent(job);

employee.setContent(jobE);

Element salaryE = new Element("salary").addContent(salary);

employee.setContent(salaryE);

return employee;

}

JDOM提供了现成的API,使得序列化成XML的工作更加简单,我们只需要把toXML()外面包装一个Document,然后使用 XMLOutputter把文档写入servlet就可以了。toXml()允许递归调用其子类的toXML()方法,以便生成包含子图的XML文档。

使用类自行序列化成XML的方式,要每个类都实现自己的toXML()方法,而且存在数据模型与视图耦合的问题,即要么为每个可能的视图编写独立的toXML()方法,要么心甘情愿接收冗余的数据,一旦数据结构或者文档发生改变,toXML()就要做必要的修改。

B、页面模板生成XML方式

一般的,可以采用通用的页面模板技术来生成XML文档,这个XML文档可以符合任何需要的数据模型,供AJAX灵活的调用。另外,模板可以采用任何标记语言编写,提高工作效率。下面是一个采用Struts标签库编写的XML文档,输出之前提到的employees.xml:

Sample8_2.jsp:


<%@ page contentType="application/xml; charset=gb2312" import="Employee"%>

<%@ page import="java.util.Collection,java.util.ArrayList"%>

<%@ taglib uri="/WEB-INF/struts-logic.tld" prefix="logic" %>

<%@ taglib uri="/WEB-INF/struts-bean.tld" prefix="bean"%>

<%

Employee em1 = new Employee();

em1.setName("J.Doe");

em1.setJob("Programmer");

em1.setSalary("32768");

Employee em2 = new Employee();

em2.setName("A.Baker");

em2.setJob("Sales");

em2.setSalary("70000");

Employee em3 = new Employee();

em3.setName("Big Cheese");

em3.setJob("CEO");

em3.setSalary("100000");

Collection employees = new ArrayList();

employees.add(em1);

employees.add(em2);

employees.add(em3);

pageContext.setAttribute("employees",employees);

%>

采用页面模板生成XML方式,需要为每个需要的的数据模型建立一个对立的JSP文件,用来生成符合规范的XML文档,而不能仅仅在类的toXML()方法中组织对象图来实现。不过,倒是可以更加方便的确保标记匹配、元素和属性的顺序正确以及XML实体正确转义。

参考资料中Philip McCarthy的文章还描述了一种Javascript对象标注的生成方式,本文在此不赘述。有兴趣的读者可以自行查看了解。

7.5.3、如何在使用XML还是普通文本间权衡

使用XML文档确实有其方便之处。不过XML文档的某些问题倒是要考虑一下,比如说延迟,即服务器不能立即解析XML文档成为DOM模型。这个问题在一定程度上会影响AJAX要求的快速反应能力。另外,某些情况下我们并不需要使用XML来表示数据,比如说数据足够简单成只有一个字符串而已。就好像我们之前提到的数据校验和级联菜单的例子一样。所以,个人认为在下面这些情况下可以考虑使用XML来作为数据表示的介质:

l 数据比较复杂,需要用XML的结构化方式来表示

l 不用考虑带宽和处理效率支出

l 与系统其他API或者其他系统交互,作为一种数据中转中介

l 需要特定各式的输出视图而文本无法表示的

总之,要认真评估两种表示方式的表示成本和效率,选择合适的合理的表示方式。