正则字符串有中文,php中正则匹配中文汉字"/>
php正则字符串有中文,php中正则匹配中文汉字
在php中如果你想正则来获取字符串中汉字我们先需要知道页面编码,正则匹配中文汉字根据页面编码不同而略有区别:GBK/GB2312编码:[x80-xff>] 或 [xa1-xff] 而UTF-8编码:[x{4e00}-x{9fa5}] /u 。
例
代码如下 | 复制代码 |
echo (mb_eregi("[x80-xff].","中d文") ? "有" : "无") ."汉字"; echo (mb_eregi("^([x80-xff].) $","中文") ? "全是汉字" : ""); 看一判断全中文字符串函数 以下以PHP为例进行匹配: 代码如下 | 复制代码 | $str = "学习php是一件快乐的事。"; preg_match_all("/[x80-xff] /", $str, $match); //UTF-8 使用: //preg_match_all("/[x{4e00}-x{9fa5}] /u", $str, $match); print_r($match); ?> 输出: Array ( [0] => Array ( [0] => 学习 [1] => 是一件快乐的事。 ) ) 正则汉字 代码如下 | 复制代码 | $str = "请问php中的eregi如何匹配汉字"; if (preg_match("/^[".chr(0x80)."-".chr(0xff)."] $/",$str)) { echo "这是一个纯中文字符串"; } else{ echo "这不是一个纯中文字串"; } preg_match_all($pat,……)与preg_replace($pat,……)…… preg_match_all("/(汉字) /ism","我是汉字,看你把我怎么着!",$m_a); 了各个编码的高位与低位的开始与结束,那么自然就可以写出正则,而且直接是十六位的,有啥困难?呵呵。不过要注意,在php里面,表示十六位是用的x 我们还可以用该正则表达式来判断是否是gb2312的汉字 代码如下 | 复制代码 | $str = "小小子"; if(preg_match("/^[xb0-xf7][xa0-xfe] $/",$str)){ print($str."确实全是汉字"); } else { print($str."这个真tc不全是汉字"); } ?> |
|
|
|
发布评论