PHP+Tidy－完美的XHTML纠错+过滤

之前介绍的是HtmlEscapeInsertWbrs()，而上面使用的是HtmlInsertWbrs()。

这里要做一下解释：
HtmlEscapeInsertWbrs()要求输入的字符串未作特殊字符转义的，也就是没有经过htmlspecialchars()对<>&等作<>&处理的。因为函数内部有专门的处理。
而在处理经Tidy处理过后的文字节点的时候，因为Tidy的关系，已经自动把<>&等字符作相应的<>&转义，因此需要用一个专门的函数避免重复的转义，这个函数就是HtmlInsertWbrs()，从名字上就知道它只插入标记，不做额外工作。

那么你可能有个问题：
如果被插入到HTML标签中间，比如在<div>或者>的中间插入了，变成<div>和&gt;，那就会影响到原始信息的展示。

没错，的确是个新问题，不过使用一些技巧就可以有效解决：

因为我们处理的是Tidy得到的文字节点，意味着不可能碰到HTML标签，因此不会碰到在标签中间插入的情况。
对于第二种情况，转义后的字符都是&xxxxx;这样的形式，那么只要在1所有&符号前面都插入标记就可以了（注意看调用时的第四个参数），因为下一个标记将会插在30(以上面代码中实际调用的第二个参数为例)个字符之后，这个已经2远远大于xxxxx的长度。这样由上面1、2两点可以保证不会插到转义字符的中间。
下面给出HtmlInsertWbrs()的PHP实现：

function HtmlInsertWbrs($str, $n=10,
 $chars_to_break_after='',$chars_to_break_before='')
{
 $out = '';
 $strpos = 0;
 $spc = 0;
 $len = mb_strlen($str,'UTF-8');
 for ($i = 1; $i < $len; ++$i) {
 $prev_char = mb_substr($str,$i-1,1,'UTF-8');
 $next_char = mb_substr($str,$i,1,'UTF-8');
 if (_u_IsSpace($next_char)) {
 $spc = $i;
 } else {
 if ($i - $spc == $n

 mb_strpos( $chars_to_break_after,
 $prev_char,0,'UTF-8' )
 !== FALSE

 mb_strpos( $chars_to_break_before,

5/6 首页上一页 3 4 5 6 下一页尾页

PHP+Tidy－完美的XHTML纠错+过滤

Swoole webSocket消息服务系统压力测试解析

Swoole webSocket客服IM消息系统方案解析

Highcharts 图表中图例显示状态存储的功能设计详解

thinkphp(php)插件钩子(hooks)分析的简单实现机制

thinkphp(php)插件钩子(hooks)分析的简单实现机制

php删除路径下的所有文件夹和文件的代码

ThinkPHP5集成JS-SDK实现微信自定义分享功能

thinkphp5加layui实现图片上传功能（带图片预览）

Thinkphp结合ajaxFileUpload实现ajax异步图片传输全套

thinkphp5实用入门进阶知识点和各种常用功能代码汇总

Swoole webSocket消息服务系统压力测试解析

Swoole webSocket客服IM消息系统方案解析

Highcharts 图表中图例显示状态存储的功能设计详解

thinkphp(php)插件钩子(hooks)分析的简单实现机制

thinkphp(php)插件钩子(hooks)分析的简单实现机制

php删除路径下的所有文件夹和文件的代码

ThinkPHP5集成JS-SDK实现微信自定义分享功能

thinkphp5加layui实现图片上传功能（带图片预览）

Thinkphp结合ajaxFileUpload实现ajax异步图片传输全套

thinkphp5实用入门进阶知识点和各种常用功能代码汇总