PHP中将网页导出为Word文档的代码

content:要转换的HTML代码
absolutePath: 如果HTML代码中的图片地址都是相对路径，那么这个参数就是HTML代码中缺少的绝对路径。
isEraseLink:是否去掉HTML代码中的超链接
返回值为mht的文件内容，您可以通过file_put_content将它保存成后缀名为doc的文件
这个函数的主要功能其实就是分析HTML代码中的所有图片地址，并且依次下载下来。获取到了图片的内容以后，调用MhtFileMaker类，将图片添加到mht文件中。具体的添加细节，封装在MhtFileMaker类中了。

/**
* 根据HTML代码获取word文档内容
* 创建一个本质为mht的文档，该函数会分析文件内容并从远程下载页面中的图片资源
* 该函数依赖于类MhtFileMaker
* 该函数会分析img标签，提取src的属性值。但是，src的属性值必须被引号包围，否则不能提取
*
* @param string $content HTML内容
* @param string $absolutePath 网页的绝对路径。如果HTML内容里的图片路径为相对路径，那么就需要填写这个参数，来让该函数自动填补成绝对路径。这个参数最后需要以/结束
* @param bool $isEraseLink 是否去掉HTML内容中的链接
*/
function getWordDocument( $content , $absolutePath = "" , $isEraseLink = true )
{
$mht = new MhtFileMaker();
if ($isEraseLink)
$content = preg_replace('/<as*.*?s*>(s*.*?s*)</a>/i' , '$1' , $content); //去掉链接
$images = array();
$files = array();
$matches = array();
//这个算法要求src后的属性值必须使用引号括起来
if ( preg_match_all('/<img[.n]*?srcs*?=s*?["'](.*?)["'](.*?)/>/i',$content ,$matches ) )
{
$arrPath = $matches[1];
for ( $i=0;$i<count($arrPath);$i++)
{
$path = $arrPath[$i];
$imgPath = trim( $path );
if ( $imgPath != "" )
{
$files[] = $imgPath;
if( substr($imgPath,0,7) == 'http://')
{
//绝对链接，不加前缀
}
else
{
$imgPath = $absolutePath.$imgPath;
}
$images[] = $imgPath;
}
}
}
$mht->AddContents("tmp.html",$mht->GetMimeType("tmp.html"),$content);
for ( $i=0;$i<count($images);$i++)
{
$image = $images[$i];
if ( @fopen($image , 'r') )
{
$imgcontent = @file_get_contents( $image );
if ( $content )
$mht->AddContents($files[$i],$mht->GetMimeType($image),$imgcontent);
}
else
{
echo "file:".$image." not exist!<br />";
}
}
return $mht->GetFile();
}

使用方法：

$fileContent = getWordDocument($content,"http://www.yoursite.com/Music/etc/");
$fp = fopen("test.doc", 'w');
fwrite($fp, $fileContent);
fclose($fp);

其中，$content变量应该是HTML源代码，后面的链接应该是能填补HTML代码中图片相对路径的URL地址
注意，在使用这个函数之前，您需要先包含类MhtFileMaker，这个类可以帮助我们生成Mht文档。

2/4 首页上一页 1 2 3 4 下一页尾页

PHP中将网页导出为Word文档的代码

Swoole webSocket消息服务系统压力测试解析

Swoole webSocket客服IM消息系统方案解析

Highcharts 图表中图例显示状态存储的功能设计详解

thinkphp(php)插件钩子(hooks)分析的简单实现机制

thinkphp(php)插件钩子(hooks)分析的简单实现机制

php删除路径下的所有文件夹和文件的代码

ThinkPHP5集成JS-SDK实现微信自定义分享功能

thinkphp5加layui实现图片上传功能（带图片预览）

Thinkphp结合ajaxFileUpload实现ajax异步图片传输全套

thinkphp5实用入门进阶知识点和各种常用功能代码汇总

Swoole webSocket消息服务系统压力测试解析

Swoole webSocket客服IM消息系统方案解析

Highcharts 图表中图例显示状态存储的功能设计详解

thinkphp(php)插件钩子(hooks)分析的简单实现机制

thinkphp(php)插件钩子(hooks)分析的简单实现机制

php删除路径下的所有文件夹和文件的代码

ThinkPHP5集成JS-SDK实现微信自定义分享功能

thinkphp5加layui实现图片上传功能（带图片预览）

Thinkphp结合ajaxFileUpload实现ajax异步图片传输全套

thinkphp5实用入门进阶知识点和各种常用功能代码汇总