现在万事大吉了吗,并没有,虽然服务器和浏览器让用户使用 UTF-8 编码,但是用户的行为并没有约束性,他可能输入的是其他编码的字符,或者上传的文件名是其他编码的字符,那么怎么办呢?可以通过 mb_http_input() 和 mb_check_encoding() 函数来检测用户的编码,然后内部转换为 UTF-8。确保在任何一个层面,最终处理的是 UTF-8 编码。换句话说,需要手段能够知晓你的输入是什么编码的,处理完成后控制输出的编码是 UTF-8。
不建议使用 mbstring.encoding_translation 指令 和 mb_detect_encoding() 函数。折磨我半天。
操作系统和 UTF-8 的最佳实践
由于操作系统的原因,PHP 处理 Unicode 文件名的时候会有不同的处理机制。
在 Linux 中,文件名始终是 UTF-8 编码的,而在中文 Windows 环境下,文件名始终是 GBK 编码的,记住这一点就可以了。
通过例子说明下:
//命令行程序函数,运行在中文版 Windows 10 操作系统 ,文件编码为 UTF-8
function filenameexample() {
$filename = "测试.txt" ;
$gbk_filename = iconv("UTF-8","GBK",$filename);
file_put_contents($gbk_filename, "测试");
echo file_get_contents($gbk_filename);
}
function scandirexample() {
$arr = scandir("./tmp");
foreach ($arr as $v) {
if ($v == "." || $v =="..")
continue ;
$filename = iconv( "GBK","UTF-8",$v ) ;
$content = file_get_contents("./tmp/" . $v );
}
}
假如不想写写兼容 Windows 和 linux 的程序,可以对文件名进行 urlencode 编码,比如:
function urlencodeexample() {
$filename = "测试2.txt" ;
$urlencodefilename = urlencode($filename) ;
file_put_contents($urlencodefilename, "测试");
echo file_get_contents($urlencodefilename);
}
在用 PHP 通过 header() 函数下载文件的时候,也要考虑浏览器和操作系统(大部分人使用的是 Windows),对于 Chrome 来说,输出的文件名编码可以是 UTF-8,Chrome 会自动将文件名转换为 GBK 编码。
而对于低版本的 IE 来说,它继承了操作系统的环境,所以下载文件名假如是中文必须转码为 UTF-8 编码,否则下载的时候用户看到的是乱码文件名。通过代码来说明:
$agent=$_SERVER["HTTP_USER_AGENT"];
if(strpos($agent,'MSIE')!==false {
$filename = iconv("UTF-8","GBK","附件.txt");
header("Content-Disposition: attachment; filename="$filename"");
}
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!







