深入剖析JSP和Servlet对中文的处理

　　当映射不成功时，问题就发生了！当从某语言向Unicode转化时，如果在某语言中没有该字符，得到的将是Unicode的代码“uffffd”（“u”表示是Unicode编码，）。而从Unicode向某语言转化时，如果某语言没有对应的字符，则得到的是“0x3f”（“?”）。这就是“?”的由来。

　　例如：把字符流buf =“0x80 0x40 0xb0 0xa1”进行new String(buf, "gb2312")操作，得到的结果是“ufffdu554a”，再println出来，得到的结果将是“?啊”，因为“0x80 0x40”是GBK中的字符，在GB2312中没有。

　　再如，把字符串String="u00d6u00ecu00e9u0046u00bbu00f9"进行new String (buf.getBytes("GBK"))操作，得到的结果是“3fa8aca8a6463fa8b4”，其中，“u00d6”在“GBK”中没有对应的字符，得到“3f”，“u00ec”对应着“a8ac”，“u00e9”对应着“a8a6”，“0046”对应着“46”（因为这是ASCII字符），“u00bb”没找到，得到“3f”，最后，“u00f9”对应着“a8b4”。把这个字符串println一下，得到的结果是“?ìéF?ù”。看到没？这里并不全是问号，因为GBK与Unicode映射的内容中除了汉字外还有字符，本例就是最好的明证。

　　所以，在汉字转码时，如果发生错乱，得到的不一定都是问号噢！不过，错了终究是错了，50步和100步并没有质的差别。

　　或者会问：如果源字符集中有，而Unicode中没有，结果会如何？回答是不知道。因为我手头没有能做这个测试的源字符集。但有一点是肯定的，那就是源字符集不够规范。在Java中，如果发生这种情况，是会抛出异常的。

　　什么是UTF

　　UTF，是Unicode Text Format的缩写，意为Unicode文本格式。对于UTF，是这样定义的：

　　（1）如果Unicode的16位字符的头9位是0，则用一个字节表示，这个字节的首位是“0”，剩下的7位与原字符中的后7位相同，如“u0034”（0000 0000 0011 0100），用“34” (0011 0100)表示；（与源Unicode字符是相同的）；

　　（2）如果Unicode的16位字符的头5位是0，则用2个字节表示，首字节是“110”开头，后面的5位与源字符中除去头5个零后的最高5位相同；第二个字节以“10”开头，后面的6位与源字符中的低6位相同。如“u025d”（0000 0010 0101 1101），转化后为“c99d”（1100 1001 1001 1101）；

　　（3）如果不符合上述两个规则，则用三个字节表示。第一个字节以“1110”开头，后四位为源字符的高四位；第二个字节以“10”开头，后六位为源字符中间的六位；第三个字节以“10”开头，后六位为源字符的低六位；如“u9da7”（1001 1101 1010 0111），转化为“e9b6a7”（1110 1001 1011 0110 1010 0111）；

　　可以这么描述JAVA程序中Unicode与UTF的关系，虽然不绝对：字符串在内存中运行时，表现为Unicode代码，而当要保存到文件或其它介质中去时，用的是UTF。这个转化过程是由writeUTF和readUTF来完成的。

2/10 首页上一页 1 2 3 4 5 6 下一页尾页

深入剖析JSP和Servlet对中文的处理

如何使用合同管理专家进行采购合同管理

怎么用同步助手越狱同步助手越狱教程

用刷机精灵刷机后无法获取短信,通讯录,通话记录

2016迅雷下载百度云大文件最新方法百度云大文件怎么

USP10.DLL病毒删除方法

程控交换机的防雷应怎样进行呢?

金山卫士Beta 5发布新增功能网页防护

利用ps简单几步绘制逼真钢笔教程

YUMMY教你做美图之炫彩夏日篇

百度新推浏览器，欲图抢占互联网入口

如何使用合同管理专家进行采购合同管理

怎么用同步助手越狱同步助手越狱教程

用刷机精灵刷机后无法获取短信,通讯录,通话记录

2016迅雷下载百度云大文件最新方法百度云大文件怎么

USP10.DLL病毒删除方法

程控交换机的防雷应怎样进行呢?

金山卫士Beta 5发布新增功能网页防护

利用ps简单几步绘制逼真钢笔教程

YUMMY教你做美图之炫彩夏日篇

百度新推浏览器，欲图抢占互联网入口

深入剖析JSP和Servlet对中文的处理

如何使用合同管理专家进行采购合同管理

怎么用同步助手越狱 同步助手越狱教程

用刷机精灵刷机后无法获取短信,通讯录,通话记录

2016迅雷下载百度云大文件最新方法 百度云大文件怎么

USP10.DLL病毒删除方法

程控交换机的防雷应怎样进行呢?

金山卫士Beta 5发布新增功能网页防护

利用ps简单几步绘制逼真钢笔教程

YUMMY教你做美图之炫彩夏日篇

百度新推浏览器，欲图抢占互联网入口

如何使用合同管理专家进行采购合同管理

怎么用同步助手越狱 同步助手越狱教程

用刷机精灵刷机后无法获取短信,通讯录,通话记录

2016迅雷下载百度云大文件最新方法 百度云大文件怎么

USP10.DLL病毒删除方法

程控交换机的防雷应怎样进行呢?

金山卫士Beta 5发布新增功能网页防护

利用ps简单几步绘制逼真钢笔教程

YUMMY教你做美图之炫彩夏日篇

百度新推浏览器，欲图抢占互联网入口

怎么用同步助手越狱同步助手越狱教程

2016迅雷下载百度云大文件最新方法百度云大文件怎么

怎么用同步助手越狱同步助手越狱教程

2016迅雷下载百度云大文件最新方法百度云大文件怎么