欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

页面乱码问题的根源及其分析

程序员文章站 2022-07-20 08:33:17
首先, 关闭php配置文件php.ini中的default_charset:1. 页面没有指定charset , apache配置defaultcharst gbk , 页...

首先, 关闭php配置文件php.ini中的default_charset:
1. 页面没有指定charset , apache配置defaultcharst gbk , 页面文件编码是utf-8
结果: 乱码,使用wireshark抓包,发现服务器返回的header中指明了:

复制代码 代码如下:

content-type:text/html;charset=gb

结论:当页面没有指明charset的时候,apache的defaultcharset起作用

2. 页面指定charset为utf-8, apache配置defaultcharset gbk. 页面文件是utf-8

复制代码 代码如下:

<head>
        <meta http-equiv="content-type" content="text/html; charset=utf-8" />
</head>
<body>
        <div id="page-header">
         测试apache defaultcharset
        </div>
</body>
</html>

结果还是出现乱码。
结论:当apache配置了defaultcharset, 将忽略页面的charset申明。

3. php header申明charset为utf8, apache配置defaultcharst gbk,页面文件编码是utf8

复制代码 代码如下:

header("content-type:text/html; charset=utf-8");

结果 : 页面显示正常。

4 apache设置defaultcharset off
结果,页面显示正常。

翻阅了下apache2的手册:
adddefaultcharset指令
说明当应答内容是text/plain或text/html时,在http应答头中加入的默认字符集
语法adddefaultcharseton|off|charset
默认值adddefaultcharsetoff
作用域serverconfig,virtualhost,directory,.htaccess
覆盖项fileinfo
状态核心(c)
模块core
当且仅当应答内容是text/plain或text/html时,此指令将会在http应答头中加入的
默认字符集。理论上这将覆盖在文档体中通过<meta>标 签指定的字符集,但是实际
的行为通常取决于用户浏览器的设置。adddefaultcharsetoff将会禁用此功能。
adddefaultcharseton将启用apache内部的默认字符集iso-8859-1。您
也可以指定使用在iana注册过的字符集名字 中的另外一个charset。
比如说:
adddefaultcharsetutf-8

也就是说,当apache不指定defaultcharset的时候,页面编码由页面自己的meta标签指定。
当apache指定的时候,将忽略页面中的meta标签指定的编码. 但是容许脚本直接header编码方式给客户端

最后,还有一个问题没有得出结果:
当apache和页面都没有指定的时候, 又如何?
我在自己的机器上,如果都不指定, 默认还是utf8.