欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

网页语言编码及asp乱码问题解决方案

程序员文章站 2023-11-13 15:50:46
最近公司有一个日文项目,由于之前使用的是自己开发的中文cms,并没有将语言包分离,在网站建设调试过程中出现了令人头疼的乱码问题。 乱码出现的原因  由于各个字符编...
最近公司有一个日文项目,由于之前使用的是自己开发的中文cms,并没有将语言包分离,在网站建设调试过程中出现了令人头疼的乱码问题。

乱码出现的原因 

由于各个字符编码的储存空间不一样,所以当使用不同的字符读取数据时,当字符空间过小,就不能正常显示了。

比如说中文字符的字符集一般是gb2312,如果用utf-8强制读取改变gb2312的字符,就有可能出现乱码。因为utf-8的字符集储存空间大于gb2312,当使用utf-8读取时,有些字符gb2312的编码中是不存在的,不存在的字符自然会出现乱码了。对于静态文件来说,如果文件的储存编码和网页中编码设置(charset)不一致的话,由于以上原因就会出现乱码问题。

以上是对于乱码问题的简单分析,在解决现有问题时有涉及到了asp对国际化的支持。

涉及到三个函数: @codepage,response.codepage,session.codepage

下面是msdn中的一段话。

setting @codepage explicitly affects literal strings in a single response. response.codepage affects dynamic strings in a single response, and session.codepage affects dynamic strings in all responses in a session.

这三个函数都可以设置asp的编码,其中 @codepage 相当于php中的header,必须在文档的开始发出。

在中文操作系统的iis中,默认的为gb2312,参数值是:”936″,而日文需要指定文档codepage :

<%@ codepage=932 %> 

我们使用这个函数来设置文档编码具体的使用方法可以参考:http://www.cloudward.net/techlife/article.asp?id=490

现在应该没有问题了吧?哇,问题仍然存在。考虑到seo公司的asp程序全部需要生成静态页面。而生成的页面全部是windows默认的ansi,其中包含日文字符仍然会出现乱码。这样我们需要一个asp的函数,生成utf-8或者日文编码的文件。 我们使用以下代码完成:

set objstream = server.createobject(”adodb.stream”)
with objstream
.open
.charset = “utf-8″ //编码,这里你可以改成任何编码
.position = objstream.size
.writetext=pencat //pencat 为写入的数据
.savetofile server.mappath(”patch/flilename.html”),2 //生成文件路径
.close
end with
set objstream = nothing

经测试后乱码的问题解决。