ASP UTF-8页面乱码+GB2312转UTF-8 +生成UTF-8格式的文件(编码)<转>
最好的方法:
先说一下基本的东西:
<%@ codepage=65001%>UTF-8
<%@ codepage=936%>简体中文
<%@ codepage=950%>繁体中文
<%@ codepage=437 %>美国/加拿大英语
<%@ codepage=932 %>日文
乱码文字生成
<%@ codepage=949 %>韩文
<%@ codepage=866 %>俄文
codepage指定了IIS按什么编码读取传递过来的串串(表单提交,地址栏传递等)。
出乱码的原因也就是网站要整合的时候模块编码不相同引起的。
就像我的博客相同,整合的时候都会出这个问题,因为BLOG是Utf-8的,
近来很多网友都在为这个问题咨询,我尝试了很多种方法。
最方便的方法如下:
不要转换任何模块网页的编码该utf-8的还是utf-8,该Gb22312的还是Gb2312
在Utf-8模块的包文档(如conn.asp,但是要注意conn.asp必须是在第一行调用)最前面加上
<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
<%Session.CodePage=65001%>
在GB2312模块的包文档最前面加上
<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
<%Session.CodePage=936%>
其他编码的类推。
UTF-8编码是一种支持多语言的国际化编码格式,它能够让不同语言操作系统和浏览器的用户访问中文网站时不用下载语言包即可正常浏览。而GB2312却做不到这一点,国内目前很多程序已经开始支持UTF-8编码。以下是博客作者对ASP中使用UTF-8编码的技巧小节。
以前做网页都是用的GB2312,因为刚开始不太了解,也就没注意这些。Dreamweaver中文版默认的就是简体中文,不写编码类型的话也是如此。然而,现在越来越多的网站采用unicode编码,这样做的好处自然不必多说。但是,要想真正用好utf-8并不是那么容易。下面我就总结一下自己遇到的问题。
首先,要把meta区的charset由gb2312改为utf-8,这点应该没有人不知道吧。在dreamweaver里可以直接设置[页面属性]中的[编码],然后会发现编辑器里的字体已经变了。但仅仅这样做是远远不够的,重要的还在下面。
然后要将所有文件保存成utf-8格式的。具体的方法是,用记事本打开要保存的文件,选[另存为],然后,在编码中将默认的ANSI(也就是ascii编码)改为utf-8,是utf-8而不是unicode或其他。
以上两点是其他很多网站都讲过的地方,仅仅这样做之后会发现,还有很多问题,比如汉字乱码,或者出现“未结束的字符串”等。下面还有三步!
1)ASP文件最前面写<%@CODEPAGE="65001"%>,原来就有的要改变CODEPAGE,utf-8就要用65001,前面那个脚本语言,如果就用vbscript的话就不用写了。不是每个文件都要写,而是只要在独立的页面写上就可以了,不包括包含文件。
2)经过上面的那些步骤,刷新一下,基本上就应该可以了。但是,你关闭浏览器重新打开试试,发现了什么?页面一片空白!打开右键菜单,到编码,选择utf-8,这才一切正常。也就是说,浏览器可能不会自动识别编码。在第1)步内容的后面加上response.charset="utf-8"即可。
3)完成之后,重新打开浏览器,发现一切正常。但这并不代表工作已经完成了。多刷新几次试试?结果发现,第一次很正常,刷新之后,汉字就出现乱码了。这时,还要在第2)步的后面加上session.CodePage = 65001才行。这一句并不是每个文件都要加,只要在首页加上就行了。既然用session,就可能出现过期的现象,那就都加上吧。这时,如果你的站点中还有gb2312的页面,刷新它,就会发现,那个页面中的汉字已经出现乱码了。
经过以上若干步骤,不出意外,就可以正常使用utf-8了。
注意
有时会遇到奇数汉字或中英文混合时出现乱码或“未结束的字符串”,如果你用的是netbox而不是IIS的话,就请换用IIS,不用netbox,或把网页传到虚拟空间上再试。基本上都是netbox本身引起的。
数据库不需改动,因为数据库内部就是unicode编码的,出来的时候再转换成其他编码。另外,需要注意的是,在utf-8中不可以通过URL参数传递汉字,如果需要的话,要加上server.URLEncode(),记得以前使用gb2312时没遇到过这样的问题。
ASP中汉字与UTF-8的互相转换
'=============汉字转换为UTF-8==================
function chinese2unicode(Str)
for i=1 to len(Str)
Str_one=Mid(Str,i,1)
Str_unicode=Str_unicode&chr(38)
Str_unicode=Str_unicode&chr(35)
Str_unicode=Str_unicode&chr(120)
Str_unicode=Str_unicode& Hex(ascw(Str_one))
Str_unicode=Str_unicode&chr(59)
next
chinese2unicode = Str_unicode
end function
'=============UTF-8转换为汉字==================
function UTF2GB(UTFStr)
for Dig=1 to len(UTFStr)
if mid(UTFStr,Dig,1)="%" then
if len(UTFStr) >= Dig+8 then
GBStr=GBStr & ConvChinese(mid(UTFStr,Dig,9))
Dig=Dig+8
else
GBStr=GBStr & mid(UTFStr,Dig,1)
end if
else
GBStr=GBStr & mid(UTFStr,Dig,1)
end if
next
UTF2GB=GBStr
end function
function ConvChinese(x)
A=split(mid(x,2),"%")
i=0
j=0
for i=0 to ubound(A)
A(i)=c16to2(A(i))
next
for i=0 to ubound(A)-1
DigS=instr(A(i),"0")
Unicode=""
for j=1 to DigS-1
if j=1 then
A(i)=right(A(i),len(A(i))-DigS)
Unicode=Unicode & A(i)
else
i=i+1
A(i)=right(A(i),len(A(i))-2)
Unicode=Unicode & A(i)
end if
next
if len(c2to16(Unicode))=4 then
ConvChinese=ConvChinese & chrw(int("&H" & c2to16(Unicode)))
else
ConvChinese=ConvChinese & chr(int("&H" & c2to16(Unicode)))
end if
next
end function
function c2to16(x)
i=1
for i=1 to len(x) step 4
c2to16=c2to16 & hex(c2to10(mid(x,i,4)))
next
end function
function c2to10(x)
c2to10=0
if x="0" then exit function
i=0
for i= 0 to len(x) -1
if mid(x,len(x)-i,1)="1" then c2to10=c2to10+2^(i)
next
end function
function c16to2(x)
i=0
for i=1 to len(trim(x))
tempstr= c10to2(cint(int("&h" & mid(x,i,1))))
do while len(tempstr)<4
tempstr="0" & tempstr
loop
c16to2=c16to2 & tempstr
next
end function
function c10to2(x)
mysign=sgn(x)
x=abs(x)
DigS=1
do
if x<2^DigS then
exit do
else
DigS=DigS+1
end if
loop
tempnum=x
i=0
for i=DigS to 1 step-1
if tempnum>=2^(i-1) then
tempnum=tempnum-2^(i-1)
c10to2=c10to2 & "1"
else
c10to2=c10to2 & "0"
end if
next
if mysign=-1 then c10to2="-" & c10to2
end function
GB2312转UTF-8
'个人代码风格注释(变量名中第一个小写字母表表示变量类型)
'i:为Integer型;
's:为String;
Function U2UTF8(Byval a_iNum)
Dim sResult,sUTF8
Dim iTemp,iHexNum,i
iHexNum = Trim(a_iNum)
If iHexNum = "" Then
Exit Function
End If
sResult = ""
If (iHexNum < 128) Then
sResult = sResult & iHexNum
ElseIf (iHexNum < 2048) Then
sResult = ChrB(&H80 + (iHexNum And &H3F))
iHexNum = iHexNum \ &H40
sResult = ChrB(&HC0 + (iHexNum And &H1F)) & sResult