国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > JSP > 正文

關于Servlet、Jsp中的多國語言顯示

2024-09-05 00:19:54
字體:
來源:轉載
供稿:網友

因為一直不信java竟會有不能混排顯示多國語言的bug,這個周末研究了一下servlet、jsp的多國語言顯示的問題,也就是servlet的多字符集問題,由于我對字符集的概念還不是很清晰所以寫出的東西未必是準確的,我是這樣理解java中的字符集的:在運行時,每個字符串對象中存儲的都是編碼為unicode內碼的(我覺得所有的語言中都是有相應編碼的,因為在計算機內部字符串總是用內碼來表示的,只不過一般計算機語言中的字符串編碼時平臺相關的,而java則采用了平臺無關的unicode)。

java從一個byte流中讀取一個字符串時,將把平臺相關的byte轉變為平臺無關的unicode字符串。在輸出時java將把unicode字符串轉變為平臺相關的byte流,如果某個unicode字符在某個平臺上不存在,將會輸出一個´?´。舉個例子:在中文windows中,java讀出一個"gb2312"編碼的文件(可以是任何流)到內存中構造字符串對象,將會把gb2312編碼的文字轉變為unicode編碼的字符串,如果把這個字符串輸出又將會把unicode字符串轉化為gb2312的byte流或數組:"中文測試"----->"u4e2du6587u6d4bu8bd5"----->"中文測試"。

如下例程:

byte[] bytes = new byte[]{(byte)0xd6, (byte)0xd0, (byte)0xce, (byte)0xc4, (byte)0xb2, (byte)0xe2, (byte)0xca, (byte)0xd4};//gbk編碼的"中文測試"

java.io.bytearrayinputstream bin = new java.io.bytearrayinputstream(bytes);

java.io.bufferedreader reader = new java.io.bufferedreader(new java.io. inputstreamreader (bin,"gbk"));

string msg = reader.readline();

system.out.println(msg)

這段程序放到包含"中文測試"這四個字的系統(如中文系統)中,可以正確地打印出這些字。msg字符串中包含了正確的"中文測試"的unicode編碼:"u4e2du6587u6d4bu8bd5",打印時轉換為操作系統的默認字符集,是否可以正確顯示依賴于操作系統的字符集,只有在支持相應字符集的系統中,我們的信息才能正確的輸出,否則得到的將會是垃圾。

話入正題,我們來看看servlet/jsp中的多語言問題。我們的目標是,任一國家的客戶端通過form向server發送信息,server把信息存入數據庫中,客戶端在檢索時仍然能夠看到自己發送的正確信息。事實上,我們要保證,最終server中的sql語句中保存的時包含客戶端發送文字的正確unicode編碼;dbc與數據庫通訊時采用的編碼方式能包含客戶端發送的文字信息,事實上,最好讓jdbc直接使用unicode/utf8與數據庫通訊!這樣就可以確保不會丟失信息;server向客戶端發送的信息時也要采用不丟失信息的編碼方式,也可以是unicode/utf8。

如果不指定form的enctype屬性,form將把輸入的內容依照當前頁面的編碼字符集urlencode之后再提交,服務器端得到是urlencoding的字符串。編碼后得到的urlencoding字符串是與頁面的編碼相關的,如gb2312編碼的頁面提交"中文測試",得到的是"%d6%d0%ce%c4%b2%e2%ca%d4",每個"%"后跟的是16進制的字符串;而在utf8編碼時得到的卻是"%e4%b8%ad%e6%96%87%e6%b5%8b%e8%af%95",因為gb2312編碼中一個漢字是16位的,而utf8中一個漢字卻是24位的。中日韓三國的ie4以上瀏覽器均支持utf8編碼,這種方案肯定包涵了這三國語言,所以我們如果讓html頁面使用utf8編碼那么將至少可以支持這三國語言。

但是,如果我們html/jsp頁面使用utf8編碼,因為應用程序服務器可能不知道這種情況,因為如果瀏覽器發送的信息不包含charset信息,至多server知道讀到accept-language請求投標,我們知道僅靠這個投標是不能獲知瀏覽器所采用編碼的,所以應用程序服務器不能正確解析提交的內容,為什么?因為java中的所有字符串都是unicode16位編碼的,httpservletrequest.request(string)的功能就是把客戶端提交的urlencode編碼的信息轉為unicode字符串,有些server只能認為客戶端的編碼和server平臺相同,簡單地使用urldecoder.decode(string)方法直接解碼,如果客戶端編碼恰好和server相同,那么就可以得到正確地字符串,否則,如果提交地字符串中包含了當地字符,那么將會導致垃圾信息。

在我提出的這個解決方案里,已經指定了采用utf8編碼,所以,可以避免這個問題,我們可以自己定制出decode方法:

public static string decode(string s,string encoding) throws exception {

stringbuffer sb = new stringbuffer();

for(int i=0; ichar c = s.charat(i);

switch (c) {

case ´+´:

sb.append(´ ´);

break;

case ´%´:

try {

sb.append((char)integer.parseint(

s.substring(i+1,i+3),16));

}

catch (numberformatexception e) {

throw new illegalargumentexception();

}

i += 2;

break;

default:

sb.append(c);

break;

}

}

// undo conversion to external encoding

string result = sb.tostring();

byte[] inputbytes = result.getbytes("8859_1");

return new string(inputbytes,encoding);

}

這個方法可以指定encoding,如果把它指定為utf8就滿足了我們的需要。比如用它解析:"%e4%b8%ad%e6%96%87%e6%b5%8b%e8%af%95"就可以得到正確的漢字"中文測試"的unicode字符串。

現在的問題就是我們必須得到客戶端提交的urlencode的字符串。對于method為get的form提交的信息,可以用httpservletrequest.getquerystring()方法讀到,而對于post方法的form提交的信息,只能從servletinputstream中讀到,事實上標準的getparameter方法被第一次調用后,form提交的信息就被讀取出來了,而servletinputstream是不能重復讀出的。所以我們應在第一次使用getparameter方法前讀取并解析form提交的信息。

  我是這么做的,建立一個servlet基類,覆蓋service方法,在調用父類的service方法前讀取并解析form提交的內容,請看下面的源代碼:

package com.hto.servlet;

import javax.servlet.http.httpservletrequest;

import java.util.*;

/**

* insert the type´s description here.

* creation date: (2001-2-4 15:43:46)

* @author: 錢衛春

*/

public class utf8parameterreader {

hashtable pairs = new hashtable();

/**

* utf8parameterreader constructor comment.

*/

public utf8parameterreader(httpservletrequest request) throws java.io.ioexception{

super();

parse(request.getquerystring());

parse(request.getreader().readline());

}

/**

* utf8parameterreader constructor comment.

*/

public utf8parameterreader(httpservletrequest request,string encoding) throws java.io.ioexception{

super();

parse(request.getquerystring(),encoding);

parse(request.getreader().readline(),encoding);

}

public static string decode(string s) throws exception {

stringbuffer sb = new stringbuffer();

for(int i=0; ichar c = s.charat(i);

switch (c) {

case ´+´:

sb.append(´ ´);

break;

case ´%´:

try {

sb.append((char)integer.parseint(

s.substring(i+1,i+3),16));

}

catch (numberformatexception e) {

throw new illegalargumentexception();

}

i += 2;

break;

default:

sb.append(c);

break;

}

}

// undo conversion to external encoding

string result = sb.tostring();

byte[] inputbytes = result.getbytes("8859_1");

return new string(inputbytes,"utf8");

}

public static string decode(string s,string encoding) throws exception {

stringbuffer sb = new stringbuffer();

for(int i=0; ichar c = s.charat(i);

switch (c) {

case ´+´:

sb.append(´ ´);

break;

case ´%´:

try {

sb.append((char)integer.parseint(

s.substring(i+1,i+3),16));

}

catch (numberformatexception e) {

throw new illegalargumentexception();

}

i += 2;

break;

default:

sb.append(c);

break;

}

}

// undo conversion to external encoding

string result = sb.tostring();

byte[] inputbytes = result.getbytes("8859_1");

return new string(inputbytes,encoding);

}

/**

* insert the method´s description here.

* creation date: (2001-2-4 17:30:59)

* @return java.lang.string

* @param name java.lang.string

*/

public string getparameter(string name) {

if (pairs == null || !pairs.containskey(name)) return null;

return (string)(((arraylist) pairs.get(name)).get(0));

}

/**

* insert the method´s description here.

* creation date: (2001-2-4 17:28:17)

* @return java.util.enumeration

*/

public enumeration getparameternames() {

if (pairs == null) return null;

return pairs.keys();

}

/**

* insert the method´s description here.

* creation date: (2001-2-4 17:33:40)

* @return java.lang.string[]

* @param name java.lang.string

*/

public string[] getparametervalues(string name) {

if (pairs == null || !pairs.containskey(name)) return null;

arraylist al = (arraylist) pairs.get(name);

string[] values = new string[al.size()];

for(int i=0;ivalues[i] = (string) al.get(i);

return values;

}

/**

* insert the method´s description here.

* creation date: (2001-2-4 20:34:37)

* @param urlenc java.lang.string

*/

private void parse(string urlenc) throws java.io.ioexception{

if (urlenc == null) return;

stringtokenizer tok = new stringtokenizer(urlenc,"&");

try{

while (tok.hasmoretokens()){

string apair = tok.nexttoken();

int pos = apair.indexof("=");

string name = null;

string value = null;

if(pos != -1){

name = decode(apair.substring(0,pos));

value = decode(apair.substring(pos+1));

}else{

name = apair;

value = "";

}

if(pairs.containskey(name)){

arraylist values = (arraylist)pairs.get(name);

values.add(value);

}else{

arraylist values = new arraylist();

values.add(value);

pairs.put(name,values);

}

}

}catch(exception e){

throw new java.io.ioexception(e.getmessage());

}

}

/**

* insert the method´s description here.

* creation date: (2001-2-4 20:34:37)

* @param urlenc java.lang.string

*/

private void parse(string urlenc,string encoding) throws java.io.ioexception{

if (urlenc == null) return;

stringtokenizer tok = new stringtokenizer(urlenc,"&");

try{

while (tok.hasmoretokens()){

string apair = tok.nexttoken();

int pos = apair.indexof("=");

string name = null;

string value = null;

if(pos != -1){

name = decode(apair.substring(0,pos),encoding);

value = decode(apair.substring(pos+1),encoding);

}else{

name = apair;

value = "";

}

if(pairs.containskey(name)){

arraylist values = (arraylist)pairs.get(name);

values.add(value);

}else{

arraylist values = new arraylist();

values.add(value);

pairs.put(name,values);

}

}

}catch(exception e){

throw new java.io.ioexception(e.getmessage());

}

}

}

這個類的功能就是讀取并保存form提交的信息,并實現常用的getparameter方法。

package com.hto.servlet;

import java.io.*;

import javax.servlet.*;

import javax.servlet.http.*;

/**

* insert the type´s description here.

* creation date: (2001-2-5 8:28:20)

* @author: 錢衛春

*/

public class utfbaseservlet extends httpservlet {

public static final string params_attr_name = "params_attr_name";

/**

* process incoming http get requests

*

* @param request object that encapsulates the request to the servlet

* @param response object that encapsulates the response from the servlet

*/

public void doget(httpservletrequest request, httpservletresponse response) throws servletexception, ioexception {

performtask(request, response);

}

/**

* process incoming http post requests

*

* @param request object that encapsulates the request to the servlet

* @param response object that encapsulates the response from the servlet

*/

public void dopost(httpservletrequest request, httpservletresponse response) throws servletexception, ioexception {

performtask(request, response);

}

/**

* insert the method´s description here.

* creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.httpservletrequest

* @param name java.lang.string

* @param required boolean

* @param defvalue int

*/

public static java.sql.date getdateparameter(httpservletrequest request, string name, boolean required, java.sql.date defvalue) throws servletexception{

string value = getparameter(request,name,required,string.valueof(defvalue));

return java.sql.date.valueof(value);

}

/**

* insert the method´s description here.

* creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.httpservletrequest

* @param name java.lang.string

* @param required boolean

* @param defvalue int

*/

public static double getdoubleparameter(httpservletrequest request, string name, boolean required, double defvalue) throws servletexception{

string value = getparameter(request,name,required,string.valueof(defvalue));

return double.parsedouble(value);

}

/**

* insert the method´s description here.

* creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.httpservletrequest

* @param name java.lang.string

* @param required boolean

* @param defvalue int

*/

public static float getfloatparameter(httpservletrequest request, string name, boolean required, float defvalue) throws servletexception{

string value = getparameter(request,name,required,string.valueof(defvalue));

return float.parsefloat(value);

}

/**

* insert the method´s description here.

* creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.httpservletrequest

* @param name java.lang.string

* @param required boolean

* @param defvalue int

*/

public static int getintparameter(httpservletrequest request, string name, boolean required, int defvalue) throws servletexception{

string value = getparameter(request,name,required,string.valueof(defvalue));

return integer.parseint(value);

}

/**

* insert the method´s description here.

* creation date: (2001-2-5 8:43:36)

* @return java.lang.string

* @param request javax.servlet.http.httpservletrequest

* @param name java.lang.string

* @param required boolean

* @param defvalue java.lang.string

*/

public static string getparameter(httpservletrequest request, string name, boolean required, string defvalue) throws servletexception{

if(request.getattribute(utfbaseservlet.params_attr_name) != null) {

utf8parameterreader params = (utf8parameterreader)request.getattribute(utfbaseservlet.params_attr_name);

if (params.getparameter(name) != null) return params.getparameter(name);

if (required) throw new servletexception("the parameter "+name+" required but not provided!");

else return defvalue;

}else{

if (request.getparameter(name) != null) return request.getparameter(name);

if (required) throw new servletexception("the parameter "+name+" required but not provided!");

else return defvalue;

}

}

/**

* returns the servlet info string.

*/

public string getservletinfo() {

return super.getservletinfo();

}

/**

* insert the method´s description here.

* creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.httpservletrequest

* @param name java.lang.string

* @param required boolean

* @param defvalue int

*/

public static java.sql.timestamp gettimestampparameter(httpservletrequest request, string name, boolean required, java.sql.timestamp defvalue) throws servletexception{

string value = getparameter(request,name,required,string.valueof(defvalue));

return java.sql.timestamp.valueof(value);

}

/**

* initializes the servlet.

*/

public void init() {

// insert code to initialize the servlet here

}

/**

* process incoming requests for information

*

* @param request object that encapsulates the request to the servlet

* @param response object that encapsulates the response from the servlet

*/

public void performtask(httpservletrequest request, httpservletresponse response) {

try

{

// insert user code from here.

}

catch(throwable theexception)

{

// uncomment the following line when unexpected exceptions

// are occuring to aid in debugging the problem.

//theexception.printstacktrace();

}

}

/**

* insert the method´s description here.

* creation date: (2001-2-5 8:31:54)

* @param request javax.servlet.servletrequest

* @param response javax.servlet.servletresponse

* @exception javax.servlet.servletexception the exception description.

* @exception java.io.ioexception the exception description.

*/

public void service(servletrequest request, servletresponse response) throws javax.servlet.servletexception, java.io.ioexception {

string content = request.getcontenttype();

if(content == null || content != null && content.tolowercase().startswith("application/x-www-form-urlencoded"))

request.setattribute(params_attr_name,new utf8parameterreader((httpservletrequest)request));

super.service(request,response);

}

}

這個就是servlet基類,它覆蓋了父類的service方法,在調用父類service前,創建了utf8parameterreader對象,其中保存了form中提交的信息。然后把這個對象作為一個attribute保存到request對象中。然后照樣調用父類的service方法。

對于繼承這個類的servlet,要注意的是,"標準"getparameter在也不能讀到post的數據,因為在這之前這個類中已經從servletinputstream中讀出了數據了。所以應該使用該類中提供的getparameter方法。

剩下的就是輸出問題了,我們要把輸出的信息,轉為utf8的二進制流輸出。只要我們設置content-type時指定charset為utf8,然后使用printwriter輸出,那么這些轉換是自動進行的,servlet中這樣設置:

response.setcontenttype("text/html;charset=utf8");

jsp中這樣設置:

<%@ page contenttype="text/html;charset=utf8"%>

這樣就可以保證輸出是utf8流,客戶端能否顯示,就看客戶端的了。

對于multipart/form-data的form提交的內容,我也提供一個類用來處理,在這個類的構造子中可以指定頁面使用的charset,默認還是utf-8,限于篇幅不貼出源碼。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 鹤庆县| 青铜峡市| 灵石县| 铁岭县| 拉孜县| 邻水| 手机| 闽清县| 宣威市| 扎兰屯市| 荥阳市| 日土县| 浙江省| 灵璧县| 泗阳县| 固镇县| 凤台县| 鲜城| 云龙县| 大荔县| 霍邱县| 永宁县| 镇坪县| 丰宁| 游戏| 武宁县| 江永县| 昭通市| 丰台区| 福鼎市| 汉源县| 新乡县| 广灵县| 隆化县| 遂川县| 西乡县| 扎赉特旗| 贵德县| 西平县| 东乌| 长春市|