在使用 ?id=”中文” 傳遞中文參數時,出現了亂碼,這是經過了二次轉碼后的結果,其中,在 php 中,url 中是不可以直接傳輸中文的,對于這點,一直心存不滿,沒辦法呀,誰讓咱沒一套解決方案呢,不知道別的語言是不是也出現這樣的問題。
對于網上所說的在首頁添加 header(“content-type:text/html;charset=utf-8″); 這樣的代碼,以及把數據庫頁面等等設置成 utf8 的解決方案根本無效,始終傳遞過來的中文是亂碼。
盡管所有04ie.com站點PHP 我都是用的統一的 utf8 編碼,但始終傳遞過去是亂碼,后來測試了幾個瀏覽器,發現 360 可以傳遞過去,而 IE 不行,后來再使用 $msg = iconv(‘gbk’,'utf-8′,$_GET["msg"]); 進行轉換,測試幾個瀏覽器后,大多還是顯示亂碼的問題。
最后總結了一點,對于 GET[] 過去的值,url 中不可以直接傳輸中文,如果必須要傳輸的話,用 urlencode() 方法來處理中文。對于 POST[] 不知道怎么樣,暫時還沒有做過實驗。
再來PHP手冊上查下urlencode()的使用:urlencode() 本函數將字符串以 URL 編碼。例如空格就會變成加號。Homepage 中 form 資料傳送就是用 urlencode 編碼后再送出
原來如此,我說呢為什么從form表單提交過來的就沒有問題,但是url傳遞過來的就亂碼
本工具分別實現兩種方式的Encode與Decode:
中文 -> GB2312的Encode -> %D6%D0%CE%C4
中文 -> UTF-8的Encode -> %E4%B8%AD%E6%96%87
Html中的URLEncode:
編碼為GB2312的html文件中:/中文.rar -> 瀏覽器自動轉換為 -> /%D6%D0%CE%C4.rar
注意:Firefox對GB2312的Encode的中文URL支持不好,因為它默認是UTF-8編碼發送URL的,但是ftp://協議可以,我試過了,我認為這應該算是Firefox一個bug。
編碼為UTF-8的html文件中:/中文.rar -> 瀏覽器自動轉換為 -> /%E4%B8%AD%E6%96%87.rar
PHP中的URLEncode:
- <?php
- //GB2312的Encode
- echo urlencode("中文-_. ")."n"; //%D6%D0%CE%C4-_.+
- echo urldecode("%D6%D0%CE%C4-_. ")."n"; //中文-_.
- echo rawurlencode("中文-_. ")."n"; //%D6%D0%CE%C4-_.%20
- echo rawurldecode("%D6%D0%CE%C4-_. ")."n"; //中文-_.
- ?>
除了“-_.”之外的所有非字母數字字符都將被替換成百分號“%”后跟兩位十六進制數。
urlencode和rawurlencode的區別:urlencode將空格編碼為加號“+”,rawurlencode將空格編碼為加號“%20”。
如果要使用UTF-8的Encode,有兩種方法:
一、將文件存為UTF-8文件,直接使用urlencode、rawurlencode即可。
二、使用mb_convert_encoding函數:
- <?php
- $url = '/中文.rar';
- echo urlencode(mb_convert_encoding($url, 'utf-8', 'gb2312'))."n";
- echo rawurlencode(mb_convert_encoding($url, 'utf-8', 'gb2312'))."n";
- //http%3A%2F%2Fs.%2F%E4%B8%AD%E6%96%87.rar
- ?>
實例代碼如下:
- <?php
- function parseurl($url="")
- {
- $url = rawurlencode(mb_convert_encoding($url, 'gb2312', 'utf-8'));
- $a = array("%3A", "%2F", "%40");
- $b = array(":", "/", "@");
- $url = str_replace($a, $b, $url);
- return $url;
- }
- $url="ftp://ud03:password@s./中文/中文.rar";
- echo parseurl($url);
- //ftp://ud03:password@s./%D6%D0%CE%C4/%D6%D0%CE%C4.rar
- ?>
如:%E4%B8%AD%E6%96%87-_.%20%E4%B8%AD%E6%96%87-_.%20
看來也只有用 urlencode() 方法來處理中文了,在傳遞之前要先進行編碼,傳遞過去之后再進行解決就可以了,那么利用如下兩個函數:編碼:”.urlencode(‘中文’).”,解碼:”.urldecode(‘中文’).”,括號里的中文就是傳遞的字符了。
如下:傳遞頁面先進行04ie.com編碼:td.php?id=”.urlencode(‘中文’).”,接受頁面進行解碼即可:urldecode(id).”,附一個函數:
- if (preg_match("/^([".chr(228)."-".chr(233)."]{1} [".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1})+$/",$msg)) //如果$msg是UTF-8編碼
- {
- $msg = iconv("UTF-8","GB2312",$msg); //將 $msg 由UTF-8編碼轉為GB2312編碼
- }
新聞熱點
疑難解答