為何要將字串編碼?理由很簡單,就是不要讓人家輕易的知道字串內容是什麼。例如點選分頁時,我們常會用這樣的連結:
index.php?pg=1
顯而易見的,當我們將 URI 改成 pg=2,則他就會到第二頁,假如全部的資料只有2頁,而使用者在瀏覽器的網址輸入index.php?pg=99 時會怎麼樣?初心級的程設師無法預料使用者會有這種行為,所以畫面不是錯誤就是取得不該取得的資料。
進階的程式師可能會進行邊界檢查,濾掉超出的值。但字串要濾掉或檢查就不是件容易的事,搞不好還會變成 SQL injection或URL injection或XSS的漏洞。
此外,當帶有多個參數時,這個問題就麻煩了,程設師得一一檢查,頗為麻煩:所以有一次性的解決方法,就是將帶的資料全部加密。
所謂加密可分兩類:單向、雙向。單向的加密後是極難被解密的,例如md5, sha等,而雙向加密則可以利用key解,例如ssh, ssl, base64等,而我們的目的一定是要能編碼再解碼,所以一定要採用雙向加密法。
如果要加密一個字串,就是要他的亂度增加,自己試過很多方法去增加亂度,發現效果都不好。最後在大陸站找到一個不錯的函式,據說是中國人對PHP最有貢獻的函式:discuz[1]的 authcode 函數,把原文貼於下..
// 参数解释 // $string: 明文 或 密文 // $operation:DECODE表示解密,其它表示加密 // $key: 密匙 // $expiry:密文有效期 function authcode($string, $operation = 'DECODE', $key = '', $expiry = 0) { // 动态密匙长度,相同的明文会生成不同密文就是依靠动态密匙 // 加入随机密钥,可以令密文无任何规律,即便是原文和密钥完全相同,加密结果也会每次不同,增大破解难度。 // 取值越大,密文变动规律越大,密文变化 = 16 的 $ckey_length 次方 // 当此值为 0 时,则不产生随机密钥 $ckey_length = 4; // 密匙 $key = md5($key ? $key : $GLOBALS['discuz_auth_key']); // 密匙a会参与加解密 $keya = md5(substr($key, 0, 16)); // 密匙b会用来做数据完整性验证 $keyb = md5(substr($key, 16, 16)); // 密匙c用于变化生成的密文 $keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : ''; // 参与运算的密匙 $cryptkey = $keya.md5($keya.$keyc); $key_length = strlen($cryptkey); // 明文,前10位用来保存时间戳,解密时验证数据有效性,10到26位用来保存$keyb(密匙b),解密时会通过这个密匙验证数据完整性 // 如果是解码的话,会从第$ckey_length位开始,因为密文前$ckey_length位保存 动态密匙,以保证解密正确 $string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string; $string_length = strlen($string); $result = ''; $box = range(0, 255); $rndkey = array(); // 产生密匙簿 for($i = 0; $i <= 255; $i++) { $rndkey[$i] = ord($cryptkey[$i % $key_length]); } // 用固定的算法,打乱密匙簿,增加随机性,好像很复杂,实际上并不会增加密文的强度 for($j = $i = 0; $i < 256; $i++) { $j = ($j + $box[$i] + $rndkey[$i]) % 256; $tmp = $box[$i]; $box[$i] = $box[$j]; $box[$j] = $tmp; } // 核心加解密部分 for($a = $j = $i = 0; $i < $string_length; $i++) { $a = ($a + 1) % 256; $j = ($j + $box[$a]) % 256; $tmp = $box[$a]; $box[$a] = $box[$j]; $box[$j] = $tmp; // 从密匙簿得出密匙进行异或,再转成字符 $result .= chr(ord($string[$i]) ^ ($box[($box[$a] + $box[$j]) % 256])); } if($operation == 'DECODE') { // substr($result, 0, 10) == 0 验证数据有效性 // substr($result, 0, 10) - time() > 0 验证数据有效性 // substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16) 验证数据完整性 // 验证数据有效性,请看未加密明文的格式 if((substr($result, 0, 10) == 0 || substr($result, 0, 10) - time() > 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) { return substr($result, 26); } else { return ''; } } else { // 把动态密匙保存在密文里,这也是为什么同样的明文,生产不同密文后能解密的原因 // 因为加密后的密文可能是一些特殊字符,复制过程可能会丢失,所以用base64编码 return $keyc.str_replace('=', '', base64_encode($result)); } }
這個函式可以把字串加密,而亂度極高,非常實用,但是用在 uri 就不行了,因為這個函式會把結果字串再經過 base64的加密,加密字串中會有'+', '/', '='等字元;而 uri 上面帶有 ('+', '/', '=') 是別的意義。所以必須用 ('','-','_') 來取代。
所以我改寫了一個 URIAuthcode($string, $operation = 'DECODE', $key = '', $expiry = 0) 差別只是加了字串的取代,其餘是相同的。由於原函式寫得相當好,我完全沒法修改。
function URIAuthcode($string, $operation = 'DECODE', $key = '', $expiry = 0) { if( $operation == 'DECODE') $string=str_replace(array("-","_"), array('+','/'),$string); $ckey_length = 4; $key = md5($key ? $key : $GLOBALS['discuz_auth_key']); $keya = md5(substr($key, 0, 16)); $keyb = md5(substr($key, 16, 16)); $keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : ''; $cryptkey = $keya.md5($keya.$keyc); $key_length = strlen($cryptkey); $string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string; $string_length = strlen($string); $result = ''; $box = range(0, 255); $rndkey = array(); for($i = 0; $i <= 255; $i++) { $rndkey[$i] = ord($cryptkey[$i % $key_length]); } for($j = $i = 0; $i < 256; $i++) { $j = ($j + $box[$i] + $rndkey[$i]) % 256; $tmp = $box[$i]; $box[$i] = $box[$j]; $box[$j] = $tmp; } for($a = $j = $i = 0; $i < $string_length; $i++) { $a = ($a + 1) % 256; $j = ($j + $box[$a]) % 256; $tmp = $box[$a]; $box[$a] = $box[$j]; $box[$j] = $tmp; $result .= chr(ord($string[$i]) ^ ($box[($box[$a] + $box[$j]) % 256])); } if($operation == 'DECODE') { if((substr($result, 0, 10) == 0 || substr($result, 0, 10) - time() > 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) { return substr($result, 26); } else { return ''; } } else { return $keyc.str_replace(array("=","+","/"), array('','-','_'), base64_encode($result)); } }
另外再撰寫兩個簡單的函式,功能是將 Request URI 上的參數變成陣列再編碼,例如要輸出的 URL為
index.php?f=1&s=2&q=test
則參數字串 $arr= array("f"=>1, "s"=>2, "q"=>"test")
利用我的函式就可以輕易轉成加密後的字串值(我稱為c 值)
$c=Encrypt_Arr2c($arr, $key, $expiry = 0);
在輸出字串時,就可以用一個加密後的c值代替,例如:
$url ="http://path.to/index.php?c=".$c;
當程式$_GET['c'] 時,再使用函數反向轉回陣列
$c=$_GET['c'] ;
$arr=Decrypt_c2Arr($c, $key, $expiry = 0);
把這兩個函式放在同一個class即可叫用。
function Decrypt_c2Arr($c, $key, $expiry = 0){ $str = $this->URIAuthcode($c, "DECODE", $key, $expiry); $arr=json_decode($str, true); return $arr; } function Encrypt_Arr2c($arr, $key, $expiry = 0){ $str= json_encode($arr); return $this->URIAuthcode($str, "ENCODE", $key, $expiry); }
參考資料
[1] http://www.akii.org/2009-02/discuz-encryption-and-decryption-functions-authcode-analysis/
原文 2009-12-05