為何要將字串編碼?理由很簡單,就是不要讓人家輕易的知道字串內容是什麼。例如點選分頁時,我們常會用這樣的連結:
index.php?pg=1
顯而易見的,當我們將 URI 改成 pg=2,則他就會到第二頁,假如全部的資料只有2頁,而使用者在瀏覽器的網址輸入index.php?pg=99 時會怎麼樣?初心級的程設師無法預料使用者會有這種行為,所以畫面不是錯誤就是取得不該取得的資料。
進階的程式師可能會進行邊界檢查,濾掉超出的值。但字串要濾掉或檢查就不是件容易的事,搞不好還會變成 SQL injection或URL injection或XSS的漏洞。
此外,當帶有多個參數時,這個問題就麻煩了,程設師得一一檢查,頗為麻煩:所以有一次性的解決方法,就是將帶的資料全部加密。
所謂加密可分兩類:單向、雙向。單向的加密後是極難被解密的,例如md5, sha等,而雙向加密則可以利用key解,例如ssh, ssl, base64等,而我們的目的一定是要能編碼再解碼,所以一定要採用雙向加密法。
如果要加密一個字串,就是要他的亂度增加,自己試過很多方法去增加亂度,發現效果都不好。最後在大陸站找到一個不錯的函式,據說是中國人對PHP最有貢獻的函式:discuz[1]的 authcode 函數,把原文貼於下..
// 参数解释
// $string: 明文 或 密文
// $operation:DECODE表示解密,其它表示加密
// $key: 密匙
// $expiry:密文有效期
function authcode($string, $operation = 'DECODE', $key = '', $expiry = 0) {
// 动态密匙长度,相同的明文会生成不同密文就是依靠动态密匙
// 加入随机密钥,可以令密文无任何规律,即便是原文和密钥完全相同,加密结果也会每次不同,增大破解难度。
// 取值越大,密文变动规律越大,密文变化 = 16 的 $ckey_length 次方
// 当此值为 0 时,则不产生随机密钥
$ckey_length = 4;
// 密匙
$key = md5($key ? $key : $GLOBALS['discuz_auth_key']);
// 密匙a会参与加解密
$keya = md5(substr($key, 0, 16));
// 密匙b会用来做数据完整性验证
$keyb = md5(substr($key, 16, 16));
// 密匙c用于变化生成的密文
$keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : '';
// 参与运算的密匙
$cryptkey = $keya.md5($keya.$keyc);
$key_length = strlen($cryptkey);
// 明文,前10位用来保存时间戳,解密时验证数据有效性,10到26位用来保存$keyb(密匙b),解密时会通过这个密匙验证数据完整性
// 如果是解码的话,会从第$ckey_length位开始,因为密文前$ckey_length位保存 动态密匙,以保证解密正确
$string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string;
$string_length = strlen($string);
$result = '';
$box = range(0, 255);
$rndkey = array();
// 产生密匙簿
for($i = 0; $i <= 255; $i++) {
$rndkey[$i] = ord($cryptkey[$i % $key_length]);
}
// 用固定的算法,打乱密匙簿,增加随机性,好像很复杂,实际上并不会增加密文的强度
for($j = $i = 0; $i < 256; $i++) {
$j = ($j + $box[$i] + $rndkey[$i]) % 256;
$tmp = $box[$i];
$box[$i] = $box[$j];
$box[$j] = $tmp;
}
// 核心加解密部分
for($a = $j = $i = 0; $i < $string_length; $i++) {
$a = ($a + 1) % 256;
$j = ($j + $box[$a]) % 256;
$tmp = $box[$a];
$box[$a] = $box[$j];
$box[$j] = $tmp;
// 从密匙簿得出密匙进行异或,再转成字符
$result .= chr(ord($string[$i]) ^ ($box[($box[$a] + $box[$j]) % 256]));
}
if($operation == 'DECODE') {
// substr($result, 0, 10) == 0 验证数据有效性
// substr($result, 0, 10) - time() > 0 验证数据有效性
// substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16) 验证数据完整性
// 验证数据有效性,请看未加密明文的格式
if((substr($result, 0, 10) == 0 || substr($result, 0, 10) - time() > 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) {
return substr($result, 26);
} else {
return '';
}
} else {
// 把动态密匙保存在密文里,这也是为什么同样的明文,生产不同密文后能解密的原因
// 因为加密后的密文可能是一些特殊字符,复制过程可能会丢失,所以用base64编码
return $keyc.str_replace('=', '', base64_encode($result));
}
}
這個函式可以把字串加密,而亂度極高,非常實用,但是用在 uri 就不行了,因為這個函式會把結果字串再經過 base64的加密,加密字串中會有'+', '/', '='等字元;而 uri 上面帶有 ('+', '/', '=') 是別的意義。所以必須用 ('','-','_') 來取代。
所以我改寫了一個 URIAuthcode($string, $operation = 'DECODE', $key = '', $expiry = 0) 差別只是加了字串的取代,其餘是相同的。由於原函式寫得相當好,我完全沒法修改。
function URIAuthcode($string, $operation = 'DECODE', $key = '', $expiry = 0) {
if( $operation == 'DECODE') $string=str_replace(array("-","_"), array('+','/'),$string);
$ckey_length = 4;
$key = md5($key ? $key : $GLOBALS['discuz_auth_key']);
$keya = md5(substr($key, 0, 16));
$keyb = md5(substr($key, 16, 16));
$keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : '';
$cryptkey = $keya.md5($keya.$keyc);
$key_length = strlen($cryptkey);
$string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string;
$string_length = strlen($string);
$result = '';
$box = range(0, 255);
$rndkey = array();
for($i = 0; $i <= 255; $i++) {
$rndkey[$i] = ord($cryptkey[$i % $key_length]);
}
for($j = $i = 0; $i < 256; $i++) {
$j = ($j + $box[$i] + $rndkey[$i]) % 256;
$tmp = $box[$i];
$box[$i] = $box[$j];
$box[$j] = $tmp;
}
for($a = $j = $i = 0; $i < $string_length; $i++) {
$a = ($a + 1) % 256;
$j = ($j + $box[$a]) % 256;
$tmp = $box[$a];
$box[$a] = $box[$j];
$box[$j] = $tmp;
$result .= chr(ord($string[$i]) ^ ($box[($box[$a] + $box[$j]) % 256]));
}
if($operation == 'DECODE') {
if((substr($result, 0, 10) == 0 || substr($result, 0, 10) - time() > 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) {
return substr($result, 26);
} else {
return '';
}
} else {
return $keyc.str_replace(array("=","+","/"), array('','-','_'), base64_encode($result));
}
}
另外再撰寫兩個簡單的函式,功能是將 Request URI 上的參數變成陣列再編碼,例如要輸出的 URL為
index.php?f=1&s=2&q=test
則參數字串 $arr= array("f"=>1, "s"=>2, "q"=>"test")
利用我的函式就可以輕易轉成加密後的字串值(我稱為c 值)
$c=Encrypt_Arr2c($arr, $key, $expiry = 0);
在輸出字串時,就可以用一個加密後的c值代替,例如:
$url ="http://path.to/index.php?c=".$c;
當程式$_GET['c'] 時,再使用函數反向轉回陣列
$c=$_GET['c'] ;
$arr=Decrypt_c2Arr($c, $key, $expiry = 0);
把這兩個函式放在同一個class即可叫用。
function Decrypt_c2Arr($c, $key, $expiry = 0){
$str = $this->URIAuthcode($c, "DECODE", $key, $expiry);
$arr=json_decode($str, true);
return $arr;
}
function Encrypt_Arr2c($arr, $key, $expiry = 0){
$str= json_encode($arr);
return $this->URIAuthcode($str, "ENCODE", $key, $expiry);
}
參考資料
[1] http://www.akii.org/2009-02/discuz-encryption-and-decryption-functions-authcode-analysis/
原文 2009-12-05
