[PHP] 字串編碼及解碼函式

URL Link //n.sfs.tw/12803

2018-10-12 01:35:07 By 張○○

為何要將字串編碼?理由很簡單,就是不要讓人家輕易的知道字串內容是什麼。例如點選分頁時,我們常會用這樣的連結:

index.php?pg=1

顯而易見的,當我們將 URI 改成 pg=2,則他就會到第二頁,假如全部的資料只有2頁,而使用者在瀏覽器的網址輸入index.php?pg=99 時會怎麼樣?初心級的程設師無法預料使用者會有這種行為,所以畫面不是錯誤就是取得不該取得的資料。

進階的程式師可能會進行邊界檢查,濾掉超出的值。但字串要濾掉或檢查就不是件容易的事,搞不好還會變成 SQL injection或URL injection或XSS的漏洞。

此外,當帶有多個參數時,這個問題就麻煩了,程設師得一一檢查,頗為麻煩:所以有一次性的解決方法,就是將帶的資料全部加密。

所謂加密可分兩類:單向、雙向。單向的加密後是極難被解密的,例如md5, sha等,而雙向加密則可以利用key解,例如ssh, ssl, base64等,而我們的目的一定是要能編碼再解碼,所以一定要採用雙向加密法。

如果要加密一個字串,就是要他的亂度增加,自己試過很多方法去增加亂度,發現效果都不好。最後在大陸站找到一個不錯的函式,據說是中國人對PHP最有貢獻的函式:discuz[1]的 authcode 函數,把原文貼於下.. 

// 参数解释
// $string: 明文 或 密文
// $operation:DECODE表示解密,其它表示加密
// $key: 密匙
// $expiry:密文有效期
function authcode($string, $operation = 'DECODE', $key = '', $expiry = 0) {
// 动态密匙长度,相同的明文会生成不同密文就是依靠动态密匙
// 加入随机密钥,可以令密文无任何规律,即便是原文和密钥完全相同,加密结果也会每次不同,增大破解难度。
// 取值越大,密文变动规律越大,密文变化 = 16 的 $ckey_length 次方
// 当此值为 0 时,则不产生随机密钥
     $ckey_length = 4;
// 密匙
     $key = md5($key ? $key : $GLOBALS['discuz_auth_key']);
// 密匙a会参与加解密
     $keya = md5(substr($key, 0, 16));
// 密匙b会用来做数据完整性验证
     $keyb = md5(substr($key, 16, 16));
// 密匙c用于变化生成的密文
     $keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : '';
// 参与运算的密匙
     $cryptkey = $keya.md5($keya.$keyc);
     $key_length = strlen($cryptkey);
// 明文,前10位用来保存时间戳,解密时验证数据有效性,10到26位用来保存$keyb(密匙b),解密时会通过这个密匙验证数据完整性
// 如果是解码的话,会从第$ckey_length位开始,因为密文前$ckey_length位保存 动态密匙,以保证解密正确
     $string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string;
    $string_length = strlen($string);
    $result = '';
    $box = range(0, 255);
    $rndkey = array();
// 产生密匙簿
    for($i = 0; $i <= 255; $i++) {
        $rndkey[$i] = ord($cryptkey[$i % $key_length]);
    }
// 用固定的算法,打乱密匙簿,增加随机性,好像很复杂,实际上并不会增加密文的强度
    for($j = $i = 0; $i < 256; $i++) {
        $j = ($j + $box[$i] + $rndkey[$i]) % 256;
        $tmp = $box[$i];
        $box[$i] = $box[$j];
        $box[$j] = $tmp;
    }
// 核心加解密部分
    for($a = $j = $i = 0; $i < $string_length; $i++) {
        $a = ($a + 1) % 256;
        $j = ($j + $box[$a]) % 256;
        $tmp = $box[$a];
        $box[$a] = $box[$j];
        $box[$j] = $tmp;
// 从密匙簿得出密匙进行异或,再转成字符
        $result .= chr(ord($string[$i]) ^ ($box[($box[$a] + $box[$j]) % 256]));
    }
    if($operation == 'DECODE') {
// substr($result, 0, 10) == 0 验证数据有效性
// substr($result, 0, 10) - time() > 0 验证数据有效性
// substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16) 验证数据完整性
// 验证数据有效性,请看未加密明文的格式
        if((substr($result, 0, 10) == 0 || substr($result, 0, 10) - time() > 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) {
            return substr($result, 26);
        } else {
            return '';
        }
    } else {
// 把动态密匙保存在密文里,这也是为什么同样的明文,生产不同密文后能解密的原因
// 因为加密后的密文可能是一些特殊字符,复制过程可能会丢失,所以用base64编码
    return $keyc.str_replace('=', '', base64_encode($result));
    }
}

這個函式可以把字串加密,而亂度極高,非常實用,但是用在 uri 就不行了,因為這個函式會把結果字串再經過 base64的加密,加密字串中會有'+', '/', '='等字元;而 uri 上面帶有 ('+', '/', '=') 是別的意義。所以必須用 ('','-','_') 來取代

所以我改寫了一個 URIAuthcode($string, $operation = 'DECODE', $key = '', $expiry = 0) 差別只是加了字串的取代,其餘是相同的。由於原函式寫得相當好,我完全沒法修改。

function URIAuthcode($string, $operation = 'DECODE', $key = '', $expiry = 0) {
    if( $operation == 'DECODE') $string=str_replace(array("-","_"), array('+','/'),$string);
    $ckey_length = 4;
    $key = md5($key ? $key : $GLOBALS['discuz_auth_key']);
    $keya = md5(substr($key, 0, 16));
    $keyb = md5(substr($key, 16, 16));
    $keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : '';
    $cryptkey = $keya.md5($keya.$keyc);
    $key_length = strlen($cryptkey);
    $string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string;
    $string_length = strlen($string);
    $result = '';
    $box = range(0, 255);
    $rndkey = array();
    for($i = 0; $i <= 255; $i++) {
        $rndkey[$i] = ord($cryptkey[$i % $key_length]);
    }
    for($j = $i = 0; $i < 256; $i++) {
        $j = ($j + $box[$i] + $rndkey[$i]) % 256;
        $tmp = $box[$i];
        $box[$i] = $box[$j];
        $box[$j] = $tmp;
    }
    for($a = $j = $i = 0; $i < $string_length; $i++) {
        $a = ($a + 1) % 256;
        $j = ($j + $box[$a]) % 256;
        $tmp = $box[$a];
        $box[$a] = $box[$j];
        $box[$j] = $tmp;
        $result .= chr(ord($string[$i]) ^ ($box[($box[$a] + $box[$j]) % 256]));
    }
    if($operation == 'DECODE') {
        if((substr($result, 0, 10) == 0 || substr($result, 0, 10) - time() > 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) {
            return substr($result, 26);
        } else {
            return '';
        }
    } else {
        return $keyc.str_replace(array("=","+","/"), array('','-','_'), base64_encode($result));
    }
}

另外再撰寫兩個簡單的函式,功能是將 Request URI 上的參數變成陣列再編碼,例如要輸出的 URL為
index.php?f=1&s=2&q=test
則參數字串 $arr= array("f"=>1, "s"=>2, "q"=>"test")

利用我的函式就可以輕易轉成加密後的字串值(我稱為c 值)
$c=Encrypt_Arr2c($arr, $key, $expiry = 0);
在輸出字串時,就可以用一個加密後的c值代替,例如:
$url ="http://path.to/index.php?c=".$c;

當程式$_GET['c'] 時,再使用函數反向轉回陣列
$c=$_GET['c'] ;
$arr=Decrypt_c2Arr($c, $key, $expiry = 0);

把這兩個函式放在同一個class即可叫用。

function Decrypt_c2Arr($c, $key, $expiry = 0){
        $str = $this->URIAuthcode($c, "DECODE", $key, $expiry);
        $arr=json_decode($str, true);
        return $arr;
}

function Encrypt_Arr2c($arr, $key, $expiry = 0){
        $str= json_encode($arr);
        return $this->URIAuthcode($str, "ENCODE", $key, $expiry);
 }

 

參考資料

[1] http://www.akii.org/2009-02/discuz-encryption-and-decryption-functions-authcode-analysis/


原文 2009-12-05