[精讚] [會員登入]
3367

[PHP] 將UTF8中文字轉成10進位或16進位數值

原本為了處理 preg_match 中文字的問題[2],用php把中文字轉換成10進位和6進位的數值編碼

分享此文連結 //n.sfs.tw/10671

分享連結 [PHP] 將UTF8中文字轉成10進位或16進位數值@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2019-10-25 08:15:51 最後編修
2017-01-24 02:06:21 By 張○○
 

自動目錄

為了處理 preg_match 中文字的問題[2],想把中文字轉換成16進位的編碼,如「一」是0xe4b880,好讓程式取用,網路上找不到適合的,有發現HTML用的UNICODE[1],不符需要只好自己來寫。

$str="一籲乂龘";
mb_internal_encoding("UTF-8");
$mlen = mb_strlen($str);
 
for($ii=0;$ii<$mlen; $ii++){
  $w= mb_substr($str,$ii,1);
  $len= strlen( $w);
  print $w .": ";
  for($jj=0;$jj<$len; $jj++){
    print ord( substr($w,$jj,1)). " ";
    $r[$jj]=  dechex( ord( substr($w,$jj,1)));
  }
  print implode($r). "\n";
}

原本想用第一碼來判斷一個中文字的BYTES數[2],後來改用mb_的函數來解決,算是偷懶的作法。

第一碼>=192開頭是2字節
110xxxxx xxxxxxxx
第一碼>=224開頭是3字節
1110xxxx xxxxxxxx xxxxxxxx
第一碼>=240開頭是4字節
11110xxx xxxxxxxx xxxxxxxx xxxxxxxx

執行結果

一: 228 184 128 e4b880
籲: 231 177 178 e7b1b2
乂: 228 185 130 e4b982
龘: 233 190 152 e9be98

如果有字碼該如何印出來,直接把16進位值合裡來放到字串就可以了[3]

echo "\xe6\x88\x91";   //我

或是

echo chr(228).chr(184).chr(128); //一

這轉換最後沒能解決我一開始要處理的中文字字串比對的問題,算有點徒勞,不過也許有人會有需要。

 

判斷中文字?

判斷是否為中文字,只有檢查第一碼是不是>224是不夠的,因為224~240這個區段包含了中文、日文、韓文、一堆符號。

有一些我研究的結果可供參考[4]:

部首

226,188,128=> ⼀
226,191,149=> ⿕

主字群+拓展

227,144,128=> 㐀
233,190,187=> 龻

unicode 兼容漢字

239,164,128=> 豈
239,169,170=> 頻

 

 

參考資料

[1] 中文字轉 HTML UNICODE http://www.csie.ntu.edu.tw/~piaip/unihtml/

[2] 正則匹配中文汉字 http://www.5idev.com/p-php_preg_match.shtml 此例無效

[3] http://www.ptt.cc/bbs/PHP/M.1221550095.A.C82.html

[4] https://www.qqxiuzi.cn/zh/hanzi-unicode-bianma.php


原文 2013-09-23 15:28:25

END

你可能感興趣的文章

[PHP] 移除檔案的UTF8 BOM 移除檔案的UTF8 BOM

PHP程式經驗 #1 -- 靜態的物件比動態物件快 驗證 1. 使用動態物件函式 > 使用靜態物件函式。 2. 使用有宣告的靜態物件函式 > 使用動態無宣告的靜

PHP程式經驗 #2 -- print和echo的差異 常在寫php的人一定會想知道echo和print這兩個函數有什麼不一樣 驗證 1. 比較print 和echo 函式的執

[Codeingitor4] 使用recaptcha v3前後端認證 為了防止機器人說惡意攻擊,我們引入了 recaptcha,此篇結合 php 框架codeignitor4作前後端認證。

[PHP] 隨機產生一個顏色字串 讓PHP 隨機產生一個顏色字串

[PHP>7.3] switch中的 Did you mean to use "continue 2"? 除錯 這近更新 PHP到7.3版以後,出現這樣的錯:targeting switch is equivalent to "break". Did you mean to use "continue 2"?解決方法

我有話要說

>>

限制:留言最高字數1000字。 限制:未登入訪客,每則留言間隔需超過10分鐘,每日最多5則留言。

訪客留言

[無留言]

隨機好文

[Freebsd] 定時測試 ADSL 是否斷線並重連 中華電信 ADSL 雖有固定 ip,可是他卻會不定時「斷線」, 使用以下的 方法可以定時測試是否斷線,以及重新撥接。

好用的3+2碼郵遞區號查詢系統推薦 網路上找到用地址輸入判斷3+2碼郵遞區號的辨識率不高,除了這個網站…

外匯課程經驗 有天遇到某個朋友的正妹朋友,說她有個很棒的外匯投資課程,要我們去聽,只收場地費200大洋。她又說續效最差一個月也有1%,誰還在苦哈哈上班?

海棉寶寶超泡杯演奏的sweet victory 章魚哥和海棉寶寶在超泡杯的演奏歌曲

[NetBeans] 使用git複製別人的專案 NetBeans使用git複製別人的專案及版本控制