[精讚] [會員登入]
1945

[Mysql] Mysqldump 的預設編碼 --default-character-set

有時Mysqldump 也得要指定編碼才不會造成匯出的亂碼

分享此文連結 //n.sfs.tw/11028

分享連結 [Mysql] Mysqldump 的預設編碼 --default-character-set@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2019-10-19 04:04:37 最後編修
2017-05-04 00:38:00 By 張○○
 

以前的經驗,寫下來以免忘記。

之前朋友的一個資料庫 BIG5 要我幫忙轉成 utf-8 的編碼。發現:

[資料庫 DB1]-->mysqldump --> 餵回[資料庫 DB2]   只能用原始程式開啟無亂碼,console或phpmyadmin中都是亂碼。
[資料庫 DB1]-->mysqldump --> piconv  -f big5 -t utf8 -->轉成一堆亂碼-->餵回[資料庫 DB2]  都是亂碼。

於是我仔細研究他的資料庫,以及他的程式的存取方法,發現是這樣的:

show variables like 'character%';

資料庫校對:utf8_bin
資料庫連線:latin1

character_set_client latin1
character_set_connection latin1
character_set_database latin1
character_set_filesystem binary
character_set_results latin1
character_set_server latin1
character_set_system utf8

資料庫內容:big5

這意思是不是說?

  存放在 utf8 編碼的資料庫中的 big5 編碼字元,但是要用latin1 的編碼連線取出

不,我後來又想了想,猜測應該是:

  big5的字元(中文字2字元)用latin1的字元集(character set)來保存,所以取時,也用同樣的字元集來取出。至於資料庫校對(utf8)和取出連線沒有關係。

  如果我沒有指定字元集,就會用預設的(可能是utf8)來取出資料庫中的資料,那可能會把字元組合切得亂七八糟(例如原本二個字元組一個big5中文字,在latin1中拆成一個一個獨立字元,結果用utf8的規則取出來,可能三個字元取出當一個中文字。

做了很多失敗的嘗試,後來才想到,那取出時就一定要先指字編碼的方式,才會是正常的結果。

所以我改下指令來 dump 時,把預設的 charset 寫入。

$ mysqldump --default-character-set=latin1 -u root -p -B DB1 > DB1_in_big5.sql

然後再 iconv

$ piconv -f big5 -t utf8 DB1_in_big5.sql> DB1_in_utf8.sql

最後再餵回去,成功。

這樣,我就順利的把資料庫 BIG5 全部轉成 utf-8 的編碼再餵回去。


原文 2010-04-24 17:46:55

END

你可能感興趣的文章

[MySQL/Mariadb] 正規表達式(regular express) mysql的正規表達式很詭異,很不能接受

[Mysql] 使用索引來加速搜尋 只要是常常用到搜索條件的欄位,就應該把它設成索引鍵,有無設定的速度差可能會好幾倍

[MySQL/Mariadb] console 將查詢結果輸出到檔案 在mysql 的console中該如何將查詢結果輸出到檔案?

[Mysql/MariaDB] 查看資料庫所占空間 查看資料庫在磁碟中所占空間

[Mysql/Mariadb] 建立使用者及資料庫 Mysql/Mariadb建立使用者、刪除使用者、給予權限、建立資料庫

[phpmyadmin] 登錄超時 (1440 秒未操作),請重新登錄 phpmyadmin登錄超時 (1440 秒未操作),請重新登錄的問題,該如何解決?

隨機好文

[HP DL380G7] 生效啟動第3,4片網卡/開啟或關閉內建的網卡 HP DL380G7 預設第3,4片網卡裝完系統後找不到,難道是壞了?要怎麼辦?

[Freebsd] 使用 ADSL 撥接上網 Freebsd上要使用 ADSL 撥接上網,該如何設定?

好用的3+2碼郵遞區號查詢系統推薦 網路上找到用地址輸入判斷3+2碼郵遞區號的辨識率不高,除了這個網站…

詭異的創業思維 創業的思維中,有多少銀彈,有多少技術,有多少人脈,有多少時間等等,每個都要考慮進去,以熱忱建立的關係脆弱的像蘇打餅乾一樣..

正則表達式:Email名稱防止連續輸入點(.)及下底線(_) Email的名稱中要允許特殊符號,但又不允許連續出現的正則表達式