[精讚] [會員登入]
1855

[Mysql] Mysqldump 的預設編碼 --default-character-set

有時Mysqldump 也得要指定編碼才不會造成匯出的亂碼

分享此文連結 //n.sfs.tw/11028

分享連結 [Mysql] Mysqldump 的預設編碼 --default-character-set@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2019-10-19 04:04:37 最後編修
2017-05-04 00:38:00 By 張○○
 

以前的經驗,寫下來以免忘記。

之前朋友的一個資料庫 BIG5 要我幫忙轉成 utf-8 的編碼。發現:

[資料庫 DB1]-->mysqldump --> 餵回[資料庫 DB2]   只能用原始程式開啟無亂碼,console或phpmyadmin中都是亂碼。
[資料庫 DB1]-->mysqldump --> piconv  -f big5 -t utf8 -->轉成一堆亂碼-->餵回[資料庫 DB2]  都是亂碼。

於是我仔細研究他的資料庫,以及他的程式的存取方法,發現是這樣的:

show variables like 'character%';

資料庫校對:utf8_bin
資料庫連線:latin1

character_set_client latin1
character_set_connection latin1
character_set_database latin1
character_set_filesystem binary
character_set_results latin1
character_set_server latin1
character_set_system utf8

資料庫內容:big5

這意思是不是說?

  存放在 utf8 編碼的資料庫中的 big5 編碼字元,但是要用latin1 的編碼連線取出

不,我後來又想了想,猜測應該是:

  big5的字元(中文字2字元)用latin1的字元集(character set)來保存,所以取時,也用同樣的字元集來取出。至於資料庫校對(utf8)和取出連線沒有關係。

  如果我沒有指定字元集,就會用預設的(可能是utf8)來取出資料庫中的資料,那可能會把字元組合切得亂七八糟(例如原本二個字元組一個big5中文字,在latin1中拆成一個一個獨立字元,結果用utf8的規則取出來,可能三個字元取出當一個中文字。

做了很多失敗的嘗試,後來才想到,那取出時就一定要先指字編碼的方式,才會是正常的結果。

所以我改下指令來 dump 時,把預設的 charset 寫入。

$ mysqldump --default-character-set=latin1 -u root -p -B DB1 > DB1_in_big5.sql

然後再 iconv

$ piconv -f big5 -t utf8 DB1_in_big5.sql> DB1_in_utf8.sql

最後再餵回去,成功。

這樣,我就順利的把資料庫 BIG5 全部轉成 utf-8 的編碼再餵回去。


原文 2010-04-24 17:46:55

END

你可能感興趣的文章

[Docker] Mariadb-Galera出現Incorrect definition of table mysql.column_stats:'hist_type'及 'histogram' 使用docker的Mariadb-galera出現'hist_type'及 'histogram'型別錯誤的解決方法。

Mysql 安裝完畢要做的事 Mysql 安裝完畢後,該處理的流程

[Mysql/MariaDB] 表格的引擎 (engine):查看及修改 MySQL表格引擎預設為 MyISAM,但在4.0以上的mysql 其實支援不只一種引擎,各有優缺點,這篇介紹引擎的操作。

[MYSQL] 設定字串欄位的預設值 新增表格的時候,字串欄位給予預設空值;數字欄位給預設數值;日期欄位給空值。

[Mysql/Mariadb] 檢查、修復及優化資料庫 mysql/mariadb 檢查、修復及優化資料庫

[Mysql] 使用索引來加速搜尋 只要是常常用到搜索條件的欄位,就應該把它設成索引鍵,有無設定的速度差可能會好幾倍

隨機好文

[bc] linux 的計算機 bc 設定小數位數、計算π、次方根 linux 的計算機 bc 設定小數位數、計算π、次方根

NETCRAFT發現你的網站及作業系統 NETCRAFT可以發現你的網站及作業系統

詭異的創業思維 創業的思維中,有多少銀彈,有多少技術,有多少人脈,有多少時間等等,每個都要考慮進去,以熱忱建立的關係脆弱的像蘇打餅乾一樣..

外匯課程經驗 有天遇到某個朋友的正妹朋友,說她有個很棒的外匯投資課程,要我們去聽,只收場地費200大洋。她又說續效最差一個月也有1%,誰還在苦哈哈上班?

正則表達式:Email名稱防止連續輸入點(.)及下底線(_) Email的名稱中要允許特殊符號,但又不允許連續出現的正則表達式