[精讚] [會員登入]
1544

[Mysql] Mysqldump 的預設編碼 --default-character-set

有時Mysqldump 也得要指定編碼才不會造成匯出的亂碼

分享此文連結 //n.sfs.tw/11028

分享連結 [Mysql] Mysqldump 的預設編碼 --default-character-set@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2019-10-19 04:04:37 最後編修
2017-05-04 00:38:00 By 張○○
 

以前的經驗,寫下來以免忘記。

之前朋友的一個資料庫 BIG5 要我幫忙轉成 utf-8 的編碼。發現:

[資料庫 DB1]-->mysqldump --> 餵回[資料庫 DB2]   只能用原始程式開啟無亂碼,console或phpmyadmin中都是亂碼。
[資料庫 DB1]-->mysqldump --> piconv  -f big5 -t utf8 -->轉成一堆亂碼-->餵回[資料庫 DB2]  都是亂碼。

於是我仔細研究他的資料庫,以及他的程式的存取方法,發現是這樣的:

show variables like 'character%';

資料庫校對:utf8_bin
資料庫連線:latin1

character_set_client latin1
character_set_connection latin1
character_set_database latin1
character_set_filesystem binary
character_set_results latin1
character_set_server latin1
character_set_system utf8

資料庫內容:big5

這意思是不是說?

  存放在 utf8 編碼的資料庫中的 big5 編碼字元,但是要用latin1 的編碼連線取出

不,我後來又想了想,猜測應該是:

  big5的字元(中文字2字元)用latin1的字元集(character set)來保存,所以取時,也用同樣的字元集來取出。至於資料庫校對(utf8)和取出連線沒有關係。

  如果我沒有指定字元集,就會用預設的(可能是utf8)來取出資料庫中的資料,那可能會把字元組合切得亂七八糟(例如原本二個字元組一個big5中文字,在latin1中拆成一個一個獨立字元,結果用utf8的規則取出來,可能三個字元取出當一個中文字。

做了很多失敗的嘗試,後來才想到,那取出時就一定要先指字編碼的方式,才會是正常的結果。

所以我改下指令來 dump 時,把預設的 charset 寫入。

$ mysqldump --default-character-set=latin1 -u root -p -B DB1 > DB1_in_big5.sql

然後再 iconv

$ piconv -f big5 -t utf8 DB1_in_big5.sql> DB1_in_utf8.sql

最後再餵回去,成功。

這樣,我就順利的把資料庫 BIG5 全部轉成 utf-8 的編碼再餵回去。


原文 2010-04-24 17:46:55

END

你可能感興趣的文章

[Mysql/Mariadb] 檢查、修復及優化資料庫 mysql/mariadb 檢查、修復及優化資料庫

[Mysql/Mariadb] 查看使用狀態,抓出可疑慢查詢SQL 當Mysql 的負載loading飆高時,除了重新啟動外,如果想對症下藥,那該怎麼處理?

[MySQL/Mariadb] console 將查詢結果輸出到檔案 在mysql 的console中該如何將查詢結果輸出到檔案?

[Mysql/Mariadb] GROUP_CONCAT 函數 MySQL 中和 group by 一起用的函式,如果我們要算數值的總和或平均,可以使用 sum() 或 avg() 。但是我們如果要在 group by 中把字串「黏起來」,不是使用 concat(

[Docker] Mariadb-Galera出現Incorrect definition of table mysql.column_stats:'hist_type'及 'histogram' 使用docker的Mariadb-galera出現'hist_type'及 'histogram'型別錯誤的解決方法。

[MySQL] FIND_IN_SET函數,把多筆條件判斷弄成字串 SQL 我們如果要查找某個欄位是否為某個值的時候,如果要判斷的條件很多,可以用這個函數

我有話要說

>>

限制:留言最高字數1000字。 限制:未登入訪客,每則留言間隔需超過10分鐘,每日最多5則留言。

訪客留言

[無留言]

隨機好文

談借錢 人借錢時手心向上頭向下,人還錢時手心向下頭向上

PHP for sphinx 函式庫安裝 PECL/sphinx PHP>= 5.2.2 已經能原生支援 sphinx,可是預設的沒有裝,我們得自己裝才能用

Linux shell 的date表示法 linux下SHELL中的date表示法

UTF8中文字/全形一覽 快速查詢urf-8的中文字,共計13246中文字(5401常用字+7652罕用字+日文或編號),292全形符號,27半形符號。

[bc] linux 的計算機 bc 設定小數位數、計算π、次方根 linux 的計算機 bc 設定小數位數、計算π、次方根