[精讚] [會員登入]
13

[C#] 從MySql資料庫取得的中文字是亂碼的處理

從MySql資料庫取得的中文字是亂碼

此文完整連結 http://n.sfs.tw/12793

複製連結 [C#] 從MySql資料庫取得的中文字是亂碼的處理@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2018-10-07 01:51:49 最後編修
2018-10-07 01:36:20 By 瘦河馬
 

這個棘手的問題,我花了整整二天解決。

因為 MySql 是在 FreeBSD 6.2 上。用Console去Mysql中查詢會是正確的中文字。

但是由C# Select 出後,就會是亂碼!他的校對是這樣的:

資料庫 offline   校對    utf8_unicode_ci
     L資料表 conn_status  型態  MyISAM   校對    utf8_general_ci
            L  欄位 u_name      varchar(20)  校對    latin1_bin <===  注意

u_name 是有中文字的欄位,校對設定是 latin1_bin (這個關鍵花了一天才找到)。

為了解決亂碼的問題,寫了一個函數來轉成正確的中文字。

 

轉碼程式

假設由資料庫Select取出的字串是 instr,經由下面的程式轉出才會得到正確的 Unicode。
原因在於Unicode 是1-2個char所組成,一個字元是由1-2位元byte組成,回傳的就是正確的UNICODE中文字

private string ConvertUnicode(string instr)
{
          char[] wdchars = instr.ToCharArray();
          byte[] resbyte = new byte[wdchars.Length*2 ];   //預設長度是 char 的二倍
           
          int ii = 0;
          foreach (char wdchar in wdchars)
          {
                int v = Convert.ToInt32(wdchar);    //先轉成整數
                if (v > 255)   //有二個 bytes 組成 char
                {
                    int hv = (int)(v / 256);  //高位元轉成整數
                    int lv = v % 256;   //低位元轉成整數

                    resbyte[ii] = Convert.ToByte(lv);  //低位元轉成 byte
                    resbyte[ii + 1] = Convert.ToByte(hv);  //高位元轉成 byte
                    //轉成16進位字串值,以下兩行可省略
                    //string hs = Convert.ToString(hv, 16).ToUpper().PadLeft(2, '0'); 
                    //string ls = Convert.ToString(lv, 16).ToUpper().PadLeft(2, '0');

                    ii += 2;
                }
                else   //只有一個 byte 組成 char
                {
                    string ls = Convert.ToString(v, 16).ToUpper().PadLeft(2, '0');
                    resbyte[ii] = Convert.ToByte(v);
                    ii++;
                }
          }
}


後來發現,如果資料庫設定成這樣,就不會發生上面亂碼的問題,但常常的情況是我們不容許改動現有的資料庫校對。

資料庫 utf8_bin
    L 資料表 utf8_bin
        L有中文的欄位 utf8_bin

 


原文 2009-12-08 02:18:10

你可能感興趣的文章

C# 取得滑鼠位置 C# Application中取得滑鼠位置

[C#] 從MySql資料庫取得的中文字是亂碼的處理 從MySql資料庫取得的中文字是亂碼

[C#] 撰寫非同步方法 TCP socket #1 非同步的TCP連線程式才是撰寫連線程式的唯一道路,此文僅供參考

[C#] 撰寫非同步方法 TCP socket #2 非同步的TCP連線程式才是撰寫連線程式的唯一道路,此文僅供參考

我有話要說


限制:留言最高字數1000字,超過部分會被截掉。請注意:留言不可帶有網址,會被濾掉。 限制:未登入訪客,每則留言間隔需超過10分鐘,每日最多5則留言。

訪客留言

[無留言]

隨機好文

HP SAS硬碟leds燈號說明 HP SAS硬碟leds燈號(hp g7/g6系統適用)說明

PHP for sphinx 函式庫安裝 PECL/sphinx PHP>= 5.2.2 已經能原生支援 sphinx,可是預設的沒有裝,我們得自己裝才能用

為什麼要重造輪子? 什麼輪子?造什麼輪子?我為什麼要重造輪子?

TFTP Server 安裝及使用 讓設備的網路設定檔或是韌體經由TFTP拷備出來,操作的方法

UTF-8的網頁但IE8一片空白 UTF8編碼的網頁在Firefox 正常顯示、但IE8 就是空白,IE8編碼設定是「自動偵測」可是自動偵測到的是 big5...