閱讀275 返回首頁    go 阿裏雲 go 技術社區[雲棲]


MYSQL存儲數據亂碼

mysql的字符集設置有多個層級,在mysql中存儲中文,如果不能正確設置字符集,很容易出現數據亂碼。今天就有一個用戶反饋他數據庫中的數據下午1點多開始出現了亂碼。在這裏,我分享下具體問題的排查過程,以及解決的辦法。

 

(1)  排除客戶端設置導致的顯示亂碼

如果用戶設置的mysql character_set_client跟客戶端顯示的字符集不一致,很容易導致中文數據亂碼。

設置session字符集為utf8:set names utf8,設置客戶端顯示字符集為utf8,然後從表中select出有亂碼的數據。

圖1_af

上麵顯示,在character_set_client跟客戶端的字符集一致的情況下,還是出現了亂碼,這個排除是用戶顯示字符集設置不對的可能。下麵通過hex(item_title)列來查看這個列在底層的存儲字符集是否正確。

圖2_bak

通過上麵的查詢,可以確認這個數據亂碼不是顯示問題,而是存儲的數據內容本身就是錯誤的。

 

(2)  定位存儲亂碼原因

1>     用戶確認這個記錄插入時能夠正常顯示,但是後來update之後,數據就亂碼了。根據這個信息到binlog中查找更改正確內容對應的update語句。

圖31 (1)

圖4-bak

圖5-bak

上麵的binlog日誌顯示這個sql將原來數據庫中正確的內容,更新成一堆亂碼。所以導致數據庫中的存儲數據亂碼。

從binlog日誌可以看出在更新時,是用latin1的方式寫入到數據庫中。Update後麵的set語句中item_title字段的內容是亂碼的,所以確認是導入數據源本身內容有問題,從而導致更新後的數據亂碼。跟用戶確認這個update語句的更新內容,是先從庫中load 出來,後拚接成的update sql,所以懷疑load出來的數據就已經是亂碼了,然後直接用這個錯誤的數據更新原來正確的數據,導致所有的正確的數據亂碼。所以,需要確認這個update導入的數據源是否正確,即load出來的數據是否是正確的。

 

2>     導入數據源確認

開啟實例的全日誌開關,然後比對日誌,從上麵update語句對應的連接運行的sql中查找數據導出語句,以及對應的字符集設置。

圖6_bak

從上麵的日誌內容可以看出,這個連接建立後沒有進行任何字符集的設置,直接從數據庫中將內容select出來。在mysql中,如果沒有設置session級別的字符集,那麼使用默認的配置,配置如下:

圖7

即輸出會按照latin1的格式顯示。在默認字符集的配置下,手動運行SELECT `main_table`.* FROM `promo_item` AS `main_table` WHERE  promo_item_id =’500186324‘ 命令,可以發現,在character_set_results 設置為latin1的情況下,輸出結果中的item_title確實為一堆問號。

圖8_bak

由於latin1不能正確表示中文字符,所以顯示為一堆問號,用戶直接將這個內容update 原來正確的內容,所以導致存儲內容亂碼。

 

(3)小結

在使用mysql存儲中文字符時,需要注意以下幾點:

1>     確認更新的數據源同mysql 的session級別的字符集保持一致,Session級別的字符集可以用set names charset_name來設置。

2>     如果要正確顯示中文,需要將character_set_results設置為GBK或是utf8。同時,客戶端的顯示字符集需要跟character_set_results的配置一致。

最後更新:2017-04-03 08:26:18

  上一篇:go Cocos2d-x場景切換相關函數介紹
  下一篇:go RDS最佳實踐(三)—如何製定相關的流程來規範RDS的使用