使用 read.table() 指令讀取 CSV 檔時,若 R 的 coding page 不是 CP-950, 則匯入的中文字會編成亂碼。
使用 l10_info() 指令來看 R 的 coding page.
若不是 CP-950, 使用指令 Sys.setlocale(category="LC_ALL", locale = "cht") 切換。
讀入 CVS 讀時, 不要再加 encoding="UTF-8" 選項。雖然我們在 R-Studio 中設定存 Default Text Encoding 選項為 UTF-8,這個選項是指存檔時的編碼。在 R 中還是使用 CP-950 編碼。
延伸閱讀
- Character Encoding in RStudio by Josh Paulson, 2015
沒有留言:
張貼留言