2016年5月21日 星期六

2016年5月12日 星期四

使用 R 匯入 Excel 存成的 CSV 檔, 在 Windows 環境下

Excel 的內容存成 CSV 檔時, 若在 Windows 環境下會存成 Big5 (CP-950)編碼。

使用 read.table() 指令讀取 CSV 檔時,若 R 的 coding page 不是 CP-950, 則匯入的中文字會編成亂碼。

使用 l10_info() 指令來看 R 的 coding page.





若不是 CP-950, 使用指令  Sys.setlocale(category="LC_ALL", locale = "cht") 切換。


讀入 CVS 讀時, 不要再加 encoding="UTF-8" 選項。雖然我們在 R-Studio 中設定存 Default Text Encoding 選項為 UTF-8,這個選項是指存檔時的編碼。在 R 中還是使用 CP-950 編碼。



延伸閱讀