python pandas dataframe 을 사용해서 만들면 아무런 문제가 없는데,
중간중간 저장해놓은 csv 나 xlsx 를 엑셀로 열어서 저장하면 생각보다 자주 찐빠가 난다.
윈도우가 기본적으로 ANSI (나라마다 다른데 한국은 cp949)를 쓰는데다, 엑셀도 이걸 기본값으로 설정한다.
심지어 utf-16을 unicode 라고 표기해 두는 일도 잦다.
거기다 utf-8로 된 자료를 바로 읽어오는 기능이 없다. 바로 읽으려면 무조건 utf-8 +BOM 형식으로 저장해야 한다.
(메모장은 바로 읽음ㅋㅋㅋ)
웹을 다루어야 하거나, 파이썬을 다루는 사람들은 엑셀의 기본 인코딩을 싸그리 utf-8 로 바꾸는것도 답이다.ㄹㅇ.
그런데 이러면 ANSI 를 못 읽지 않나? 노답.
'파이썬(Python) > 인코딩' 카테고리의 다른 글
UnicodeDecodeError 만드는 바이트값 목록 (0) | 2022.10.10 |
---|---|
한국어 인코딩 과정에서 나오는 주요 Unicode Decode Error 목록 (0) | 2022.10.09 |
유니코드 그룹 표(Unicode groups table in EN & KR) (0) | 2022.10.07 |
Unicode Decode Error : 'utf-8' codec can't decode byte 0xed in position 0: invalid continuation byte 문제를, 해결할 수도 있는 한가지 방법 (0) | 2022.09.16 |