본문 바로가기

파이썬(Python)/인코딩

인코딩 악의축은 의외로 윈도우 운영체제와 엑셀인듯?

python pandas dataframe 을 사용해서 만들면 아무런 문제가 없는데,

중간중간 저장해놓은 csv 나 xlsx 를 엑셀로 열어서 저장하면 생각보다 자주 찐빠가 난다.

 

윈도우가 기본적으로 ANSI (나라마다 다른데 한국은 cp949)를 쓰는데다, 엑셀도 이걸 기본값으로 설정한다.

심지어 utf-16을 unicode 라고 표기해 두는 일도 잦다.

 

거기다 utf-8로 된 자료를 바로 읽어오는 기능이 없다. 바로 읽으려면 무조건 utf-8 +BOM 형식으로 저장해야 한다.

(메모장은 바로 읽음ㅋㅋㅋ)

 

웹을 다루어야 하거나, 파이썬을 다루는 사람들은 엑셀의 기본 인코딩을 싸그리 utf-8 로 바꾸는것도 답이다.ㄹㅇ.

그런데 이러면 ANSI 를 못 읽지 않나? 노답.