본문 바로가기

전체 글

(56)
Unicode Decode Error : 'utf-8' codec can't decode byte 0xed in position 0: invalid continuation byte 문제를, 해결할 수도 있는 한가지 방법 for Non-Koreans, directly go to the bottom. There is an English summary. You may translate this article to read, but I think it would not be very helpful, due to incorrectness of automatic-translation between Korean-English. txt 파일을 with open 으로 불러와 str 로 저장하여, 그 str를 KoNLPy KKMA(꼬꼬마)에 넣고 pos 돌리는데, 일부 텍스트 파일에서만 Decode 에러가 났다. stack overflow 검색으로 이십여 개의 글을 읽어봤으나, 명확한 답은 나오지 않았다. 일단 나는 0xed 바이트 in..
Kaggle(케글) dataset에 한글제목으로 파일 올리면 이름 깨지는 문제: 해결책 zip 만들어서 올리기 케글 dataset 만들때 한글로 된 파일제목 (예를 들면 1234가나다라5678.txt) 을 올리면, 업로드 표시창에는 제목이 정확히 들어간다. 그러나, 막상 dataset upload 가 끝나고, 이를 쓰려고 code 에다 연결하면 파일 이름이 (1234 5678.txt 아니면 12345678.txt) 이런식으로 한글 부분이 싹 사라진 걸 볼 수 있다. 그리고 한번에 1000개 파일 이상 바로 못올린다. 해결법은 의외로 간단하다. 올리려는 파일과 폴더를 싹 압축하여 zip을 만들고 그걸 올리면, 정상적으로 들어간다. 그리고 파일 1000개 이상 넣고 zip 만들어 올려도 모든 파일이 다 들어간다. 간단한 거나 제목 훼손되어도 큰 지장없는 테스트파일은 막 올리는게 편하지만, 본격적으로 다루려면 zip ..
생초보의 파이썬 아나콘다, VScode 설치 후 연동하는 과정 가장 단순한 연동법 설명. 윈도우 OS 1. 아나콘다3 설치(600mb 쯤 다운) https://www.anaconda.com/products/distribution 2. VScode 설치(100mb 쯤 다운) https://code.visualstudio.com/download 3. vscode에서 연동 설정하기 ctrl shift p 눌러서 command 연다. python: select interpreter 를 입력 아나콘다 폴더에 있는 파이썬 선택. 끝, 옵션) conda activate 문제해결 conda : 'conda' 용어가 cmdlet, 함수, 스크립트 파일 또는 실행할 수 있는 프로그램 이름으로 인식되지 않습니다. 이름이 정확한지 확인하고 경로가 포함된 경우 경로가 올바른지 검증한 다음..
countif 로 셀 항목이 여러 개일 때: 각각 countif 해서 더한다. 결과 항목에 O, △, X 로 표기된 문서에서 X만 제외하고 찾고 싶을때: 각각을 countif로 돌려서 더한다. 아니면 전체에서 빼던지. = countif(선택 범위, "O") + countif(선택 범위, "△") = counta(선택 범위) - countif(선택 범위, "X") 응용해서 잘 써먹자.
엑셀 문서의 셀 값이 리스트일 때, 리스트 그대로 파이썬 판다스로 추출하는 방법 Python의 pandas 라이브러리 중, read_excel 을 써서 파일을 불렀는데, 내부의 데이터인 셀 값이 list 형식이면 이것이 각 문자로 나뉘어 str로 저장된다. 예를들어 엑셀문서의 특정 열(왼쪽 예제)를 read_excel을 써서 부른다. pd_xls_ex = pd.read_excel(file_xls_ex) selected_row_ex = pd_xls_ex['실험용'] 원하는 결과는 대략 다음와 같다.