본문 바로가기

Study/class note

python / decode

095 바이트 객체를 문자열로 바꾸기(decode)

인코딩(encoding)?

사람이 알아볼 수 있는 언어 > 컴퓨터가 알아볼 수 있는 언어(숫자)

ex) x_train = pd.read_csv("c:\\data\\x_train.csv", encoding = "euckr")

ansi ---> cp949, euckr ----> utf8, utf16

알파벳        한국어              

 

디코딩(decoding)?

컴퓨터가 알아볼 수 있는 언어 > 사람이 알아볼 수 있는 언어

txt ='A'              # 문자형 변수 선언
b_txt = txt.encode()  # 문자형 변수의 encode 함수(메소드)를 실행
print(b_txt)     # b'A' = b(바이너리=이진)가 붙음 = 사람이 알아보는 언어

c_txt = b_txt.decode()     # 인코딩된 문자를 디코딩함.
print(c_txt)

 

반응형