본문 바로가기

Study/class note

(247)
python / beautiful soup 모듈 142 beautiful soup 모듈 배우기 beautiful soup : 파이썬 코드를 복잡하게 작성하지 않아도 편하게 웹스크롤링 할 수 있도록 웹스크롤링에 필요한 여러 함수들을 제공하는 웹스크롤링 전문모듈. 예제. 데이터 게시판에서 ecologicalpyramid.html 문서를 c:\\data 밑에 저장하시오. 1. 파일을 열어서 페이지 소스를 확인함. div 태그 --> li 태그 --> div 태그로 상위태그에서 하위 태그로 내려오며 구성되어 있는 html문서임. 만약에 우리가 plants라는 단어를 긁어오고 싶다면, 위의 태그 순서대로 접근하면 됨. (div 태그, li 태그 : 상위, 하위태그 구분 지음) class와 id는 웹스크롤링하는 입장에서 바라본다면 html 문서에 접근할 때 어떤..
python / HTML 기본문법 ㅁ데이터 분석 순서 1. 데이터 수집 = 2400000].to_csv("c:\\data\\result240.csv")
python / readline,write,writelines,read/write,rb/rw,with~as 135 텍스트 파일을 한줄씩 읽고 출력하기 ① (readline) 텍스트 파일의 용량이 매우 클 경우 read()로 한꺼번에 파일의 내용을 읽어들이는 것은 메모리 문제를 야기할 수 있음. 이 경우 텍스트 파일 내용을 한 줄 단위로 읽고 작업을 수행하면 됨. readline()은 텍스트 파일에서 한 줄을 읽음. 한 줄을 읽고 나면 파일을 읽기 시작하는 위치는 그 다음 줄의 맨 처음이 됨. # 문법 f = open("c:\\data\\jobs.txt", encoding = 'utf8') data = f.readline() print(data) # 맨 위의 한 줄을 읽음 steve jobs'2005 stanford commencement address 문제402. 위에서는 스티브잡스 연설문 한 줄만 읽어왔는데..
python / 텍스트 파일 읽기(read() ) 134 텍스트 파일을 읽고 출력하기(read) 텍스트 파일을 읽고 그 내용을 화면에 출력하고자 하면 제일 먼저 텍스트 읽기 모드로 파일을 엽니다. 텍스트 파일을 오픈하면 텍스트 파일을 읽어 내용을 화면에 출력하면 됨. f = open("c:\\data\\jobs.txt", encoding = 'utf8') data = f.read() # 파일을 한번에 전부 읽어오는 함수가 read()이고 data변수를 문자형으로 생성 print(data) f.close() # 열었던 파일을 닫으면서 사용되고 있는 메모리가 정리됨 위에서 가져온 스티브잡스 연설문 파일(jobs.txt)은 크기가 작아서 굳이 닫을 필요는 없지만 보통 대용량 텍스트 데이터들은 닫아줘야함. close() 써서 닫아주는 습관 들일 것. 너무 큰 ..
python / 코드 값 구하기(ord() ), 문자 구하기(chr() ), 문자열로 된 식 실행(eval), 한 줄 짜리 함수(lambda), 인자 바꾸기(map) 129 문자 코드값 구하기(ord) 파이썬 내장함수 ord()는 문자를 컴퓨터가 인식하는 코드값으로 변환함. 예제: A ----------인코딩---------> 65 (인코딩 : 사람이 알아볼 수 있는 언어를 컴퓨터가 알아볼 수 있는 숫자로 변환) # 알파벳 대문자를 출력하시오 import string print(string.ascii_uppercase) # ABCDEFGHIJKLMNOPQRSTUVWXYZ # 알파벳 A를 인코딩하시오. 즉 컴퓨터가 인식하는 숫자로 변경하시오. print(ord('A')) # 65 문제391. 위의 string.ascii_uppercase과 ord() 함수를 이용해서 아래와 같이 출력되게 하시오. A -----> 65 B -----> 66 C -----> 67 : : X..
python / 사전(del,clear,keys, values,items,sorted,in) 122 사전의 특정 요소 제거하기(del) 딕셔너리에서 특정 요소(값)을 제거하려면 파이썬 내장함수 del을 이용하면 됨. sol = {'태양':'sun','수성':'mercury','금성':'venuse','지구':'earth'} del sol['태양'] print(sol) #{'수성': 'mercury', '금성': 'venuse', '지구': 'earth'} 문제383. 아래의 딕셔너리에서 다시만난세계의 값만 지우시오. dict = {'소녀시대':['다시만난세계','Gee'],'방탄소년단':['DNA','Fire']} del dict['소녀시대'][0] print(dict) #{'소녀시대': ['Gee'], '방탄소년단': ['DNA', 'Fire']} 문제384. 아래의 music 딕셔너리에서 가..
기업체 특강 /에이플랫폼 에이플랫폼 1. 데이터의 변화 2. 데이터 처리 시스템의 변화 3. 취업 관련 조언 정형데이터 비정형데이터 데이터 저장/ 처리 비용의 하락으로 비정형 데이터의 활용 증가 Not only SQL = No SQL 메모리 부족으로 서버를 증설함. 다만 서버 증설에는 한계가 있음. scale up : 수직적 증설, 하나의 서버에 더 많은 하드웨어를 증설하는 것 scale out : 수평적 증설 , 한 곳에 모아놓고 처리하는데 아니라 비슷한 규모의 서버들을 나눠놓고 분산시키는 것 요즘은 혼합형으로 많이 사용함. > Gpu 데이터 베이스 시대 도래. Gpu 프로세서 DW( structured data) / Bigdata(Streuctured + Unstructured data) / Data Lake(Structur..
python / 사전(요소 추가, 요소값 변경) 120 사전에 요소 추가하기 ㅇ파이썬의 자료형 5가지 : 문자형, 숫자형, 리스트형, 튜플형, 사전형 사전형은 키:값으로 되어진 요소로 구성되어 있음. 사전형은 리스트형처럼 인덱스 번호로 요소를 접근하는게 아니라 키값으로 요소의 값에 접근 문제376. 아래의 2개의 리스트를 가지고 sol 딕셔너리를 생성하시오. sol_eng = ['sun','mercury','venus','earth','mars'] # 키 sol_kor = ['태양','수성','금성','지구','화성'] # 값 sol = {} # 비어있는 딕셔너리 생성 for i, k in zip(sol_eng, sol_kor): sol[i] = k # sol[키] = 값 print(sol) # {'sun': '태양', 'mercury': '수성', ..
python / 리스트(del, sort(ed), shuffle, enumerate, sum, all,any) 113 리스트 제거하기(del) del(리스트) : 리스트 자체를 메모리에서 완전히 제거하는 명령어 a = [1,2,3,3,3,4] del a print(a) # NameError: name 'a' is not defined 문제360. 지금 현재 내가 접속한 주피터 노트북 창에서 선언되어 있는 변수들을 확인하고 싶다면? print (dir()) 문제361. print( dir() )로 했을 때 나오는 모든 변수들을 다 지우시오. => 기존 주피터노트북 내장 변수들은 삭제되지 않음. 커널 리스타트 하셈. 중복된 변수명이 각각 다른 프로그램에서 수행될 때 즉 앞에서 돌렸던 프로그램에서 사용된 변수명이 지금 수행하는 프로그램의 변수명과 동일하면 잘못된 결과를 볼 수 있으므로 del변수명으로 지우는 것이 바람..
커피 키오스크 오늘의 추천메뉴 + 메뉴안내 class Coffee_Class(): def __init__(self): self.image("c:\\data\\kioskimage.png") # 이미지파일 print('키오스크 시스템을 시작합니다.') # 메뉴 설정 self.c_type = ['아메리카노','카페라떼','카페모카','녹차라떼'] self.c_stock = [20,10,30,20] # [0]: 아메리카노 재고, [1] : 카페라떼 재고, [2] : 카페모카 재고, [3] : 녹차라떼 재고 self.c_price = [1500,2500,3500,3500] # [0]: 아메리카노 가격, [1] : 카페라떼 가격, [2] : 카페모카 가격, [3] : 녹차라떼 가격 self.coupon = 0 self.order_no = 1 self.cup..

반응형