ㅁ데이터 분석 순서
1. 데이터 수집 <----------------웹스크롤링
2. 데이터 유형 및 속성 파악
3. 데이터 변환
4. 데이터 저장
5. 데이터 정제
6. 데이터 분석
141 HTML 기본문법
HTML = Hyper Text Markup Language의 약자이고 여러개의 태그(tag)를 연결해서 모아놓은 문서
메모장을 열고 아래와 같이 코딩하세요.
<html><head><title> 요번주 일정 </title></head>
<body>
<p class="title"> 내일은 올해의 마지막 날입니다. </p>
</body>
</html>
메모장의 파일이름을 a.html로 바탕화면에 저장하세요. 저장형식은 모든 파일로 하세요.
시작은 무조건 <html>로 해야함. 실행하고 닫을때는 슬래시(/) 넣어서 닫아줘야함.
<html>과 </html> 사이에 전체 내용을 넣으면 됨.
<title>은 열리는 창 이름이고 <body>는 본문내용임.
예제1. 위의 글씨를 진하게 하시오.
<b></b>태그
<html><head><title> 요번주 일정 </title></head>
<body>
<p class="title"> <b> 내일은 올해의 마지막 날입니다.<b> </p>
</body>
</html>
예제2. 위의 글씨에 밑줄을 그어 보시오.
<u></u> 태그
<html><head><title> 요번주 일정 </title></head>
<body>
<p class="title"> <b><u>내일은 올해의 마지막 날입니다.</b></u> </p>
</body>
</html>
예제3. 위의 글씨를 이탤릭체로 변경하시오.
<i>,</i>태그
<html><head><title> 요번주 일정 </title></head>
<body>
<p class="title"> <b><u><i>내일은 올해의 마지막 날입니다.</b></u></i> </p>
</body>
</html>
예제4. p태그를 추가해서 제목과 내용을 나누시오.
<p class = "content"> 를 넣어 본문 내용 추가, </p>로 닫아줘야 함.
<html><head><title> 요번주 일정 </title></head>
<body>
<p class="title"> <b><u><i>내일은 올해의 마지막 날입니다.</b></u></i> </p>
<p class = "content"> 사무엘이 오늘 반에 나오지 않아 선생님 기분이 우울합니다.
오늘은 새벽 5시에 못일어났나 봅니다. </p>
</body>
</html>
+) 띄어쓰기 하고 싶을때는 <br>넣으면 됨
<html><head><title> 요번주 일정 </title></head>
<body>
<p class="title"> <b><u><i>내일은 올해의 마지막 날입니다.</b></u></i> </p>
<p class = "content"> 사무엘이 오늘 반에 나오지 않아 선생님 기분이 우울합니다.
<br>오늘은 새벽 5시에 못일어났나 봅니다. </p>
</body>
</html>
예제5. 위에서 만든 html 문서 본문에 링크를 거시오.
<html><head><title> 요번주 일정 </title></head>
<body>
<p class="title"> <b><u><i>내일은 올해의 마지막 날입니다.</b></u></i> </p>
<p class = "content"> 사무엘이 오늘 반에 나오지 않아 선생님 기분이 우울합니다.
<br>오늘은 새벽 5시에 못일어났나 봅니다.
<a href = "http://cafe.daum.net/oracleoracle" class="cafe1" id="link1"> 링크</a>
</p>
</body>
</html>
p 태그는 내용을 넣기위한 태그고 a태그는 링크를 걸기위한 태그임.
<a href = 링크주소> 뒤에는 '링크'와 같은 문자를 입력해야 클릭창이 생성됨.
예제6. 예제5번까지 만든 html페이지에서 개발자 모드로 들어가시오.
F12를 누르면 개발자 모드로 들어갈 수 있음(크롬)
이 기능을 사용하면 내가 찾고자하는 데이터의 html코드가 어느 부분인지를 빠르게 찾을 수 있음.
문제419. (오늘의 마지막 문제) 롯데백화점 데이터(X_train.csv)에서 최대 구매액이 240만원 이상인 고객의 고객번호, 최대구매액, 주구매상품 데이터를 result240.csv로 저장하시오.
import pandas as pd
store = pd.read_csv("c:\\data\\X_train.csv", encoding = 'euckr' )
store[['cust_id','최대구매액','주구매상품']][store['최대구매액'] >= 2400000].to_csv("c:\\data\\result240.csv")
'Study > class note' 카테고리의 다른 글
python / 중앙일보 웹스크롤링 (0) | 2022.01.03 |
---|---|
python / beautiful soup 모듈 (0) | 2021.12.31 |
python / readline,write,writelines,read/write,rb/rw,with~as (0) | 2021.12.30 |
python / 텍스트 파일 읽기(read() ) (0) | 2021.12.29 |
python / 코드 값 구하기(ord() ), 문자 구하기(chr() ), 문자열로 된 식 실행(eval), 한 줄 짜리 함수(lambda), 인자 바꾸기(map) (0) | 2021.12.29 |