본문 바로가기

Study/class note

(247)
R / 서브쿼리 18 R 에서의 서브쿼리 ㅇSQL의 서브쿼리 종류 3가지 1. single row subquery(단일행 서브쿼리) : 서브쿼리에서 메인쿼리로 하나의 값이 리턴되는 경우 2. multiple row subquery(다중행 서브쿼리) : 서브쿼리에서 메인쿼리로 여러개의 값이 리턴되는 경우 3. multiple column subquery(다중컬럼 서브쿼리) : 서브쿼리에서 메인쿼리로 여러개의 컬럼들이 값이 리턴되는 경우 ㅇ single row subquery 문제117. 아래의 SQL을 R로 구현하시오 -- SQL select ename, sal from emp where sal > ( select sal from emp where ename = 'JONES'); # R emp a] +) Series는 연..
코바코 웹스크롤링 url 파싱 import urllib.request # 파이썬에서 웹의 url 을 인식할 수 있게하는 모듈 from bs4 import BeautifulSoup from selenium import webdriver # 크롬 웹브라우져를 자동으로 제어하기 위해 from selenium.webdriver.common.keys import Keys # 키보드를 컴퓨터가 알아서 누르기 위해서 import time # 중간중간 sleep 을 걸어야 해서 time 모듈 import from tqdm import tqdm_notebook ########################### url 받아오기 ########################### # 웹브라우져로 크롬을 사용할거라서 크롬 드라이버를 다운받아 위..
R / 조인(outer join, self join, 조직도 시각화), pivot_table, tapply, 집합연산자 ㅁ 조인문법 복습 SQL R Python equi join merge pd.merge non equi join outer join self join 문제90. 아래의 SQL을 R과 python으로 구현하시오. -- SQL select e.ename, d.loc from emp e, dept d where e.deptno (+)= d.deptno ; # R emp
R / 조인 16 R 에서의 조인 SQL R Python equi join merge pd.merge non equi join outer join self join 문제84. dept3.csv를 R로 로드해서 dept데이터 프레임을 생성하시오. dept =1000)] # 또는 x.loc[(x.sal>=1000) & (x.job == 'SALESMAN'), ['ename', 'sal', 'loc']] 문제87. 커미션이 null인 사원들의 이름, 부서위치, 커미션을 출력하시오. -- SQL select e.ename, d.loc, e.comm from emp e, dept d where e.deptno = d.deptno and e.comm is null; # R x
R / 막대그래프, 원형그래프 14 R 에서의 막대그래프 문제70. 점심시간 문제로 풀었던 직업, 직업별 인원수를 가로로 출력하는 결과를 막대그래프로 시각화 하시오. # R x
R / 그룹함수, aggregate, tapply, table, format 문제54. 부서번호, 부서번호별 최대월급을 출력해주세요. -- SQL select deptno, max(sal) from emp group by deptno; # R emp
R / 문자함수(gsub), 날짜함수, 변환함수, 일반함수, 그룹함수 8 R 에서의 문자함수 오라클 R upper toupper lower tolower substr substr replace gsub ㅇ gsub 오라클에서 replace가 R에서 gsub와 같은 함수 -- SQL select ename, replace(sal, 0, '*') from emp; # 판다스 import pandas as pd emp = pd.read_csv("c:\\data\\emp2.csv") emp['sal_star'] = emp.sal.apply(lambda x : str(x).replace('0','*')) emp # R library(data.table) data.table( 이름 = emp$ename, 월급 = gsub(0,'*', emp$sal) ) gsub(변경전 데이터, 변경..
R / R자료형, 연산자, 중복제거, 데이터 정렬, 문자함수(lower, substr) 3 R 의 자료형 5가지 1. vector : 같은 데이터 타입을 갖는 1차원 배열구조 2. matrix : 같은 데이터 타입을 갖는 2차원 배열구조 3. array : 같은 데이터 타입을 갖는 다차원 구조 4. data frame : 오라클의 테이블, 판다스의 데이터 프레임과 같음 5. list : 서로 다른 데이터 구조인 데이터 타입이 중첩된 구조 4 R 에서의 데이터 검색 emp 데이터 프레임에서 행과 열을 출력하는 문법 R > emp[ 행 검색조건 , 열 ] ( 판다스 > emp[[열]][행 검색 조건] 예제. 특정 컬럼의 데이터 검색하기. emp[,c("ename","sal")] > R은 여러개의 컬럼을 볼 때 c(combine)을 해줘야 볼 수 있음. 예제. 특정 행의 데이터를 검색하기 emp..
R / R설치 및 R이란 무엇인가 1. R 기본문법과 시각화 2. 데이터 관리와 이해 3. KNN알고리즘 4. 나이브 베이즈 이론 5. 의사결정트리 6. 회귀분석 7. 신경망과 서포트 벡터 머신 8. 연관규칙 9. k-means 10. 모델성능평가 11. 모델성능개선 ============================================================================ 1 R 이란 무엇인가? 뉴질랜드 aukland 대학에서 1995년에 개발한 소프트웨어. 데이터 분석을 위한 통계 및 시각화를 지원하는 무료 소프트웨어. ㅇ 파이썬과 비교 - R이 데이터 시각화가 더 예쁨 - R이 역사가 더 오래되어 유용한 데이터 분석 패키지들이 많음. 2 R 과 R studio 설치 - R 프로그램 ..
python / 상관관계그래프, 신뢰구간그래프 (도박사 이야기) 159 상관관계 그래프 그리기 상관관계란 두 개의 변수(컬럼) 간의 선형 관계정도를 시각화하는 그래프 2. 판다스 import matplotlib.pyplot as plt import pandas as pd ins = pd.read_csv("c:\\data\\insurance.csv") ins.corr() # 상관계수 값. 기본이 피어슨이라서 method = 'pearson' 굳이 안써도 됨 plt.matshow(ins.corr(method = 'pearson')) 문제562. 위의 그래프의 결과에서 컬럼명도 같이 출력되게 하시오. a = ['id','age','bmi','children','expenses'] fig = plt.figure() # 그래프를 그리겠다고 영역지정. () 안에 아무것도 없으면..

반응형