반응형
Notice
Recent Posts
Recent Comments
Link
Today
Total
07-05 05:44
«   2024/07   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
Archives
관리 메뉴

iOS 개발 기록 블로그

R 설치, 시작하기, 배워야 하는 이유, 자료구조, 연산자 기본 본문

R

R 설치, 시작하기, 배워야 하는 이유, 자료구조, 연산자 기본

crazydeer 2021. 11. 5. 21:00
반응형

R 설치하기

https://healthstat.snu.ac.kr/CRAN/

 

R 시작하기

아래와 같이 자신이 원하는  CSV파일을 작성하여 원하는 폴더에 저장합니다.

 

데이터를 읽어오려면 아래와 같이 코드를 작성합니다.

emp 테이블

 

attach 함수와 tapply 함수

아래와 같이 attach(테이블명)을 하게 되면 후에 emp$sal, list(emp$deptno, emp$job)

이런식으로 쓰지 않아도 되기 때문에 편의성이 증가합니다.

한마디로 앞으로 해당 테이블 가지고 데이터를 다뤄보겠다고 하는 것입니다.

 attach와 tapply 함수

해제하려면 detach(테이블명) 해주면 됩니다.

당연히 해제하고 데이터를 가져올땐 테이블명$컬럼명으로 해줘야 합니다.

 

tapply는 위에 emp 테이블을 보면 부서번호 별, 직무 별 연봉을 합한다는 의미입니다.

특정 함수를 그룹 별 데이터에 적용하는 함수입니다.

sum(합계) 함수를 부서번호, 직무 별로 적용한 모습입니다.

 

 

 

R을 배워야 하는 이유

  1. 무료
  2. 데이터 분석을 위해 비교적 많이 쓰는 언어
  3. 다양한 시각화
  4. 유용한 패키지, 새로운 기능, 함수 업데이트
  5. 어떠한 OS에도 설치 가능

 

 

막대그래프

 

 

 

R의 자료구조

R의 자료구조

1. vector : 같은 데이터 타입을 갖는 1차원 배열구조

2. matrix : 같은 데이터 타입을 갖는 2차원 배열구조

3. array : 같은 데이터 타입을 갖는 다차원 배열구조

4. data.frame : 각각의 데이터 타입을 갖는 컬럼으로 이루어진 2차원 배열구조

(오라클의 테이블과 유사)

5. list : 서로 다른 데이터 구조 (vector, data frame, matrix, array) 데이터 타입이 중첩된 구조

 

 

 

emp 테이블의 자료구조

 

 

예제 1) 월급이 2000 이상인 사원들의 이름과 월급을 출력하시오

 

 

R의 연산자

산술 연산자 -    
비교 연산자 > < >= <= == !=
논리 연산자 & (벡터화된 연산) && | (벡터화된 연산) || !  
기타 비교 연산자 in grep is.na      

 

 

벡터화된 연산 vs 벡터화되지 않은 연산

 

 

예제 2) 직업이 SALESMAN, ANALST 사원들의 이름과 직업을 출력하시오

 

 

예제 3) 이름의 글자가 A 시작하는 사원들의 이름과 월급을 출력하시오

 

 

예제 4) 부서번호를 출력하는데 중복을 제거해서 출력하시오

 

 

예제 5) 이름과 입사일을 출력하는데 먼저 입사한 사원부터 출력하시오

 

 

예제 6) 직업이 ANALYST 아닌 사원들의 이름과 월급과 직업을 출력하는데 월급이 높은 사원부터 출력하시오

 

반응형