반응형

R 16

R 언어 통계 프로그래밍: Subsetting

1. Subset 추출 operator 1) [ : 같은 class의 object를 반환 2) [[ : dataframe이나 list의 요소를 추출하는데 사용 3) $ : 특정 이름에 의해 해당 list나 dataframe에서 해당 요소를 추출하는데 사용 2. List 1) Subsetting을 List 형태로 설정할 수 있고, 아래 예시처럼 single bracket [, double bracket [[, dollar $ 등을 사용하여 데이터를 출력할 수 있다. 2) [[ operator는 computed index를 취급하여 저장된 값으로 처리되고, $는 문자 그대로의 이름을 반영한다. - 위의 예시처럼, name을 쓴 경우 "foo"가 변환되어 x[["foo"]]의 형태로 출력된다. - $name의..

IT | Computer/R 2016.03.31

R 언어 통계 프로그래밍: 외부 입출력

1. Connection interface: 파일 등의 다른 개체들과 인터페이스 제공 1) file: 파일의 연결 인터페이스 2) gzfile: gzip으로 압축된 파일의 연결 인터페이스 3) bzfile: bzip2로 압축된 파일의 연결 인터페이스 4) url: 웹페이지 연결 인터페이스 2. File Connections: file interface의 상세 파라미터를 아래처럼 입력한다. 1) description: 파일 이름 2) open: 파일 읽는 상태를 결정 - r: 읽기 전용 - w: 쓰기 - a: appending (기존의 파일 내용을 제거하지 않고 추가 작성) - rb, wb, ab: 위의 각 형태를 binary mode로 실행 3. Connection 방법 1) read.csv() 활용하여..

IT | Computer/R 2016.01.26

R 언어 통계 프로그래밍: 대용량 데이터 처리

1. 대용량 데이터 Reading 1) 대용량 처리 팁 - 앞서 설명한 것과 같이 R의 경우 Physical Memory로 직접 할당을 하기 때문에 시스템 사양에 맞춰 데이터 처리를 해줘야 원활하게 프로그래밍을 할 수 있다. - Dataset의 필요한 메모리 용량을 파악하고 RAM 보다 초과할 경우 멈추고 조절 하도록 한다. - 파일에 주석이 없을 경우, comment.char = ""로 설정한다. 2) colClass 파라미터 활용 - 기본값 대신 특정 값을 설정하여 class type을 정해 줄 경우에 보다 빠르게 데이터를 읽을 수 있다. - 각 column의 class를 알고 있을 경우에 가능하다. 3) nrows 미리 설정 - nrow를 설정해주면 메모리 사용에 효과적으로 이용할 수 있다. 단, ..

IT | Computer/R 2016.01.09

R 언어 통계 프로그래밍: Reading/Writing Data

1. Reading Data 함수 1) R에서 데이터 Reading에 쓰이는 함수 - read.table/read.csv: tabular data(Table 형태의 데이터)를 읽어 올 때 쓰는 함수. 주로 데이터 파일을 읽을 때 쓴다. - readLines: 텍스트 파일에서 한 라인(한 줄) 읽어 올 때 쓰는 함수 - source: R code 파일의 데이터를 읽어 올 때 쓰는 함수 (inverse of dump) - dget: R code 파일의 데이터를 읽어 올 때 쓰는 함수 (inverse of dput) - load: 저장된 workspace에서 데이터를 읽어 올 때 쓰는 함수 - unserialize: 2진 형태의 단일 R object를 읽어 올 때 쓰는 함수 2. Writing Data 함수 ..

IT | Computer/R 2015.12.30
반응형