728x90
반응형

R 프로그래밍 6

R 언어 통계 프로그래밍: 대용량 데이터 처리

1. 대용량 데이터 Reading 1) 대용량 처리 팁 - 앞서 설명한 것과 같이 R의 경우 Physical Memory로 직접 할당을 하기 때문에 시스템 사양에 맞춰 데이터 처리를 해줘야 원활하게 프로그래밍을 할 수 있다. - Dataset의 필요한 메모리 용량을 파악하고 RAM 보다 초과할 경우 멈추고 조절 하도록 한다. - 파일에 주석이 없을 경우, comment.char = ""로 설정한다. 2) colClass 파라미터 활용 - 기본값 대신 특정 값을 설정하여 class type을 정해 줄 경우에 보다 빠르게 데이터를 읽을 수 있다. - 각 column의 class를 알고 있을 경우에 가능하다. 3) nrows 미리 설정 - nrow를 설정해주면 메모리 사용에 효과적으로 이용할 수 있다. 단, ..

IT | Computer/R 2016.01.09

R 언어 통계 프로그래밍: Reading/Writing Data

1. Reading Data 함수 1) R에서 데이터 Reading에 쓰이는 함수 - read.table/read.csv: tabular data(Table 형태의 데이터)를 읽어 올 때 쓰는 함수. 주로 데이터 파일을 읽을 때 쓴다. - readLines: 텍스트 파일에서 한 라인(한 줄) 읽어 올 때 쓰는 함수 - source: R code 파일의 데이터를 읽어 올 때 쓰는 함수 (inverse of dump) - dget: R code 파일의 데이터를 읽어 올 때 쓰는 함수 (inverse of dput) - load: 저장된 workspace에서 데이터를 읽어 올 때 쓰는 함수 - unserialize: 2진 형태의 단일 R object를 읽어 올 때 쓰는 함수 2. Writing Data 함수 ..

IT | Computer/R 2015.12.30

R 통계 프로그래밍: Data Type (Factors, NA, NaN, Data Frames, Names)

1. Factors 1) 범주형 데이터(categorical data) 표현에 사용 - Unorderd/Ordered 가능 (순차/비순차) - label: 좀 더 self-describing (데이터의 설명이 추가)되게 표현된다. 예) 1/2가 아닌 남/여로 표현 2) factor(): Levels가 기존의 변수 중에 중복을 피하면서 Attribute 중 하나로 설정하여 vector를 생성 - table(): Level에 따라 몇 개의 값이 있는지 Level에 따른 count 값을 출력 - unclass(): Level 표현 없이 class 특징을 없애고 단순한 상수만 출력하고 attribute에 따라 상수에 매칭되는 데이터 값을 같이 출력 3) factor( , levels=() ): 데이터가 표현되는..

IT | Computer/R 2015.12.15

R 통계 프로그래밍: Data Type (R Objects, Attributes, Vectors, Lists)

1. R Objects와 Attributes 1) 5가지 기본 클래스: character, numeric (실수), integer, complex, logical (True/False) 2) 기본 Object: vector - 5가지 클래스를 담고 있는 기본 Object - 한가지 형태의 클래스만 1개 이상 포함: Multiple copies of a single type of object - 예외: list는 다른 클래스끼리 포함할 수 있다. - vector 생성 입력: vector() (2가지 arguments: vector type, vector length) 3) Numbers (numeric objects) - integer 정수 입력을 원하는 경우: L을 추가 (1L로 입력하면 1이 integ..

IT | Computer/R 2015.12.13

R의 개요 및 역사

1. R: S의 방언이다? 1) S - Bell Labs에서 John Chambers에 의해 개발된 언어 - Fortran 라이브러리로 개발된 인터넷 내부 통계 분석으로 1976년에 시작 - 1988년, C에 의해 재작성되고 현재의 시스템과 유사한 형태로 제작 (버전 3) - 1998년, S 언어 버전 4 Release 2) Historical Notes - 1993년, Bell Labs에서 S 언어 개발과 판매를 위한 독점 라이선스를 StatSci (현재 Insightful Corp.)에게 주었다. - 2004년, Insightful은 Lucent로부터 S언어를 구입하고 현재의 개발사 - 2006년, Alcatel이 Lucent Technologies를 사고 Alcatel-Lucent라고 현재 불려진다..

IT | Computer/R 2015.12.10
728x90
반응형