반응형

IT | Computer/R 22

R 언어 통계 프로그래밍: Dates, Times

1. 기본 Dates, Times 개요 1) Dates - Data class에 기반 - 1970-01-01에서 현재까지의 날짜 값을 내부적으로 저장 2) Times - POSIXct나 POSIXlt class에 기반 - 1970-01-01 에서 현재까지의 초 값을 내부적으로 저장 2. Dates in R 1) as.Date() function - Dates class로부터 생성할 수도 있고, as.Date() 함수로 강제로 변수에 지정할 수 있다. - class특징을 지운 상수값만 표시하는 unclass()에서 1970-01-01을 기준으로 얼마나 날짜가 지났지는지의 값을 가지고 있다. 3. Times in R 1) Class - POSIXct, POSIXlt class에 의해 해당 기능을 사용할 수 ..

IT | Computer/R 2016.08.10

R 언어 통계 프로그래밍: Functions 함수 처리

1. Functions 개요 1) 반복적으로 사용하는 부분을 함수화 하여서 적절하게 프로그래밍시에 사용할 수 있게 한다. 2) 기본형은 아래와 같다. (대부분의 다른 프로그래밍 언어와 동일 하다.) f -> function () { ## 함수 내용 } 2. Function Arguments 1) 기본 arguments는 함수의 정의에 의해 결정된다. 2) Arguments는 생략될 수 있다. 3. Argument Matching 1) Arguments의 순서와 이름에 의해서 일치가 되는지 확인한다. 2) 동일한 함수 이름이라고 하더라도 arguments가 다른 경우 다른 함수로 사용될 수 있다. 3) Partial Match: Argument 이름이 길 경우 부분적으로만 일치되는지는 확인한다 - 이름, ..

IT | Computer/R 2016.04.03

R 언어 통계 프로그래밍: Control Structure 제어문

1. if-else 1) 조건에 따라, if의 구문이 TRUE이면 if 내의 명령을 실행하고 FALSE이면 else 내의 명령을 실행한다. 2) x의 조건에 따라, y의 값이 지정되어 y를 출력해보면 해당 값이 출력된다. 3) else 문은 생략되고 if문만 단독으로 사용할 수도 있다. 2. for 1) 정수 변수를 하나 설정하고 해당 값이 하나씩 증가하여 특정 값까지 도달할 때까지 해당 명령을 실행한다. 2) i의 값이 1으로 설정되고, 10이 될 때까지 i의 값이 출력된다. 11부터는 출력이 되지 않는다. 3) 아래의 for 안의 조건문도 사용될 수 있다. 4) Nested for loops: 이중, 삼중, 다중의 for문도 가능하다. 3. while 1) 조건문이 TRUE일 때까지 해당 명령을 계속..

IT | Computer/R 2016.04.01

R 언어 통계 프로그래밍: Subsetting

1. Subset 추출 operator 1) [ : 같은 class의 object를 반환 2) [[ : dataframe이나 list의 요소를 추출하는데 사용 3) $ : 특정 이름에 의해 해당 list나 dataframe에서 해당 요소를 추출하는데 사용 2. List 1) Subsetting을 List 형태로 설정할 수 있고, 아래 예시처럼 single bracket [, double bracket [[, dollar $ 등을 사용하여 데이터를 출력할 수 있다. 2) [[ operator는 computed index를 취급하여 저장된 값으로 처리되고, $는 문자 그대로의 이름을 반영한다. - 위의 예시처럼, name을 쓴 경우 "foo"가 변환되어 x[["foo"]]의 형태로 출력된다. - $name의..

IT | Computer/R 2016.03.31

R 언어 통계 프로그래밍: 외부 입출력

1. Connection interface: 파일 등의 다른 개체들과 인터페이스 제공 1) file: 파일의 연결 인터페이스 2) gzfile: gzip으로 압축된 파일의 연결 인터페이스 3) bzfile: bzip2로 압축된 파일의 연결 인터페이스 4) url: 웹페이지 연결 인터페이스 2. File Connections: file interface의 상세 파라미터를 아래처럼 입력한다. 1) description: 파일 이름 2) open: 파일 읽는 상태를 결정 - r: 읽기 전용 - w: 쓰기 - a: appending (기존의 파일 내용을 제거하지 않고 추가 작성) - rb, wb, ab: 위의 각 형태를 binary mode로 실행 3. Connection 방법 1) read.csv() 활용하여..

IT | Computer/R 2016.01.26

R 언어 통계 프로그래밍: 대용량 데이터 처리

1. 대용량 데이터 Reading 1) 대용량 처리 팁 - 앞서 설명한 것과 같이 R의 경우 Physical Memory로 직접 할당을 하기 때문에 시스템 사양에 맞춰 데이터 처리를 해줘야 원활하게 프로그래밍을 할 수 있다. - Dataset의 필요한 메모리 용량을 파악하고 RAM 보다 초과할 경우 멈추고 조절 하도록 한다. - 파일에 주석이 없을 경우, comment.char = ""로 설정한다. 2) colClass 파라미터 활용 - 기본값 대신 특정 값을 설정하여 class type을 정해 줄 경우에 보다 빠르게 데이터를 읽을 수 있다. - 각 column의 class를 알고 있을 경우에 가능하다. 3) nrows 미리 설정 - nrow를 설정해주면 메모리 사용에 효과적으로 이용할 수 있다. 단, ..

IT | Computer/R 2016.01.09

R 언어 통계 프로그래밍: Reading/Writing Data

1. Reading Data 함수 1) R에서 데이터 Reading에 쓰이는 함수 - read.table/read.csv: tabular data(Table 형태의 데이터)를 읽어 올 때 쓰는 함수. 주로 데이터 파일을 읽을 때 쓴다. - readLines: 텍스트 파일에서 한 라인(한 줄) 읽어 올 때 쓰는 함수 - source: R code 파일의 데이터를 읽어 올 때 쓰는 함수 (inverse of dump) - dget: R code 파일의 데이터를 읽어 올 때 쓰는 함수 (inverse of dput) - load: 저장된 workspace에서 데이터를 읽어 올 때 쓰는 함수 - unserialize: 2진 형태의 단일 R object를 읽어 올 때 쓰는 함수 2. Writing Data 함수 ..

IT | Computer/R 2015.12.30

R 통계 프로그래밍: Data Type (Factors, NA, NaN, Data Frames, Names)

1. Factors 1) 범주형 데이터(categorical data) 표현에 사용 - Unorderd/Ordered 가능 (순차/비순차) - label: 좀 더 self-describing (데이터의 설명이 추가)되게 표현된다. 예) 1/2가 아닌 남/여로 표현 2) factor(): Levels가 기존의 변수 중에 중복을 피하면서 Attribute 중 하나로 설정하여 vector를 생성 - table(): Level에 따라 몇 개의 값이 있는지 Level에 따른 count 값을 출력 - unclass(): Level 표현 없이 class 특징을 없애고 단순한 상수만 출력하고 attribute에 따라 상수에 매칭되는 데이터 값을 같이 출력 3) factor( , levels=() ): 데이터가 표현되는..

IT | Computer/R 2015.12.15

R 통계 프로그래밍: Data Type (R Objects, Attributes, Vectors, Lists)

1. R Objects와 Attributes 1) 5가지 기본 클래스: character, numeric (실수), integer, complex, logical (True/False) 2) 기본 Object: vector - 5가지 클래스를 담고 있는 기본 Object - 한가지 형태의 클래스만 1개 이상 포함: Multiple copies of a single type of object - 예외: list는 다른 클래스끼리 포함할 수 있다. - vector 생성 입력: vector() (2가지 arguments: vector type, vector length) 3) Numbers (numeric objects) - integer 정수 입력을 원하는 경우: L을 추가 (1L로 입력하면 1이 integ..

IT | Computer/R 2015.12.13
반응형