IT | Computer/R

R의 개요 및 역사

바람난후제 2015. 12. 10. 02:04
반응형

1. R: S의 방언이다?

1) S

- Bell Labs에서 John Chambers에 의해 개발된 언어

- Fortran 라이브러리로 개발된 인터넷 내부 통계 분석으로 1976년에 시작

- 1988년, C에 의해 재작성되고 현재의 시스템과 유사한 형태로 제작 (버전 3)

- 1998년, S 언어 버전 4 Release

2) Historical Notes

- 1993년, Bell Labs에서 S 언어 개발과 판매를 위한 독점 라이선스를 StatSci (현재 Insightful Corp.)에게 주었다.

- 2004년, Insightful은 Lucent로부터 S언어를 구입하고 현재의 개발사

- 2006년, Alcatel이 Lucent Technologies를 사고 Alcatel-Lucent라고 현재 불려진다.

- Insightful에서 다양한 GUI등의 기능이 추가된 S언어로 제작된 프로그램을 판매하였다.

- 1998년, Association for Computing Machinery's Software System Award 수여

3) R

- 1991년, 뉴질랜드 출신의 Ross Ihaka와 Robert Gentleman에 의해 R 개발 (1996년 JCGS paper에 게재)

- 1993년, 최초 R 공개

- 1995년, Martin Machler가 R 무료 소프트웨어를 개발하기 위해 GNU General Public License를 사용하는 것에 대해 Ross와 Robert에게 설득

- 1996년, Public mailing list (R-help, R-devel) 생성

- 1997년, R Core Group 형성되었고 R에 대한 소스 코드를 관리한다.

- 2000년, R 버전 1.0.0 공개

- 2013년, R 버전 3.0.2공개

 

2. R 특징

- Syntax와 Semantics가 S와 유사

- 거의 모든 Computing platform/OS에 실행 가능

- Active development상태로 자주 개선된 버전이 공개

- Massive core 형태가 아니라 간단한 Core에 필요한 기능을 Modular package 형태로 나누어 제공

- 다른 통계 패키지보다 정교한 Graphics

- 활동적인 커뮤니티 존재: R-help, R-devel 메일링 리스트, Stack Overflow

- 무엇보다 중요한 것은 무료!

 

3. R 약점

- 동적이나 3D graphics에 대한 지원이 거의 없다.

- 필요한 method가 있으면 직접 구현 해야한다. 또는 유료로 제공되는 것을 구입하여 사용한다.

- Object가 실제 Physical memory에 저장되어야만 한다.

(원하는 것을 구현할 수 있으나 빅데이터 이슈가 커지면서 Object가 크면 실행이 어려울 수도 있다.)

 

4. R 시스템의 설계

1) 다양한 패키지로 구분

- 기본 R 시스템: R 실행과 가장 기본적 기능 포함

- 기타 패키지: utils, stats, datasets, graphics, grDevices, grid, methods, tools, parallel, compiler, splines, tcltk, stats4

- 추천 패키지: boot, class, cluster, codetools, foreign, KernSmooth, lattice, mgcv, nlme, rpart, survival, MASS, spatial, nnet, Matrix

- CRAN 제공 패키지: 약 4000 패키지

- Bioconductor project에서도 다수 패키지 제공: http://bioconductor.org

2) 기타 R 자료들은 CRAN에서 다운 가능: http://cran.r-project.org

 

5. 기타 참고 문헌

- Chambers (2008). Software for Data Analysis, Springer.

- Chambers (1998). Programming with Data, Springer.

- Venables & Ripley (2002). Modern Applied Statistics with S, Springer.

- Venables & Ripley (2000). S Programming, Springer.

- Pinheiro & Bates (2000). Mixed-Effects Models in S and S-PLUS, Springer.

- Murrell (2005). R Graphics, Chapman & Hall/CRC Press.

- 자세한 목록: http://www.r-project.org/doc/bib/R-books.html

반응형