1. R: S의 방언이다?
1) S
- Bell Labs에서 John Chambers에 의해 개발된 언어
- Fortran 라이브러리로 개발된 인터넷 내부 통계 분석으로 1976년에 시작
- 1988년, C에 의해 재작성되고 현재의 시스템과 유사한 형태로 제작 (버전 3)
- 1998년, S 언어 버전 4 Release
2) Historical Notes
- 1993년, Bell Labs에서 S 언어 개발과 판매를 위한 독점 라이선스를 StatSci (현재 Insightful Corp.)에게 주었다.
- 2004년, Insightful은 Lucent로부터 S언어를 구입하고 현재의 개발사
- 2006년, Alcatel이 Lucent Technologies를 사고 Alcatel-Lucent라고 현재 불려진다.
- Insightful에서 다양한 GUI등의 기능이 추가된 S언어로 제작된 프로그램을 판매하였다.
- 1998년, Association for Computing Machinery's Software System Award 수여
3) R
- 1991년, 뉴질랜드 출신의 Ross Ihaka와 Robert Gentleman에 의해 R 개발 (1996년 JCGS paper에 게재)
- 1993년, 최초 R 공개
- 1995년, Martin Machler가 R 무료 소프트웨어를 개발하기 위해 GNU General Public License를 사용하는 것에 대해 Ross와 Robert에게 설득
- 1996년, Public mailing list (R-help, R-devel) 생성
- 1997년, R Core Group 형성되었고 R에 대한 소스 코드를 관리한다.
- 2000년, R 버전 1.0.0 공개
- 2013년, R 버전 3.0.2공개
2. R 특징
- Syntax와 Semantics가 S와 유사
- 거의 모든 Computing platform/OS에 실행 가능
- Active development상태로 자주 개선된 버전이 공개
- Massive core 형태가 아니라 간단한 Core에 필요한 기능을 Modular package 형태로 나누어 제공
- 다른 통계 패키지보다 정교한 Graphics
- 활동적인 커뮤니티 존재: R-help, R-devel 메일링 리스트, Stack Overflow
- 무엇보다 중요한 것은 무료!
3. R 약점
- 동적이나 3D graphics에 대한 지원이 거의 없다.
- 필요한 method가 있으면 직접 구현 해야한다. 또는 유료로 제공되는 것을 구입하여 사용한다.
- Object가 실제 Physical memory에 저장되어야만 한다.
(원하는 것을 구현할 수 있으나 빅데이터 이슈가 커지면서 Object가 크면 실행이 어려울 수도 있다.)
4. R 시스템의 설계
1) 다양한 패키지로 구분
- 기본 R 시스템: R 실행과 가장 기본적 기능 포함
- 기타 패키지: utils, stats, datasets, graphics, grDevices, grid, methods, tools, parallel, compiler, splines, tcltk, stats4
- 추천 패키지: boot, class, cluster, codetools, foreign, KernSmooth, lattice, mgcv, nlme, rpart, survival, MASS, spatial, nnet, Matrix
- CRAN 제공 패키지: 약 4000 패키지
- Bioconductor project에서도 다수 패키지 제공: http://bioconductor.org
2) 기타 R 자료들은 CRAN에서 다운 가능: http://cran.r-project.org
5. 기타 참고 문헌
- Chambers (2008). Software for Data Analysis, Springer.
- Chambers (1998). Programming with Data, Springer.
- Venables & Ripley (2002). Modern Applied Statistics with S, Springer.
- Venables & Ripley (2000). S Programming, Springer.
- Pinheiro & Bates (2000). Mixed-Effects Models in S and S-PLUS, Springer.
- Murrell (2005). R Graphics, Chapman & Hall/CRC Press.
'IT | Computer > R' 카테고리의 다른 글
R 언어 통계 프로그래밍: Reading/Writing Data (0) | 2015.12.30 |
---|---|
R 통계 프로그래밍: Data Type (Factors, NA, NaN, Data Frames, Names) (0) | 2015.12.15 |
R 통계 프로그래밍: Data Type (R Objects, Attributes, Vectors, Lists) (0) | 2015.12.13 |
R언어 통계 프로그래밍: R 콘솔 입출력 (0) | 2015.12.13 |
윈도우즈(Windows)에서 R 설치하기 (0) | 2015.11.28 |