[R] – Cơ bản đầu tiên về ngôn ngữ R

Ta sẽ đi đến một số khái niệm cơ bản, cách cài đặt và các IDE để lập trình.

R là một ngôn ngữ lập trình,. Sử dụng trong tính toán thống kê.

R có thể được sử dụng cho rất nhiều thứ, nó được sử dụng tốt nhất cho việc phân tích dữ liệu.

Mọi người có thể tạo và phân phối các package để bổ sung vào các chức năng cơ bản của ngôn ngữ R.

Link download : https://cran.r-project.org/

IDE để lập trình R

IDE phổ biến cho lập trình R là RStudio. Bạn cũng có thể sử dụng RGUI (Windows) hoặc Terminal (Unix).

Link download : https://www.rstudio.com/products/rstudio/download/

Lập Trình R

R có cú pháp đơn giản. Không cần khởi tạo biến, ta cũng có thể thực hiện các phép tính đơn gỉan. Chỉ cần nhập gía trị cần tính và nhấn Enter.
>[1] 5 + 6
>[2] 11

Toán tử gán “<-“
> x <- 1 ## Thực hiện gán giá trị 1 cho biến x
> print(x) ## In ra giá trị x
[1] 1
> x ## In ra giá trị x
[1] 1
> msg <- "hello" // Thực hiện gán giá trị "hello" cho biến msg

NOTE :
Có 2 cách in ra một biến.
Cách 1 : print(VALUE) (explicit printing)
Cách 2 : VALUE (auto-printing occurs)
– Để viết chú thích cho code thì ta dùng ký tự “#”.
– Để thoát ra khỏi IDE ta dùng lệnh quit(). Khi ta thực hiện lệnh thoát ra hoặc tắt IDE bằng một số cách khác
thì trước khi thoát ra sẽ hiện một thông báo.

RBASIC1
Nếu bạn chọn YES thì RGUI sẽ tạo một file lưu lại các biến mà bạn đã gán và sử dụng. Bạn có thể mở lại file này
và sử dụng các biến đó.
Nếu bạn chọn No hoặc Cancel thì tự hiểu. // Chắc không khó đâu.

* R là một ngôn ngữ lập trình hướng đối tượng, tất cả thành phần của R đều là đối tượng.
Được biểu diễn bởi đối tượng vector với độ dài (length).
Để tạo một vector là sử dụng hàm c()

z <- c(1, 2, 3)
Ta vừa tạo 1 vector chứa các số 1,3,4 và lưu vào biến z.

* R có 5 kiểu dữ liệu cơ bản (atomic classes of object – vector đơn cấu trúc):
– character
– numeric (real numbers)
– integer
– complex
– logical (True/False)

* Vector có hai dạng chính:
– atomic vector (vector đơn cấu trúc)
– list (danh sách – vector đa cấu trúc)
Về atomic vector là chỉ chứa duy nhất một kiểu dữ liệu, trong khi đó list có thể chứa nhiều kiểu dữ liệu khác nhau