Đề cương khóa học

Ngày Một: Cơ Bản Ngôn Ngữ

  • Giới thiệu khóa học
  • Về Khoa Học Dữ Liệu
    • Định nghĩa Khoa Học Dữ Liệu
    • Quy trình Thực Hiện Khoa Học Dữ Liệu
  • Giới thiệu Ngôn Ngữ R
  • Biến và Loại Dữ Liệu
  • Cấu trúc Điều khiển (Vòng lặp / Đk)
  • RScalars, Vectơ, và Ma trận
    • Định nghĩa Vectơ trong R
    • Ma trận
  • Xử lý Chuỗi và Văn Bản
    • Kiểu dữ liệu Ký tự
    • Đọc/Ghi File
  • Danh sách (Lists)
  • Hàm
    • Giới thiệu về Hàm
    • Closures
    • lapply/sapply hàm
  • DataFrame
  • Thực hành cho tất cả các phần

Ngày Hai: Lập Trình R Nâng Cao

  • DataFrame và Đọc/Ghi File
  • Đọc dữ liệu từ file
  • Chuẩn bị Dữ liệu
  • Tập dữ liệu có sẵn
  • Trực quan hóa
    • Gói đồ họa (Graphics Package)
    • plot() / barplot() / hist() / boxplot() / biểu đồ phân tán
    • Bản đồ nhiệt (Heat Map)
    • Gói ggplot2 (qplot(), ggplot())
  • Khám phá với Dplyr
  • Thực hành cho tất cả các phần

Ngày Ba: Lập Trình Nâng Cao Với R

  • Mô hình Thống kê với R
    • Hàm thống kê
    • Xử lý NA
    • Phân phối (Binomial, Poisson, Normal)
  • Hồi quy
    • Giới thiệu về hồi quy tuyến tính
  • Đề xuất
  • Xử lý Văn bản (gói tm / Wordclouds)
  • Phân cụm
    • Giới thiệu về phân cụm
    • KMeans
  • Phân loại
    • Giới thiệu về phân loại
    • Naive Bayes
    • Cây quyết định (Decision Trees)
    • Đào tạo bằng gói caret
    • Đánh giá thuật toán
  • R và Dữ liệu Lớn
    • Kết nối R với cơ sở dữ liệu
    • Hệ sinh thái Dữ liệu Lớn
  • Thực hành cho tất cả các phần

Yêu cầu

  • Nên có nền tảng lập trình cơ bản

Cài Đặt

  • Máy tính xách tay hiện đại
  • Cài đặt R studio mới nhất và môi trường R
 21 Giờ học

Số người tham gia


Giá cho mỗi người tham gia

Đánh giá (7)

Các khóa học sắp tới

Các danh mục liên quan