Jupyter cho Đội ngũ Khoa học Dữ liệu Khóa Học Đào Tạo
Jupyter là một IDE và môi trường tính toán tương tác dựa trên web, mã nguồn mở.
Khóa đào tạo trực tiếp (trực tuyến hoặc tại chỗ) này giới thiệu ý tưởng về phát triển cộng tác trong khoa học dữ liệu và trình bày cách sử dụng Jupyter để theo dõi và tham gia với tư cách là một nhóm trong "vòng đời của một ý tưởng tính toán". Khóa học này hướng dẫn người tham gia tạo một dự án khoa học dữ liệu mẫu dựa trên hệ sinh thái Jupyter.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Cài đặt và cấu hình Jupyter, bao gồm tạo và tích hợp kho lưu trữ nhóm trên Git.
- Sử dụng các tính năng của Jupyter như tiện ích mở rộng, widget tương tác, chế độ đa người dùng, v.v. để cho phép cộng tác dự án.
- Tạo, chia sẻ và tổ chức Jupyter Notebook với các thành viên trong nhóm.
- Chọn từ Scala, Python, R để viết và thực thi mã trên các hệ thống dữ liệu lớn như Apache Spark, tất cả thông qua giao diện Jupyter.
Định dạng khóa học
- Bài giảng và thảo luận tương tác.
- Nhiều bài tập và thực hành.
- Thực hiện trực tiếp trong môi trường lab trực tiếp.
Tùy chọn tùy chỉnh khóa học
- Jupyter Notebook hỗ trợ hơn 40 ngôn ngữ bao gồm R, Python, Scala, Julia, v.v. Để tùy chỉnh khóa học này theo ngôn ngữ (các) bạn chọn, vui lòng liên hệ với chúng tôi để sắp xếp.
Đề cương khóa học
Giới thiệu về Jupyter
- Tổng quan về Jupyter và hệ sinh thái của nó
- Cài đặt và thiết lập
- Cấu hình Jupyter để cộng tác nhóm
Tính năng Cộng tác
- Sử dụng Git để kiểm soát phiên bản
- Tiện ích mở rộng và widget tương tác
- Chế độ đa người dùng
Tạo và Quản lý Notebook
- Cấu trúc và chức năng của Notebook
- Chia sẻ và tổ chức Notebook
- Các phương pháp hay nhất để cộng tác
Programming với Jupyter
- Chọn và sử dụng các ngôn ngữ lập trình (Python, R, Scala)
- Viết và thực thi mã
- Tích hợp với các hệ thống dữ liệu lớn (Apache Spark)
Tính năng Nâng cao của Jupyter
- Tùy chỉnh môi trường Jupyter
- Tự động hóa quy trình làm việc với Jupyter
- Khám phá các trường hợp sử dụng nâng cao
Các Buổi Thực hành
- Các phòng thí nghiệm thực hành
- Các dự án khoa học dữ liệu thực tế
- Các bài tập nhóm và đánh giá ngang hàng
Tóm tắt và Các Bước Tiếp Theo
Yêu cầu
- Có kinh nghiệm với các ngôn ngữ như Python, R, SQL, v.v.
- Có kiến thức nền tảng về khoa học dữ liệu
Đối tượng
- Các đội nhóm khoa học dữ liệu
Khóa học đào tạo mở cần có ít nhất 5 người tham gia.
Jupyter cho Đội ngũ Khoa học Dữ liệu Khóa Học Đào Tạo - Đặt chỗ
Jupyter cho Đội ngũ Khoa học Dữ liệu Khóa Học Đào Tạo - Yêu cầu thông tin
Jupyter cho Đội ngũ Khoa học Dữ liệu - Yêu cầu tư vấn
Đánh giá (1)
Thật tuyệt vời khi khóa học được tùy chỉnh cho những điểm chính mà tôi đã đánh dấu trong bảng câu hỏi trước khóa học. Điều này thực sự giúp giải quyết các thắc mắc của tôi về nội dung môn học và phù hợp với mục tiêu học tập của tôi.
Winnie Chan - Statistics Canada
Khóa học - Jupyter for Data Science Teams
Dịch thuật bằng máy
Các khóa học sắp tới
Các khóa học liên quan
Giới thiệu về Khoa học Dữ liệu và Trí tuệ Nhân tạo sử dụng Python
35 GiờĐây là khóa giới thiệu kéo dài 5 ngày về Khoa học Dữ liệu và Trí tuệ Nhân tạo (AI).
Khóa học được thực hiện với các ví dụ và bài tập sử dụng Python
Apache Airflow cho Data Science: Tự động hóa Chuỗipipeline
21 GiờKhóa học trực tiếp, trực tuyến hoặc tại chỗ, được thiết kế cho các tham gia có trình độ trung cấp muốn tự động hóa và quản lý các luồng công việc học máy, bao gồm đào tạo mô hình, xác thực và triển khai bằng Apache Airflow.
Sau khi hoàn thành khóa học, các tham gia sẽ có khả năng:
- Cài đặt Apache Airflow cho việc điều phối luồng công việc học máy.
- Tự động hóa các nhiệm vụ tiền xử lý dữ liệu, đào tạo mô hình và xác thực.
- Tích hợp Airflow với các khung học máy và công cụ.
- Triển khai mô hình học máy bằng các luồng tự động hóa.
- Theo dõi và tối ưu hóa các luồng công việc học máy trong sản xuất.
Hệ thống Ecosystem cho Khoa học Dữ liệu
14 GiờKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu muốn sử dụng hệ sinh thái Anaconda để thu thập, quản lý và triển khai các gói và quy trình phân tích dữ liệu trên một nền tảng duy nhất.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Cài đặt và cấu hình các thành phần và thư viện Anaconda.
- Hiểu các khái niệm, tính năng và lợi ích cốt lõi của Anaconda.
- Quản lý các gói, môi trường và kênh bằng Anaconda Navigator.
- Sử dụng các gói Conda, R và Python cho khoa học dữ liệu và học máy.
- Tìm hiểu một số trường hợp sử dụng thực tế và kỹ thuật quản lý nhiều môi trường dữ liệu.
AWS Cloud9 cho Data Science
28 GiờKhóa học trực tiếp được giảng dạy (trực tuyến hoặc tại cơ sở) được hướng tới những nhà khoa học dữ liệu và phân tích dữ liệu trung cấp muốn sử dụng AWS Cloud9 để tối ưu hóa các luồng làm việc khoa học dữ liệu.
Đến cuối khóa học, các thí sinh sẽ có thể:
- Cài đặt môi trường khoa học dữ liệu trong AWS Cloud9.
- Thực hiện phân tích dữ liệu bằng Python, R và Jupyter Notebook trong Cloud9.
- Tích hợp AWS Cloud9 với các dịch vụ dữ liệu AWS như S3, RDS và Redshift.
- Sử dụng AWS Cloud9 cho phát triển và triển khai mô hình học máy.
- Tối ưu hóa các luồng làm việc dựa trên đám mây cho phân tích và xử lý dữ liệu.
Giới thiệu về Google Colab cho Khoa học Dữ liệu
14 GiờKhóa huấn luyện trực tiếp do giáo viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) nhằm vào các nhà khoa học dữ liệu và chuyên gia CNTT cấp sơ cấp, mong muốn học cơ bản về khoa học dữ liệu sử dụng Google Colab.
Đến cuối khóa huấn luyện, người tham gia sẽ có thể:
- Thiết lập và điều hướng Google Colab.
- Viết và thực thi mã Python cơ bản.
- Nhập và xử lý dữ liệu.
- Tạo trực quan hóa sử dụng thư viện Python.
Giới thiệu Thực tế về Khoa học Dữ liệu
35 GiờNhững người tham gia hoàn thành khóa đào tạo này sẽ có hiểu biết thực tế, mang tính ứng dụng cao về Khoa học Dữ liệu và các công nghệ, phương pháp và công cụ liên quan.
Người tham gia sẽ có cơ hội áp dụng kiến thức này vào thực hành thông qua các bài tập thực hành. Sự tương tác trong nhóm và phản hồi từ giáo viên là một phần quan trọng của khóa học.
Khóa học bắt đầu với việc giới thiệu về các khái niệm cơ bản của Khoa học Dữ liệu, sau đó tiếp tục vào các công cụ và phương pháp được sử dụng trong Khoa học Dữ liệu.
Đối tượng tham gia
- Lập trình viên
- Phân tích kỹ thuật
- Tư vấn viên IT
Định dạng khóa học
- Phần giảng dạy, phần thảo luận, bài tập và thực hành nhiều.
Lưu ý
- Để yêu cầu khóa đào tạo tùy chỉnh cho khóa học này, vui lòng liên hệ với chúng tôi để sắp xếp.
Data Science Programme
245 GiờThe explosion of information and data in today’s world is un-paralleled, our ability to innovate and push the boundaries of the possible is growing faster than it ever has. The role of Data Scientist is one of the highest in-demand skills across industry today.
We offer much more than learning through theory; we deliver practical, marketable skills that bridge the gap between the world of academia and the demands of industry.
This 7 week curriculum can be tailored to your specific Industry requirements, please contact us for further information or visit the Nobleprog Institute website
Audience:
This programme is aimed post level graduates as well as anyone with the required pre-requisite skills which will be determined by an assessment and interview.
Delivery:
Delivery of the course will be a mixture of Instructor Led Classroom and Instructor Led Online; typically the 1st week will be 'classroom led', weeks 2 - 6 'virtual classroom' and week 7 back to 'classroom led'.
Khoa học Dữ liệu cho Phân tích Dữ liệu Lớn
35 GiờDữ liệu lớn là các tập dữ liệu có dung lượng và độ phức tạp quá lớn khiến phần mềm ứng dụng xử lý dữ liệu truyền thống không thể đáp ứng được. Những thách thức của dữ liệu lớn bao gồm thu thập dữ liệu, lưu trữ dữ liệu, phân tích dữ liệu, tìm kiếm, chia sẻ, truyền tải, trực quan hóa, truy vấn, cập nhật và bảo mật thông tin.
Data Science essential for Marketing/Sales professionals
21 Giờ
This course is meant for Marketing Sales Professionals who are intending to get deeper into application of data science in Marketing/ Sales. The course provides
detailed coverage of different data science techniques used for “upsale”, “cross-sale”, market segmentation, branding and CLV.
Difference of Marketing and Sales - How is that sales and marketing are different?
In very simplewords, sales can be termed as a process which focuses or targets on individuals or small groups. Marketing on the other hand targets a larger group or the general public. Marketing includes research (identifying needs of the customer), development of products (producing innovative products) and promoting the product (through advertisements) and create awareness about the product among the consumers. As such marketing means generating leads or prospects. Once the product is out in the market, it is the task of the sales person to persuade the customer to buy the product. Sales means converting the leads or prospects into purchases and orders, while marketing is aimed at longer terms, sales pertain to shorter goals.
Giới thiệu về Khoa học Dữ liệu
35 GiờĐây là khóa đào tạo trực tiếp do giảng viên hướng dẫn (trực tuyến hoặc tại chỗ) dành cho các chuyên gia muốn bắt đầu sự nghiệp trong lĩnh vực Khoa học Dữ liệu.
Cuối khóa học, người tham gia sẽ có thể:
- Cài đặt và cấu hình Python và MySql.
- Hiểu rõ về Khoa học Dữ liệu và cách nó có thể mang lại giá trị cho hầu như bất kỳ doanh nghiệp nào.
- Học các nguyên tắc cơ bản của lập trình trong Python
- Học các kỹ thuật Học máy giám sát và không giám sát, cách triển khai chúng và diễn giải kết quả.
Định dạng Khóa học
- Bài giảng tương tác và thảo luận.
- Nhiều bài tập và thực hành.
- Thực hiện trực tiếp trong môi trường phòng thí nghiệm trực tiếp.
Tùy chọn Tùy chỉnh Khóa học
- Để yêu cầu khóa đào tạo tùy chỉnh cho khóa học này, vui lòng liên hệ với chúng tôi để sắp xếp.
Kaggle
14 GiờKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và nhà phát triển muốn học hỏi và xây dựng sự nghiệp của họ trong Data Science bằng cách sử dụng Kaggle.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Tìm hiểu về khoa học dữ liệu và học máy.
- Khám phá phân tích dữ liệu.
- Tìm hiểu về Kaggle và cách thức hoạt động của nó.
Khoa Học Dữ Liệu với KNIME Analytics Platform
21 GiờKNIME Analytics Platform là một lựa chọn nguồn mở hàng đầu cho sự đổi mới dựa trên dữ liệu, giúp bạn khám phá tiềm năng ẩn chứa trong dữ liệu của mình, khai thác những cái nhìn mới mẻ hoặc dự đoán các tương lai mới. Với hơn 1000 mô-đun, hàng trăm ví dụ sẵn sàng chạy, phạm vi công cụ tích hợp toàn diện và sự lựa chọn đa dạng nhất về các thuật toán tiên tiến, KNIME Analytics Platform là hộp dụng cụ hoàn hảo cho bất kỳ nhà khoa học dữ liệu hay nhà phân tích kinh doanh nào.
Khóa học này về KNIME Analytics Platform là cơ hội lý tưởng dành cho người mới bắt đầu, người dùng nâng cao và chuyên gia KNIME để được giới thiệu về KNIME, học cách sử dụng nó hiệu quả hơn và cách tạo các báo cáo rõ ràng, toàn diện dựa trên quy trình làm việc của KNIME.
Khóa huấn luyện trực tiếp do giáo viên hướng dẫn (trực tuyến hoặc tại địa điểm) này nhằm vào các chuyên gia dữ liệu mong muốn sử dụng KNIME để giải quyết nhu cầu kinh doanh phức tạp.
Nó nhắm đến đối tượng không biết lập trình và có ý định sử dụng các công cụ tiên tiến để triển khai các kịch bản phân tích.
Sau khóa huấn luyện này, người tham gia sẽ có thể:
- Cài đặt và cấu hình KNIME.
- Xây dựng các kịch bản Khoa Học Dữ Liệu
- Đào tạo, thử nghiệm và kiểm chứng mô-đun
- Triển khai chuỗi giá trị từ đầu đến cuối của các mô-đun khoa học dữ liệu
Định dạng Khóa Học
- Bài giảng tương tác và thảo luận.
- Nhiều bài tập và thực hành.
- Triển khai thực tế trong môi trường lab trực tiếp.
Tùy chỉnh Khóa Học
- Để yêu cầu khóa huấn luyện tùy chỉnh cho khóa học này hoặc để biết thêm thông tin về chương trình, vui lòng liên hệ với chúng tôi để sắp xếp.
Cơ bản MATLAB, Khoa học Dữ liệu & Tạo Báo cáo
35 GiờTrong phần đầu tiên của khóa đào tạo này, chúng tôi giới thiệu các kiến thức cơ bản về MATLAB và vai trò của nó như một ngôn ngữ lập trình và nền tảng. Bao gồm trong cuộc thảo luận là một cái nhìn tổng quan về cú pháp MATLAB, mảng và ma trận, trực quan hóa dữ liệu, phát triển kịch bản và nguyên tắc hướng đối tượng.
Ở phần thứ hai, chúng tôi trình bày cách sử dụng MATLAB cho khai thác dữ liệu, học máy và phân tích dự đoán. Để cung cấp cho người tham gia một cái nhìn rõ ràng và thực tế về phương pháp tiếp cận và sức mạnh của MATLAB, chúng tôi đưa ra các so sánh giữa việc sử dụng MATLAB và sử dụng các công cụ khác như bảng tính, C, C++, và Visual Basic.
Ở phần thứ ba của khóa đào tạo, người tham gia học cách tối ưu hóa công việc bằng cách tự động hóa xử lý dữ liệu và tạo báo cáo.
Xuyên suốt khóa học, người tham gia sẽ thực hành các ý tưởng đã học thông qua các bài tập thực tế trong môi trường phòng thí nghiệm. Cuối khóa đào tạo, người tham gia sẽ có hiểu biết sâu sắc về khả năng của MATLAB và có thể sử dụng nó để giải quyết các vấn đề khoa học dữ liệu thực tế cũng như tối ưu hóa công việc thông qua tự động hóa.
Các đánh giá sẽ được tiến hành xuyên suốt khóa học để theo dõi tiến độ.
Định dạng của Khóa Học
- Khóa học bao gồm các bài tập lý thuyết và thực tế, bao gồm thảo luận về trường hợp, kiểm tra mã mẫu và triển khai thực tế.
Lưu ý
- Các buổi thực hành sẽ dựa trên các mẫu báo cáo dữ liệu đã được sắp xếp trước. Nếu bạn có yêu cầu cụ thể, vui lòng liên hệ với chúng tôi để bố trí.
Tăng tốc độ làm việc với Pandas trong Python bằng Modin
14 GiờKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và nhà phát triển muốn sử dụng Modin để xây dựng và triển khai các phép tính song song với Pandas để phân tích dữ liệu nhanh hơn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường cần thiết để bắt đầu phát triển các quy trình làm việc Pandas quy mô lớn với Modin.
- Hiểu các tính năng, kiến trúc và lợi thế của Modin.
- Nắm vững sự khác biệt giữa Modin, Dask và Ray.
- Thực hiện các thao tác Pandas nhanh hơn với Modin.
- Triển khai toàn bộ API và các hàm Pandas.
Khoa học Dữ liệu với GPU sử dụng NVIDIA RAPIDS
14 GiờKhóa học trực tiếp của giáo viên (trực tuyến hoặc trực tiếp tại cơ sở) này được hướng dẫn cho các nhà khoa học dữ liệu và nhà phát triển muốn sử dụng RAPIDS để xây dựng các pipeline, luồng làm việc, và hình ảnh trực quan được tăng tốc bởi GPU, áp dụng các thuật toán học máy như XGBoost, cuML, và các thuật toán khác.
Đến cuối khóa học này, các tham gia sẽ có thể:
- Cài đặt môi trường phát triển cần thiết để xây dựng các mô hình dữ liệu với NVIDIA RAPIDS.
- Hiểu về các tính năng, thành phần, và lợi ích của RAPIDS.
- Tận dụng GPU để tăng tốc các pipeline dữ liệu và phân tích dữ liệu từ đầu đến cuối.
- Thực hiện chuẩn bị dữ liệu và ETL được tăng tốc bởi GPU với cuDF và Apache Arrow.
- Học cách thực hiện các tác vụ học máy với các thuật toán XGBoost và cuML.
- Xây dựng hình ảnh trực quan dữ liệu và thực hiện phân tích đồ thị với cuXfilter và cuGraph.