Đề cương khóa học
Python Fundamentals for Data Tasks
- Installing Python and setting up the development environment
- Language fundamentals: variables, data types, control structures
- Writing and running simple Python scripts
File Handling: CSV and Excel
- Reading and writing CSV files using the csv module and Pandas
- Working with Excel files using openpyxl/xlrd and Pandas
- Practical exercises: automating file conversions
Introduction to Pandas
- DataFrame basics: creation, indexing, selection, and filtering
- Aggregation and grouping operations
- Common cleaning operations: missing values, duplicates, and type conversions
Introduction to Polars
- Polars concepts and performance characteristics compared to Pandas
- Basic DataFrame operations in Polars
- Use-case example: when to choose Polars over Pandas
Advanced Data Transformation (Intermediate)
- Complex joins, window functions, and pivot operations in Pandas
- Efficient data processing patterns with Polars
- Chaining operations and optimizing memory usage
Process Automation with Python
- Writing scripts to automate repetitive data tasks and ETL steps
- Scheduling scripts with OS schedulers or task schedulers
- Logging, error handling, and notifications
Packaging Scripts and Best Practices
- Creating executables with PyInstaller or similar tools
- Project structuring, virtual environments, and dependency management
- Version control basics and documenting workflows
Hands-on Mini-Project
- End-to-end task: read raw files, clean and transform data, produce outputs
- Automate the workflow and package as a runnable script or executable
- Review and improvements based on peer feedback
Summary and Next Steps
Yêu cầu
- Basic familiarity with programming concepts or willingness to learn
- Comfort using command-line or terminal for package installation
- Experience working with spreadsheets (CSV/Excel)
Audience
- Data analysts and operations staff automating data tasks
- Analytical engineers seeking lightweight ETL scripting
- Professionals interested in practical Python-based data workflows
Đánh giá (5)
Việc có nhiều bài tập thực hành hơn sử dụng dữ liệu tương tự như chúng ta dùng trong các dự án của mình (hình ảnh vệ tinh ở định dạng raster)
Matthieu - CS Group
Khóa học - Scaling Data Analysis with Python and Dask
Dịch thuật bằng máy
Tôi nghĩ giảng viên rất am hiểu và trả lời câu hỏi với sự tự tin để làm rõ hiểu biết.
Jenna - TCMT
Khóa học - Machine Learning with Python – 2 Days
Dịch thuật bằng máy
Đánh giá rất tốt về sự chuẩn bị và chuyên môn của giảng viên, giao tiếp tiếng Anh hoàn hảo. Khóa học mang tính thực hành cao (bài tập + chia sẻ các ví dụ về trường hợp sử dụng)
Monika - Procter & Gamble Polska Sp. z o.o.
Khóa học - Developing APIs with Python and FastAPI
Dịch thuật bằng máy
Giải thích
Wei Yang Teo - Ministry of Defence, Singapore
Khóa học - Machine Learning with Python – 4 Days
Dịch thuật bằng máy
Giảng viên phát triển khóa học dựa trên tốc độ của người tham gia
Farris Chua
Khóa học - Data Analysis in Python using Pandas and Numpy
Dịch thuật bằng máy