Lập trình Thu thập Dữ liệu Web với Python Khóa Học Đào Tạo
Web Scraping là kỹ thuật trích xuất dữ liệu từ một trang web sau đó lưu nó vào tệp cục bộ hoặc cơ sở dữ liệu.
Khóa đào tạo trực tiếp, trực tuyến hoặc tại chỗ này dành cho các nhà phát triển muốn sử dụng Python để tự động hóa quy trình thu thập dữ liệu từ nhiều trang web để xử lý và phân tích.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Cài đặt và cấu hình Python và tất cả các gói liên quan.
- Thu thập và phân tích dữ liệu được lưu trữ trên nhiều trang web.
- Hiểu cách thức hoạt động của các trang web và cách cấu trúc HTML của chúng.
- Xây dựng các spider để thu thập dữ liệu trên web một cách quy mô.
- Sử dụng Selenium để thu thập dữ liệu từ các trang web được điều khiển bởi AJAX.
Định dạng khóa học
- Bài giảng và thảo luận tương tác.
- Nhiều bài tập và thực hành.
- Thực hành trực tiếp trong môi trường lab thực tế.
Tùy chọn tùy chỉnh khóa học
- Khóa học này giả định kiến thức về lập trình.
- Để yêu cầu đào tạo tùy chỉnh cho khóa học này, vui lòng liên hệ với chúng tôi để sắp xếp.
Đề cương khóa học
Giới thiệu
Thiết lập Môi trường Phát triển
Python Bài tập cơ bản: Cấu trúc Dữ liệu, Điều kiện, Xử lý Tệp, v.v.
Python Các gói cho Web Scraping: Scrapy và BeautifulSoup
Cách một Website Hoạt động
Cách HTML được Cấu trúc
Thực hiện Yêu cầu Web
Scraping một Trang HTML
Làm việc với XPath và CSS
Lọc Dữ liệu Sử dụng Biểu thức Chính quy Express
Tạo Web Crawler
Thu thập dữ liệu (Crawling) các Trang AJAX và JavaScript với Selenium.
Các Thực hành Tốt nhất về Web Scraping
Khắc phục Sự cố
Tóm tắt và Kết luận
Yêu cầu
- Programming kinh nghiệm, ưu tiên trong Python. Nếu người tham gia có kinh nghiệm lập trình bằng ngôn ngữ khác Python, khóa đào tạo có thể được mở rộng để bao gồm nhiều bài tập giới thiệu về Python hơn.
Đối tượng
- Các nhà phát triển
Khóa học đào tạo mở cần có ít nhất 5 người tham gia.
Lập trình Thu thập Dữ liệu Web với Python Khóa Học Đào Tạo - Đặt chỗ
Lập trình Thu thập Dữ liệu Web với Python Khóa Học Đào Tạo - Yêu cầu thông tin
Lập trình Thu thập Dữ liệu Web với Python - Yêu cầu tư vấn
Đánh giá (1)
Đã đề cập đến nhiều ví dụ và chủ đề khác nhau, từ điều tra cơ bản đến quản lý đăng nhập và quản lý trang động.
Daniele Tagliaferro - Creditsafe Italia Srl
Khóa học - Web Scraping with Python
Dịch thuật bằng máy
Các khóa học sắp tới
Các khóa học liên quan
Python Nâng Cao: Thực Hành Tốt Nhất và Mô Hình Thiết Kế
28 GiờKhóa học thực hành này tập trung vào các kỹ thuật Python nâng cao, các thực hành kỹ thuật tốt nhất và các mô hình thiết kế thông dụng để xây dựng các ứng dụng Python có thể duy trì, kiểm thử và hiệu suất cao. Khóa học nhấn mạnh về công cụ hiện đại, kiểu dữ liệu, các mô hình đồng thời, các mô hình kiến trúc và quy trình làm việc sẵn sàng triển khai.
Khóa học hướng dẫn trực tiếp này (trực tuyến hoặc tại địa điểm) dành cho các lập trình viên Python trung cấp đến nâng cao muốn áp dụng các thực hành và mô hình chuyên nghiệp cho các hệ thống Python đạt chuẩn sản xuất.
Đến cuối khóa học, người tham gia sẽ có thể:
- Áp dụng kiểu dữ liệu Python, dataclasses và kiểm tra kiểu để tăng độ tin cậy của mã.
- Sử dụng các mô hình thiết kế và nguyên tắc kiến trúc để cấu trúc ứng dụng mạnh mẽ.
- Triển khai đồng thời và song song đúng cách bằng asyncio và multiprocessing.
- Xây dựng mã đã được kiểm thử tốt với pytest, kiểm thử dựa trên thuộc tính và các ống dẫn CI.
- Định mức, tối ưu hóa và củng cố ứng dụng Python cho sản xuất.
- Bao gói, phân phối và triển khai dự án Python bằng công cụ hiện đại và container.
Định dạng Khóa Học
- Bài giảng tương tác và các demo ngắn.
- Labs thực hành và bài tập lập trình hàng ngày.
- Dự án tổng hợp nhỏ tích hợp mô hình, kiểm thử và triển khai.
Tùy Chỉnh Khóa Học
- Để yêu cầu khóa học tùy chỉnh hoặc khu vực tập trung (dữ liệu, web, hoặc infra), vui lòng liên hệ với chúng tôi để sắp xếp.
Kỹ thuật AI Đại diện với Python — Xây dựng các tác nhân tự động
21 GiờKhoá học này giảng dạy các kỹ thuật thiết kế, xây dựng, kiểm thử và triển khai hệ thống tự động (đại diện) sử dụng Python. Nó bao gồm vòng lặp tác nhân, tích hợp công cụ, quản lý bộ nhớ và trạng thái, mô hình dàn xếp, kiểm soát an toàn và xem xét sản phẩm.
Khoá học trực tuyến hoặc tại chỗ do giảng viên hướng dẫn này dành cho các kỹ sư ML trung cấp đến cao cấp, nhà phát triển AI và kỹ sư phần mềm mong muốn xây dựng các tác nhân tự động mạnh mẽ và sẵn sàng sản xuất sử dụng Python.
Đến cuối khoá học, người tham gia sẽ có thể:
- Thiết kế và triển khai vòng lặp tác nhân và quy trình ra quyết định.
- Tích hợp các công cụ và API bên ngoài để mở rộng khả năng của tác nhân.
- Triển khai kiến trúc bộ nhớ ngắn hạn và dài hạn cho tác nhân.
- Tổ chức các dàn xếp đa bước và khả năng ghép nối tác nhân.
- Áp dụng các thực hành tốt nhất về an toàn, kiểm soát truy cập và khả năng quan sát cho các tác nhân đã triển khai.
Định dạng của Khoá học
- Bài giảng tương tác và thảo luận.
- Các phòng thí nghiệm thực hành xây dựng tác nhân với Python và các SDK phổ biến.
- Các bài tập dựa trên dự án tạo ra các nguyên mẫu có thể triển khai.
Tùy chọn Tùy chỉnh Khoá học
- Để yêu cầu một khóa học tùy chỉnh, vui lòng liên hệ với chúng tôi để xếp lịch.
Giới thiệu về Khoa học Dữ liệu và Trí tuệ Nhân tạo sử dụng Python
35 GiờĐây là khóa giới thiệu kéo dài 5 ngày về Khoa học Dữ liệu và Trí tuệ Nhân tạo (AI).
Khóa học được thực hiện với các ví dụ và bài tập sử dụng Python
Trí Tuệ Nhân Tạo với Python (Cấp Độ Trung Cấp)
35 GiờTrí tuệ Nhân tạo với Python là sự phát triển của hệ thống thông minh sử dụng hệ sinh thái rộng lớn về AI và học máy của Python.
Bài giảng này do giáo viên hướng dẫn (trực tuyến hoặc tại chỗ) nhằm vào các lập trình viên cấp trung của Python muốn thiết kế, triển khai và triển khai giải pháp AI sử dụng Python.
Tại kết thúc khóa học này, người tham gia sẽ có thể:
- Triển khai các thuật toán AI bằng cách sử dụng thư viện AI gốc của Python.
- Làm việc với mô hình học giám sát, không giám sát và tăng cường.
- Tích hợp giải pháp AI vào ứng dụng và quy trình hiện có.
- Đánh giá hiệu suất mô hình và tối ưu hóa cho độ chính xác và hiệu quả.
Thể loại của khóa học
- Bài giảng tương tác và thảo luận.
- Nhiều bài tập và thực hành.
- Tự thực hiện trong môi trường phòng thí nghiệm trực tiếp.
Tùy chọn Tùy chỉnh khóa học
- Để yêu cầu một khóa học tùy chỉnh cho khóa này, vui lòng liên hệ với chúng tôi để sắp xếp.
Giao dịch thuật toán với Python và R
14 GiờKhóa đào tạo trực tiếp do giảng viên hướng dẫn tại Việt Nam (trực tuyến hoặc tại chỗ) này nhằm vào các nhà phân tích kinh doanh muốn tự động hóa giao dịch bằng thuật toán, Python và R.
Sau khi hoàn thành khóa học này, người tham gia sẽ có thể:
- Sử dụng các thuật toán để mua và bán chứng khoán nhanh chóng ở mức tăng giảm chuyên biệt.
- Giảm chi phí liên quan đến giao dịch bằng cách sử dụng giao dịch thuật toán.
- Tự động theo dõi giá cổ phiếu và đặt lệnh giao dịch.
Ứng dụng AI từ Cơ bản trong Python
28 GiờĐây là một khóa học kéo dài 4 ngày giới thiệu về AI và ứng dụng của nó bằng ngôn ngữ lập trình Python. Có tùy chọn tham gia thêm một ngày để thực hiện một dự án AI sau khi hoàn thành khóa học này.
AWS Cloud9 và Python: Hướng dẫn Thực hành
14 GiờKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển trình độ trung cấp Python muốn nâng cao trải nghiệm phát triển Python bằng AWS Cloud9.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập và cấu hình AWS Cloud9 cho phát triển Python.
- Hiểu giao diện và các tính năng của IDE AWS Cloud9.
- Viết, gỡ lỗi và triển khai các ứng dụng Python trong AWS Cloud9.
- Hợp tác với các nhà phát triển khác bằng nền tảng AWS Cloud9.
- Tích hợp AWS Cloud9 với các dịch vụ AWS khác để triển khai nâng cao.
Tạo Ra Các Bot Trò Chuyện bằng Python
21 GiờChatBots là các chương trình máy tính tự động mô phỏng phản hồi của con người thông qua giao diện trò chuyện. ChatBots giúp các tổ chức tối đa hóa hiệu quả hoạt động bằng cách cung cấp các tùy chọn dễ dàng và nhanh chóng hơn cho tương tác của người dùng.
Trong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này, người tham gia sẽ học cách xây dựng ChatBots trong Python.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Hiểu các nguyên tắc cơ bản của việc xây dựng chatbot
- Xây dựng, kiểm tra, triển khai và khắc phục sự cố cho nhiều chatbot khác nhau bằng cách sử dụng Python
Đối tượng
- Nhà phát triển
Định dạng khóa học
- Kết hợp bài giảng, thảo luận, bài tập và thực hành chuyên sâu
Lưu ý
- Để yêu cầu đào tạo tùy chỉnh cho khóa học này, vui lòng liên hệ với chúng tôi để sắp xếp.
Lập trình GPU với CUDA và Python
14 GiờKhóa học trực tuyến hoặc tại chỗ do giảng viên hướng dẫn này ở Việt Nam dành cho các nhà phát triển trung cấp muốn sử dụng CUDA để xây dựng ứng dụng Python chạy song song trên GPU của NVIDIA.
Sau khi kết thúc khóa học, người tham gia sẽ có thể:
- Sử dụng trình biên dịch Numba để tăng tốc độ ứng dụng Python chạy trên GPU của NVIDIA.
- Tạo, biên dịch và khởi động các kernel CUDA tùy chỉnh.
- Quản lý bộ nhớ GPU.
- Chuyển đổi ứng dụng dựa trên CPU thành ứng dụng được tăng tốc bởi GPU.
Phân Tích Dữ Liệu Quy Mô Lớn với Python và Dask
14 GiờKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và kỹ sư phần mềm muốn sử dụng Dask với hệ sinh thái Python để xây dựng, mở rộng và phân tích các tập dữ liệu lớn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường để bắt đầu xây dựng xử lý dữ liệu lớn với Dask và Python.
- Khám phá các tính năng, thư viện, công cụ và API có sẵn trong Dask.
- Hiểu cách Dask tăng tốc tính toán song song trong Python.
- Tìm hiểu cách mở rộng hệ sinh thái Python (Numpy, SciPy và Pandas) bằng cách sử dụng Dask.
- Tối ưu hóa môi trường Dask để duy trì hiệu suất cao trong việc xử lý các tập dữ liệu lớn.
Phân tích dữ liệu với Python, Pandas và Numpy
14 GiờKhóa đào tạo trực tiếp do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển Python và chuyên gia phân tích dữ liệu ở trình độ trung cấp, mong muốn nâng cao kỹ năng phân tích và xử lý dữ liệu sử dụng Pandas và NumPy.
Bằng cuối khóa học này, người tham gia sẽ có thể:
- Cài đặt môi trường phát triển bao gồm Python, Pandas và NumPy.
- Tạo ứng dụng phân tích dữ liệu bằng Pandas và NumPy.
- Thực hiện các thao tác xử lý dữ liệu phức tạp, sắp xếp và lọc dữ liệu.
- Thực hiện các thao tác tổng hợp và phân tích dữ liệu chuỗi thời gian.
- Trực quan hóa dữ liệu bằng Matplotlib và các thư viện trực quan khác.
- Gỡ lỗi và tối ưu hóa mã phân tích dữ liệu của họ.
Phát triển Full Stack FARM (FastAPI, React và MongoDB)
14 GiờKhóa đào tạo trực tiếp, trực tuyến hoặc tại chỗ này dành cho các nhà phát triển muốn sử dụng bộ công cụ FARM (FastAPI, React và MongoDB) để xây dựng các ứng dụng web động, hiệu suất cao và có khả năng mở rộng.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết tích hợp FastAPI, React và MongoDB.
- Hiểu các khái niệm, tính năng và lợi ích chính của bộ công cụ FARM.
- Tìm hiểu cách xây dựng REST API với FastAPI.
- Tìm hiểu cách thiết kế các ứng dụng tương tác với React.
- Phát triển, kiểm tra và triển khai các ứng dụng (front-end và back-end) bằng bộ công cụ FARM.
Phát triển API với Python và FastAPI
14 GiờKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển muốn sử dụng FastAPI với Python để xây dựng, kiểm tra và triển khai các API RESTful dễ dàng và nhanh chóng hơn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết để xây dựng API với Python và FastAPI.
- Tạo API nhanh chóng và dễ dàng hơn bằng thư viện FastAPI.
- Tìm hiểu cách tạo mô hình dữ liệu và lược đồ dựa trên Pydantic và OpenAPI.
- Kết nối API với cơ sở dữ liệu bằng SQLAlchemy.
- Triển khai bảo mật và xác thực trong API bằng các công cụ của FastAPI.
- Xây dựng hình ảnh container và triển khai API web lên máy chủ đám mây.
Phát hiện gian lận với Python và TensorFlow
14 GiờKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu muốn sử dụng TensorFlow để phân tích dữ liệu gian lận tiềm ẩn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Tạo một mô hình phát hiện gian lận trong Python và TensorFlow.
- Xây dựng các hồi quy tuyến tính và mô hình hồi quy tuyến tính để dự đoán gian lận.
- Phát triển một ứng dụng AI hoàn chỉnh để phân tích dữ liệu gian lận.
Tăng tốc độ làm việc với Pandas trong Python bằng Modin
14 GiờKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và nhà phát triển muốn sử dụng Modin để xây dựng và triển khai các phép tính song song với Pandas để phân tích dữ liệu nhanh hơn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường cần thiết để bắt đầu phát triển các quy trình làm việc Pandas quy mô lớn với Modin.
- Hiểu các tính năng, kiến trúc và lợi thế của Modin.
- Nắm vững sự khác biệt giữa Modin, Dask và Ray.
- Thực hiện các thao tác Pandas nhanh hơn với Modin.
- Triển khai toàn bộ API và các hàm Pandas.