Web Scraping với Python Training Course
Web Scraping là kỹ thuật trích xuất dữ liệu từ một trang web sau đó lưu nó vào tệp cục bộ hoặc cơ sở dữ liệu.
Khóa đào tạo trực tiếp, trực tuyến hoặc tại chỗ này dành cho các nhà phát triển muốn sử dụng Python để tự động hóa quy trình thu thập dữ liệu từ nhiều trang web để xử lý và phân tích.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Cài đặt và cấu hình Python và tất cả các gói liên quan.
- Thu thập và phân tích dữ liệu được lưu trữ trên nhiều trang web.
- Hiểu cách thức hoạt động của các trang web và cách cấu trúc HTML của chúng.
- Xây dựng các spider để thu thập dữ liệu trên web một cách quy mô.
- Sử dụng Selenium để thu thập dữ liệu từ các trang web được điều khiển bởi AJAX.
Định dạng khóa học
- Bài giảng và thảo luận tương tác.
- Nhiều bài tập và thực hành.
- Thực hành trực tiếp trong môi trường lab thực tế.
Tùy chọn tùy chỉnh khóa học
- Khóa học này giả định kiến thức về lập trình.
- Để yêu cầu đào tạo tùy chỉnh cho khóa học này, vui lòng liên hệ với chúng tôi để sắp xếp.
Đề cương khóa học
Giới thiệu
Thiết lập Môi trường Phát triển
Python Bài tập cơ bản: Cấu trúc Dữ liệu, Điều kiện, Xử lý Tệp, v.v.
Python Các gói cho Web Scraping: Scrapy và BeautifulSoup
Cách một Website Hoạt động
Cách HTML được Cấu trúc
Thực hiện Yêu cầu Web
Scraping một Trang HTML
Làm việc với XPath và CSS
Lọc Dữ liệu Sử dụng Biểu thức Chính quy Express
Tạo Web Crawler
Thu thập dữ liệu (Crawling) các Trang AJAX và JavaScript với Selenium.
Các Thực hành Tốt nhất về Web Scraping
Khắc phục Sự cố
Tóm tắt và Kết luận
Requirements
- Programming kinh nghiệm, ưu tiên trong Python. Nếu người tham gia có kinh nghiệm lập trình bằng ngôn ngữ khác Python, khóa đào tạo có thể được mở rộng để bao gồm nhiều bài tập giới thiệu về Python hơn.
Đối tượng
- Các nhà phát triển
Open Training Courses require 5+ participants.
Web Scraping với Python Training Course - Booking
Web Scraping với Python Training Course - Enquiry
Web Scraping với Python - Consultancy Enquiry
Consultancy Enquiry
Testimonials (1)
Nhiều ví dụ và chủ đề khác nhau đã được涵盖从基本调查到登录管理和动态页面管理的内容。(请注意,此处的翻译似乎在最后部分混用了中文,根据指令要求应完全翻译成越南语,因此重新调整为完整越南语翻译)Nhiều ví dụ và chủ đề khác nhau đã được đề cập, từ việc điều tra cơ bản đến quản lý đăng nhập và quản lý trang động.
Daniele Tagliaferro - Creditsafe Italia Srl
Course - Web Scraping with Python
Machine Translated
Provisional Upcoming Courses (Require 5+ participants)
Related Courses
BDD với Python và Behave
7 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này bắt đầu với việc thảo luận về BDD và cách sử dụng framework Behave để thực hiện kiểm thử BDD cho các ứng dụng web. Người tham gia sẽ có nhiều cơ hội tương tác với giảng viên và đồng nghiệp trong khi triển khai các khái niệm và chiến thuật đã học trong môi trường phòng thí nghiệm thực hành, tập trung vào thực tế.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có kiến thức vững chắc về BDD và Behave, cũng như kinh nghiệm thực tế cần thiết để triển khai các kỹ thuật và công cụ này trong các tình huống kiểm thử thực tế.
Scaling Data Analysis with Python and Dask
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và kỹ sư phần mềm muốn sử dụng Dask với hệ sinh thái Python để xây dựng, mở rộng và phân tích các tập dữ liệu lớn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường để bắt đầu xây dựng xử lý dữ liệu lớn với Dask và Python.
- Khám phá các tính năng, thư viện, công cụ và API có sẵn trong Dask.
- Hiểu cách Dask tăng tốc tính toán song song trong Python.
- Tìm hiểu cách mở rộng hệ sinh thái Python (Numpy, SciPy và Pandas) bằng cách sử dụng Dask.
- Tối ưu hóa môi trường Dask để duy trì hiệu suất cao trong việc xử lý các tập dữ liệu lớn.
Data Analysis với Python, Pandas và Numpy
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển và nhà phân tích dữ liệu trình độ trung cấp, những người muốn nâng cao kỹ năng phân tích và thao tác dữ liệu bằng Pandas và NumPy.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển bao gồm Python, Pandas và NumPy.
- Tạo ứng dụng phân tích dữ liệu bằng Pandas và NumPy.
- Thực hiện các thao tác xử lý, sắp xếp và lọc dữ liệu nâng cao.
- Thực hiện các thao tác tổng hợp và phân tích dữ liệu chuỗi thời gian.
- Trực quan hóa dữ liệu bằng Matplotlib và các thư viện trực quan hóa khác.
- Gỡ lỗi và tối ưu hóa mã phân tích dữ liệu của họ.
Phát triển Full Stack FARM (FastAPI, React và MongoDB)
14 HoursKhóa đào tạo trực tiếp, trực tuyến hoặc tại chỗ này dành cho các nhà phát triển muốn sử dụng bộ công cụ FARM (FastAPI, React và MongoDB) để xây dựng các ứng dụng web động, hiệu suất cao và có khả năng mở rộng.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết tích hợp FastAPI, React và MongoDB.
- Hiểu các khái niệm, tính năng và lợi ích chính của bộ công cụ FARM.
- Tìm hiểu cách xây dựng REST API với FastAPI.
- Tìm hiểu cách thiết kế các ứng dụng tương tác với React.
- Phát triển, kiểm tra và triển khai các ứng dụng (front-end và back-end) bằng bộ công cụ FARM.
Phát triển API với Python và FastAPI
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển muốn sử dụng FastAPI với Python để xây dựng, kiểm tra và triển khai các API RESTful dễ dàng và nhanh chóng hơn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết để xây dựng API với Python và FastAPI.
- Tạo API nhanh chóng và dễ dàng hơn bằng thư viện FastAPI.
- Tìm hiểu cách tạo mô hình dữ liệu và lược đồ dựa trên Pydantic và OpenAPI.
- Kết nối API với cơ sở dữ liệu bằng SQLAlchemy.
- Triển khai bảo mật và xác thực trong API bằng các công cụ của FastAPI.
- Xây dựng hình ảnh container và triển khai API web lên máy chủ đám mây.
Machine Learning với Python – 2 Ngày
14 HoursMục tiêu của khóa học này là cung cấp khả năng cơ bản trong việc áp dụng các phương pháp Machine Learning vào thực tế. Thông qua việc sử dụng ngôn ngữ lập trình Python và các thư viện đa dạng của nó, dựa trên vô số ví dụ thực tế, khóa học này sẽ hướng dẫn cách sử dụng các khối xây dựng quan trọng nhất của Machine Learning, cách đưa ra quyết định mô hình hóa dữ liệu, diễn giải kết quả của các thuật toán và xác thực kết quả.
Mục tiêu của chúng tôi là trang bị cho bạn các kỹ năng để hiểu và sử dụng một cách tự tin các công cụ cơ bản nhất từ bộ công cụ Machine Learning, đồng thời tránh được những cạm bẫy phổ biến trong các ứng dụng Data Science.
Machine Learning với Python – 4 Ngày
28 HoursMục tiêu của khóa học này là cung cấp năng lực tổng quát trong việc áp dụng Machine Learning vào thực tế. Thông qua việc sử dụng ngôn ngữ lập trình Python và các thư viện đa dạng của nó, dựa trên vô số ví dụ thực tế, khóa học này sẽ hướng dẫn cách sử dụng các khối xây dựng quan trọng nhất của Machine Learning, cách đưa ra quyết định về mô hình hóa dữ liệu, diễn giải kết quả của các thuật toán và xác thực kết quả.
Mục tiêu của chúng tôi là trang bị cho bạn các kỹ năng để hiểu và sử dụng một cách tự tin các công cụ cơ bản nhất từ bộ công cụ Machine Learning và tránh những cạm bẫy phổ biến trong các ứng dụng Data Science.
Tăng tốc quy trình làm việc với Python Pandas Modin
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và nhà phát triển muốn sử dụng Modin để xây dựng và triển khai các phép tính song song với Pandas để phân tích dữ liệu nhanh hơn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường cần thiết để bắt đầu phát triển các quy trình làm việc Pandas quy mô lớn với Modin.
- Hiểu các tính năng, kiến trúc và lợi thế của Modin.
- Nắm vững sự khác biệt giữa Modin, Dask và Ray.
- Thực hiện các thao tác Pandas nhanh hơn với Modin.
- Triển khai toàn bộ API và các hàm Pandas.
Python cho Natural Language Generation (NLG)
21 HoursTrong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam, người tham gia sẽ học cách sử dụng Python để tạo ra văn bản ngôn ngữ tự nhiên chất lượng cao bằng cách xây dựng hệ thống NLG của riêng họ từ đầu. Các nghiên cứu điển hình cũng sẽ được xem xét và các khái niệm liên quan sẽ được áp dụng vào các dự án phòng thí nghiệm trực tiếp để tạo nội dung.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Sử dụng NLG để tự động tạo nội dung cho nhiều ngành khác nhau, từ báo chí, bất động sản, đến dự báo thời tiết và thể thao.
- Chọn lọc và sắp xếp nội dung nguồn, lập kế hoạch câu, và chuẩn bị một hệ thống để tự động tạo nội dung gốc.
- Hiểu rõ quy trình NLG và áp dụng các kỹ thuật phù hợp ở mỗi giai đoạn.
- Hiểu rõ kiến trúc của hệ thống Natural Language Generation (NLG).
- Triển khai các thuật toán và mô hình phù hợp nhất để phân tích và sắp xếp.
- Khai thác dữ liệu từ các nguồn dữ liệu công khai cũng như cơ sở dữ liệu được tuyển chọn để sử dụng làm tài liệu cho văn bản được tạo.
- Thay thế các quy trình viết thủ công và tốn công sức bằng quy trình tạo nội dung tự động, do máy tính tạo ra.
Unit Testing với Python
21 HoursTrong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam, người tham gia sẽ học cách sử dụng PyTest để viết các bài kiểm tra ngắn gọn, dễ bảo trì, thanh lịch, biểu cảm và dễ đọc.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Viết các bài kiểm tra dễ đọc và dễ bảo trì mà không cần mã boilerplate.
- Sử dụng mô hình fixture để viết các bài kiểm tra nhỏ.
- Mở rộng các bài kiểm tra lên thành kiểm thử chức năng phức tạp cho các ứng dụng, gói và thư viện.
- Hiểu và áp dụng các tính năng của PyTest như hooks, viết lại assert và plug-in.
- Giảm thời gian kiểm thử bằng cách chạy các bài kiểm tra song song và trên nhiều bộ xử lý.
- Chạy các bài kiểm tra trong môi trường tích hợp liên tục, cùng với các tiện ích khác như tox, mock, coverage, unittest, doctest và Selenium.
- Sử dụng Python để kiểm tra các ứng dụng không-Python.
Nâng cao Machine Learning với Python
21 HoursTrong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam, người tham gia sẽ học các kỹ thuật học máy tiên tiến và phù hợp nhất trong Python khi xây dựng một loạt các ứng dụng demo liên quan đến hình ảnh, âm nhạc, văn bản và dữ liệu tài chính.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Triển khai các thuật toán và kỹ thuật học máy để giải quyết các vấn đề phức tạp.
- Áp dụng học sâu và học bán giám sát vào các ứng dụng liên quan đến hình ảnh, âm nhạc, văn bản và dữ liệu tài chính.
- Tối ưu hóa hiệu suất của các thuật toán Python lên mức tối đa.
- Sử dụng các thư viện và gói như NumPy và Theano.
Python: Tự Động Hóa Những Việc Nhàm Chán
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam dựa trên cuốn sách nổi tiếng, "Tự động hóa những công việc nhàm chán với Python", của Al Sweigart. Khóa học này dành cho người mới bắt đầu và bao gồm các khái niệm lập trình Python thiết yếu thông qua các bài tập thực hành và thảo luận. Trọng tâm là học cách viết mã để tăng đáng kể năng suất văn phòng.
Khi kết thúc khóa đào tạo này, người tham gia sẽ biết cách lập trình bằng Python và áp dụng kỹ năng mới này cho:
- Tự động hóa các tác vụ bằng cách viết các chương trình Python đơn giản.
- Viết các chương trình có thể nhận diện các mẫu văn bản bằng "biểu thức chính quy".
- Tạo và cập nhật các bảng tính Excel một cách tự động.
- Phân tích cú pháp các tệp PDF và tài liệu Word.
- Thu thập dữ liệu từ các trang web và trích xuất thông tin từ các nguồn trực tuyến.
- Viết các chương trình gửi thông báo qua email.
- Sử dụng các công cụ gỡ lỗi của Python để nhanh chóng khắc phục lỗi.
- Điều khiển chuột và bàn phím một cách tự động để thực hiện các thao tác nhấp và nhập liệu.
Nâng cao Python - 4 Ngày
28 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển muốn học các kỹ thuật lập trình nâng cao Python, bao gồm cách áp dụng ngôn ngữ linh hoạt này để giải quyết các vấn đề trong các lĩnh vực như ứng dụng phân tán, phân tích và trực quan hóa dữ liệu, lập trình giao diện người dùng và viết script bảo trì.
Python Programming - 4 ngày
28 HoursKhóa học này được thiết kế dành cho những ai muốn học ngôn ngữ lập trình Python. Trọng tâm của khóa học là ngôn ngữ Python, các thư viện lõi, cũng như lựa chọn các thư viện tốt nhất và hữu ích nhất được phát triển bởi cộng đồng Python. Python thúc đẩy hoạt động kinh doanh và được các nhà khoa học trên toàn thế giới sử dụng – đây là một trong những ngôn ngữ lập trình phổ biến nhất.
Khóa học có thể được triển khai bằng phiên bản Python 3.x mới nhất với các bài tập thực hành tận dụng tối đa sức mạnh của nó. Khóa học này có thể được triển khai trên mọi hệ điều hành (tất cả các phiên bản UNIX, bao gồm Linux và Mac OS X, cũng như Microsoft Windows).
Các bài tập thực hành chiếm khoảng 70% thời lượng khóa học, và khoảng 30% còn lại dành cho các buổi trình diễn và thuyết trình. Các cuộc thảo luận và câu hỏi có thể được đặt ra trong suốt khóa học.
Lưu ý: chương trình đào tạo có thể được điều chỉnh theo nhu cầu cụ thể theo yêu cầu trước ngày diễn ra khóa học.
Test Automation với Selenium và Python
14 HoursTrong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam, người tham gia sẽ kết hợp sức mạnh của Python với Selenium để tự động hóa việc kiểm thử một ứng dụng web mẫu. Bằng cách kết hợp lý thuyết với thực hành trong môi trường phòng thí nghiệm trực tiếp, người tham gia sẽ có được kiến thức và kinh nghiệm cần thiết để tự động hóa các dự án kiểm thử web của riêng họ bằng cách sử dụng Python và Selenium.