Liên hệ với chúng tôi

Đề cương khóa học

Giới thiệu về AlphaFold & Tác động của nó đối với Nghiên cứu Sinh học

  • Quá trình tiến hóa của việc dự đoán cấu trúc protein: từ mô hình hóa đồng đẳng đến các bước đột phá của học sâu.
  • Vai trò của AlphaFold trong việc đẩy nhanh nghiên cứu sinh học cấu trúc, phát hiện thuốc và chú thích chức năng.
  • Quản lý kỳ vọng: khả năng, hạn chế và các điểm tích hợp vào thực nghiệm.
  • Bài tập thực hành: Khám phá giao diện Cơ sở dữ liệu Cấu trúc Protein AlphaFold (AFDB) và thực hiện tìm kiếm trình tự ban đầu.

AlphaFold Hoạt động như Thế nào? Kiến trúc & Các Thành phần Cốt lõi

  • Kiến trúc mạng nơ-ron: Evoformer, mô-đun cấu trúc và mô hình hóa trình tự dựa trên cơ chế chú ý.
  • Xây dựng Trắc nghiệm Đa trình tự (MSA) và khớp mẫu (PDB, UniRef, BFD).
  • Giải thích các chỉ số tin cậy: pLDDT (độ tin cậy trên mỗi phân đoạn axit amin) và PAE (sai số căn chỉnh dự đoán).
  • Bài tập thực hành: Lập bản đồ các giai đoạn quy trình làm việc của AlphaFold bằng một chuỗi protein mẫu và theo dõi các đầu vào MSA/mẫu.

Truy cập AlphaFold: Nền tảng, Sổ tay Notebook & Triển khai

  • Tùy chọn triển khai chính thức: AlphaFold DB, API công khai, sổ tay notebook Colab và môi trường cục bộ/GPU.
  • Cài đặt môi trường Colab có thể tái lập: cài đặt phụ thuộc, phân bổ GPU và định dạng đầu vào.
  • Chuẩn bị chuỗi protein: cấu trúc FASTA, xử lý chuỗi (chain) và các cân nhắc về đa miền.
  • Phòng lab thực hành: Triển khai sổ tay notebook Colab chính thức của AlphaFold, tải lên một file FASTA tùy chỉnh và khởi chạy lần dự đoán đầu tiên.

Cơ sở Dữ liệu Cấu trúc Protein AlphaFold & Nguồn Tài nguyên Công khai

  • Điều hướng AFDB: phạm vi sinh vật, chất lượng cấu trúc, định dạng tải xuống (PDB/mmCIF, các file không được tinh chỉnh/pLDDt).
  • Liên kết chéo AFDB với UniProt, PDB và các cơ sở dữ liệu chức năng (GO, KEGG, CATH).
  • Quản lý bộ dữ liệu quy mô lớn: giới hạn dự đoán theo lô, hướng dẫn trích dẫn và giấy phép dữ liệu.
  • Bài tập thực hành: Trích xuất các mô hình AFDB có độ tin cậy cao cho một con đường chuyển hóa mục tiêu và chuẩn bị các tệp để phân tích sâu hơn.

Diễn giải Dự đoán của AlphaFold & Các Chỉ số Tin cậy

  • Đọc biểu đồ nhiệt pLDDT: xác định lõi có cấu trúc, vùng vô trật tự và các miền có độ tin cậy thấp.
  • Giải mã ma trận PAE: phát hiện ranh giới miền, tương tác nội mạch/liên mạch và các khu vực có nguy cơ gấp sai.
  • Khi nào dự đoán đáng tin cậy: độ phủ trình tự, chiều sâu tiến hóa và các đồng đẳng cấu trúc đã biết.
  • Bài tập thực hành: Đánh giá đầu ra pLDDT/PAE cho một protein đa miền, đánh dấu các vùng có độ tin cậy thấp và lên kế hoạch cho các mục tiêu đột biến/kiểm chứng.

Mã nguồn Mở của AlphaFold & Các Hướng Tùy chỉnh

  • Cấu trúc kho mã: các mô-đun cốt lõi, đường ống dữ liệu và các tệp cấu hình.
  • Sửa đổi đầu vào: MSA tùy chỉnh, ghi đè mẫu và điều chỉnh ngưỡng tin cậy.
  • Tối ưu hóa hiệu suất: giảm thời gian chạy, quản lý bộ nhớ và lưu điểm kiểm tra (checkpoint).
  • Phòng lab thực hành: Chạy đường ống AlphaFold đã sửa đổi trong Colab với ràng buộc mẫu tùy chỉnh và xuất các file PDB đã tinh chỉnh.

Các Trường hợp Sử dụng AlphaFold trong Nghiên cứu Sinh học & Tích hợp Thực nghiệm

  • Hướng dẫn đột biến, tinh thể hóa và lập kế hoạch lưới kính hiển vi điện tử lạnh (cryo-EM) bằng cách sử dụng các mô hình dự đoán.
  • Chú thích chức năng: lập bản đồ vị trí hoạt động, chuẩn bị gắn kết phối tử và dự đoán giao diện tương tác.
  • Hạn chế & xác minh: khi nào nên tin tưởng vào dự đoán, khi nào cần kiểm chứng thực nghiệm và những sai lầm phổ biến.
  • Hội thảo: Thiết kế quy trình kiểm chứng thực nghiệm cho một cấu trúc dự đoán và ánh xạ kết quả AI sang các xét nghiệm phòng thí nghiệm (wet-lab).

Tóm tắt, Ứng dụng Cúp & Các Bước Tiếp theo

  • Củng cố các khái niệm chính: kiến trúc, cách diễn giải và triển khai thực tế.
  • Dự án Cúp: Học viên chọn một protein quan tâm, chạy/lấy dự đoán, diễn giải các chỉ số tin cậy và phác thảo kế hoạch ứng dụng nghiên cứu.
  • Hỏi đáp mở, xử lý các lỗi thường gặp và phân phối tài nguyên.
  • Các bước tiếp theo: tích hợp AlphaFold3 nâng cao, RoseTTAFold, trRosetta và các công cụ cộng đồng đang phát triển.

Yêu cầu

  • Có nền tảng và hiểu biết về cấu trúc protein.
  • Nên có kiến thức cơ bản về các khái niệm sinh học phân tử (chuỗi axit amin, nguyên lý gấp cuộn, định dạng PDB/mmCIF).
  • Thoải mái khi điều hướng các sổ tay notebook dựa trên web và thực thi các ô code trong trình duyệt.

Đối tượng tham dự

  • Các nhà sinh học, nhà nghiên cứu phân tử và các nhà điều tra sinh học cấu trúc.
  • Các nhà khoa học thực nghiệm tìm kiếm các dự đoán cấu trúc tính toán để hướng dẫn quy trình phòng thí nghiệm (wet-lab).
  • Chuyên gia khoa học đời sống tích hợp mô hình hóa dựa trên AI vào quá trình tạo giả thuyết và thiết kế thực nghiệm.
 7 Giờ

Số người tham gia


Giá cho mỗi học viên

Các khóa học sắp tới

Các danh mục liên quan