Sàng lọc ảo (Virtual Screening)

by tudienkhoahoc
Sàng lọc ảo (Virtual Screening – VS) là một phương pháp tính toán được sử dụng rộng rãi trong quá trình khám phá thuốc để xác định các phân tử tiềm năng, thường là từ một thư viện lớn các hợp chất hóa học, có thể liên kết với một mục tiêu thuốc cụ thể, thường là một protein. Mục tiêu này có thể là một thụ thể, enzyme, hoặc một phân tử khác đóng vai trò quan trọng trong một con đường sinh hóa liên quan đến bệnh. VS hoạt động bằng cách sử dụng các chương trình máy tính để dự đoán ái lực liên kết hoặc hoạt tính sinh học của từng phân tử trong thư viện đối với mục tiêu.

Nguyên lý hoạt động

VS dựa trên nguyên lý “khóa và ổ khóa” trong tương tác thuốc-mục tiêu. Phương pháp này sử dụng các mô hình cấu trúc của mục tiêu và các hợp chất để dự đoán liệu chúng có khớp nhau về mặt vật lý và hóa học hay không. Việc khớp này được đánh giá dựa trên năng lượng liên kết, hình dạng phân tử, tính chất điện tích và các yếu tố quan trọng khác. Quá trình sàng lọc ảo bao gồm các bước chính sau:

  1. Xác định mục tiêu: Chọn protein hoặc phân tử mục tiêu có liên quan đến bệnh. Việc lựa chọn mục tiêu phù hợp là bước đầu tiên then chốt trong quy trình VS.
  2. Chuẩn bị mục tiêu: Tạo mô hình 3D của mục tiêu, thường dựa trên dữ liệu tinh thể học tia X hoặc NMR. Nếu không có cấu trúc thực nghiệm, có thể sử dụng các mô hình tương đồng (homology modeling) để xây dựng cấu trúc 3D. Bước này bao gồm việc tối ưu hóa cấu trúc, thêm các nguyên tử hydro và gán các tham số lực trường.
  3. Chuẩn bị thư viện hợp chất: Tạo cơ sở dữ liệu các phân tử nhỏ, có thể là các hợp chất đã biết hoặc các hợp chất được tạo ra. Các hợp chất này cần được tối ưu hóa về mặt cấu trúc và tính chất hóa học. Việc chuẩn bị thư viện bao gồm tạo ra các dạng 3D, tối ưu hóa hình học, tạo ra các đồng phân và tính toán các tính chất hóa học liên quan.
  4. Sàng lọc: Sử dụng các phần mềm và thuật toán để “neo đậu” (docking) từng phân tử trong thư viện vào vị trí liên kết của mục tiêu và tính toán điểm số tương tác. Có nhiều phương pháp docking khác nhau, từ docking cứng (rigid docking) đến docking linh hoạt (flexible docking).
  5. Xếp hạng: Sắp xếp các phân tử dựa trên điểm số tương tác, với điểm số cao hơn thường cho thấy ái lực liên kết mạnh hơn. Điểm số docking phản ánh năng lượng liên kết dự đoán giữa phân tử và mục tiêu.
  6. Xác nhận: Các hợp chất được xếp hạng cao sẽ được đánh giá thêm bằng các phương pháp thực nghiệm, như xét nghiệm sinh học in vitro và in vivo. Đây là bước quan trọng để kiểm chứng kết quả sàng lọc ảo và xác định các hợp chất tiềm năng cho phát triển thuốc.

Các loại sàng lọc ảo

Có hai loại sàng lọc ảo chính:

  1. Sàng lọc dựa trên cấu trúc (Structure-based virtual screening – SBVS): Sử dụng thông tin cấu trúc 3D của mục tiêu và ligand để dự đoán ái lực liên kết. Phương pháp này thường sử dụng các thuật toán “neo đậu” phân tử (molecular docking) để mô phỏng sự tương tác giữa ligand và mục tiêu, từ đó tính toán năng lượng liên kết và dự đoán ái lực. SBVS hiệu quả khi có cấu trúc 3D chất lượng cao của mục tiêu.
  2. Sàng lọc dựa trên ligand (Ligand-based virtual screening – LBVS): Dựa trên giả định rằng các phân tử có cấu trúc và tính chất hóa học tương tự sẽ có hoạt tính sinh học tương tự. LBVS sử dụng thông tin về các ligand đã biết của mục tiêu để xác định các phân tử mới có hoạt tính tương tự. Các phương pháp thường được sử dụng bao gồm phân tích tương quan định lượng cấu trúc-hoạt tính (QSAR – Quantitative Structure-Activity Relationship), được biểu diễn bằng công thức $activity = f(descriptors)$, trong đó activity là hoạt tính sinh học và descriptors là các thông số mô tả cấu trúc phân tử, và phương pháp tìm kiếm tương tự (similarity searching) dựa trên sự so sánh cấu trúc phân tử hoặc fingerprints hóa học. LBVS hữu ích khi chưa có cấu trúc 3D của mục tiêu.

Ưu điểm của sàng lọc ảo

  • Tiết kiệm thời gian và chi phí: VS giúp giảm số lượng hợp chất cần được kiểm tra thực nghiệm, từ đó giảm chi phí và thời gian nghiên cứu.
  • Khả năng sàng lọc thư viện lớn: VS có thể sàng lọc hàng triệu hợp chất trong thời gian ngắn, điều mà các phương pháp sàng lọc truyền thống khó thực hiện được.
  • Khám phá các không gian hóa học mới: VS có thể xác định các hợp chất mới với cấu trúc và hoạt tính khác biệt, mở ra cơ hội phát triển các loại thuốc mới.

Nhược điểm của sàng lọc ảo

  • Độ chính xác: Độ chính xác của dự đoán phụ thuộc vào chất lượng của mô hình mục tiêu và thuật toán được sử dụng. Các mô hình tính toán chưa hoàn hảo có thể dẫn đến kết quả không chính xác.
  • Âm tính giả và dương tính giả: VS có thể bỏ sót các hợp chất hoạt động (âm tính giả) hoặc xác định các hợp chất không hoạt động (dương tính giả). Việc xác nhận thực nghiệm là cần thiết để loại bỏ các kết quả sai lệch này.

Kết luận

Sàng lọc ảo là một công cụ mạnh mẽ trong quá trình khám phá thuốc, giúp tăng tốc độ và hiệu quả của việc xác định các hợp chất tiềm năng. Mặc dù không phải là một phương pháp hoàn hảo, VS đóng vai trò quan trọng trong việc thu hẹp không gian tìm kiếm và hướng dẫn các nghiên cứu thực nghiệm tiếp theo.

Các ứng dụng của sàng lọc ảo

Ngoài việc khám phá thuốc, VS còn được ứng dụng trong nhiều lĩnh vực khác, bao gồm:

  1. Thiết kế thuốc: Tối ưu hóa các hợp chất tiềm năng để cải thiện ái lực liên kết, độ chọn lọc và các tính chất dược động học. VS giúp thiết kế các phân tử có ái lực và độ chọn lọc cao hơn cho mục tiêu mong muốn.
  2. Phát triển thuốc trừ sâu: Xác định các hợp chất có hoạt tính diệt côn trùng hoặc các loài gây hại khác. VS có thể giúp tìm kiếm các hợp chất trừ sâu mới an toàn và hiệu quả hơn.
  3. Khoa học vật liệu: Tìm kiếm các vật liệu mới với các tính chất mong muốn. VS được sử dụng để dự đoán tính chất của vật liệu và thiết kế các vật liệu mới với các tính chất đặc biệt.
  4. Hóa học môi trường: Dự đoán độc tính và khả năng phân hủy sinh học của các hợp chất hóa học. VS giúp đánh giá tác động môi trường của các hợp chất hóa học và tìm kiếm các giải pháp xử lý ô nhiễm.

Các phần mềm và thuật toán thường được sử dụng

Một số phần mềm và thuật toán phổ biến được sử dụng trong VS bao gồm:

  1. Neo đậu phân tử (Molecular Docking): AutoDock, AutoDock Vina, GOLD, Glide. Các thuật toán này tìm kiếm các cấu hình liên kết tối ưu giữa ligand và mục tiêu và tính toán năng lượng liên kết hoặc điểm số tương tác. Ví dụ, điểm số tương tác có thể được tính toán dựa trên các thành phần như năng lượng van der Waals, năng lượng tĩnh điện, và năng lượng liên kết hydro.
  2. QSAR: Các phần mềm như CoMFA, CoMSIA, và các phương pháp học máy như hồi quy tuyến tính đa biến, mạng nơron nhân tạo. Các mô hình QSAR liên hệ cấu trúc phân tử với hoạt tính sinh học thông qua phương trình toán học, ví dụ: $activity = c_1 \cdot descriptor_1 + c_2 \cdot descriptor_2 + … + c_n \cdot descriptor_n$, trong đó $c_i$ là các hệ số hồi quy.
  3. Tìm kiếm tương tự (Similarity Searching): Các fingerprints phân tử và các phương pháp đo lường độ tương tự như Tanimoto coefficient.

Xu hướng phát triển

VS đang liên tục phát triển với sự tiến bộ của công nghệ tính toán và các thuật toán mới. Một số xu hướng đáng chú ý bao gồm:

  1. Sử dụng trí tuệ nhân tạo (AI) và học máy (Machine Learning): Các mô hình AI và học máy được sử dụng để cải thiện độ chính xác của dự đoán và khám phá không gian hóa học hiệu quả hơn.
  2. Sàng lọc ảo động (Dynamic Virtual Screening): Xem xét tính linh hoạt của protein mục tiêu trong quá trình sàng lọc.
  3. Sàng lọc ảo dựa trên fragment (Fragment-based Virtual Screening): Sàng lọc các mảnh phân tử nhỏ và sau đó kết hợp chúng để tạo ra các hợp chất tiềm năng.

Tóm tắt về Sàng lọc ảo

Sàng lọc ảo (VS) là một công cụ tính toán mạnh mẽ được sử dụng trong khám phá thuốc và nhiều lĩnh vực khác. VS cho phép sàng lọc nhanh chóng và hiệu quả hàng triệu hợp chất, giúp tiết kiệm thời gian và chi phí so với các phương pháp sàng lọc truyền thống. Nguyên lý cốt lõi của VS là dự đoán ái lực liên kết hoặc hoạt tính sinh học của các phân tử đối với một mục tiêu cụ thể, thường là một protein, bằng cách sử dụng các mô hình tính toán.

Có hai loại VS chính: sàng lọc dựa trên cấu trúc (SBVS) và sàng lọc dựa trên ligand (LBVS). SBVS sử dụng thông tin cấu trúc 3D của mục tiêu, trong khi LBVS dựa trên sự tương đồng giữa các ligand đã biết và các phân tử mới. Cả hai phương pháp đều có ưu và nhược điểm riêng. Ví dụ, SBVS có thể dự đoán chính xác ái lực liên kết nhưng yêu cầu cấu trúc 3D của mục tiêu, trong khi LBVS không cần cấu trúc mục tiêu nhưng độ chính xác có thể thấp hơn.

Việc lựa chọn phần mềm và thuật toán phù hợp là rất quan trọng để đạt được kết quả tốt nhất trong VS. Các chương trình neo đậu phân tử như AutoDock Vina và GOLD thường được sử dụng trong SBVS, trong khi các phương pháp QSAR và tìm kiếm tương tự được sử dụng trong LBVS. Cần lưu ý rằng VS chỉ là bước đầu tiên trong quá trình khám phá và phát triển thuốc. Các hợp chất tiềm năng được xác định bởi VS cần được xác nhận thêm bằng các thí nghiệm in vitro và in vivo.

Sự phát triển của AI và học máy đang mở ra những hướng đi mới cho VS, hứa hẹn cải thiện độ chính xác và hiệu quả của phương pháp này. Tuy nhiên, VS vẫn còn những hạn chế nhất định, chẳng hạn như khả năng dự đoán sai và phụ thuộc vào chất lượng của dữ liệu đầu vào. Việc hiểu rõ nguyên lý, ưu điểm và hạn chế của VS là điều cần thiết để áp dụng phương pháp này một cách hiệu quả.


Tài liệu tham khảo:

  • Lionta, E., Spyrou, G., Vassilatis, D. K., & Cournia, Z. (2014). Structure-based virtual screening for drug discovery: principles, applications and recent advances. Current topics in medicinal chemistry, 14(16), 1923-1938.
  • Sliwoski, G., Kothiwale, S., Meiler, J., & Lowe Jr, E. W. (2014). Computational methods in drug discovery. Pharmacological reviews, 66(1), 334-395.
  • Shoichet, B. K. (2004). Virtual screening of chemical libraries. Nature, 432(7019), 862-865.

Câu hỏi và Giải đáp

Làm thế nào để đánh giá chất lượng của một mô hình mục tiêu được sử dụng trong SBVS?

Trả lời: Chất lượng của mô hình mục tiêu ảnh hưởng trực tiếp đến độ chính xác của SBVS. Cần đánh giá mô hình dựa trên độ phân giải của cấu trúc, giá trị R-factor, và sự hiện diện của các vùng linh động. Các kỹ thuật như phân tích động lực phân tử (Molecular Dynamics – MD) có thể được sử dụng để khảo sát tính linh hoạt của protein và cải thiện độ chính xác của mô hình.

Sự khác biệt chính giữa các phương pháp chấm điểm (scoring functions) trong neo đậu phân tử là gì và làm thế nào để lựa chọn phương pháp chấm điểm phù hợp?

Trả lời: Các phương pháp chấm điểm khác nhau sử dụng các thuật toán và tham số khác nhau để tính toán ái lực liên kết. Một số phương pháp dựa trên lực trường (force field based), trong khi một số khác sử dụng phương pháp kinh nghiệm (empirical) hoặc dựa trên kiến thức (knowledge-based). Việc lựa chọn phương pháp chấm điểm phụ thuộc vào hệ thống protein-ligand cụ thể và mục tiêu của nghiên cứu. Thường thì cần thử nghiệm nhiều phương pháp chấm điểm khác nhau để tìm ra phương pháp phù hợp nhất.

Khi nào nên sử dụng LBVS thay vì SBVS?

Trả lời: LBVS là lựa chọn tốt khi không có cấu trúc 3D của mục tiêu hoặc khi mục tiêu có tính linh hoạt cao. LBVS cũng hữu ích khi cần sàng lọc nhanh chóng một thư viện hợp chất rất lớn. Tuy nhiên, LBVS phụ thuộc vào sự sẵn có của các ligand đã biết và độ chính xác có thể thấp hơn SBVS.

Làm thế nào để giảm thiểu số lượng âm tính giả và dương tính giả trong VS?

Trả lời: Có thể giảm thiểu âm tính giả và dương tính giả bằng cách sử dụng nhiều phương pháp sàng lọc khác nhau, kết hợp SBVS và LBVS, sử dụng các phương pháp chấm điểm đa dạng, và áp dụng các bộ lọc (filters) dựa trên các tính chất dược động học và dược lực học. Xác thực kết quả VS bằng các thí nghiệm thực nghiệm cũng rất quan trọng.

Vai trò của học máy trong việc cải thiện VS là gì?

Trả lời: Học máy có thể được sử dụng để phát triển các mô hình dự đoán chính xác hơn cho ái lực liên kết và hoạt tính sinh học. Các thuật toán học máy có thể học từ dữ liệu lớn và xác định các mẫu khó nhận biết bằng các phương pháp truyền thống. Học máy cũng có thể được sử dụng để tối ưu hóa các tham số của các thuật toán VS hiện có và phát triển các chiến lược sàng lọc mới.

Một số điều thú vị về Sàng lọc ảo

  • Sàng lọc ảo đã góp phần vào việc phát triển nhiều loại thuốc hiện đang được sử dụng: Một số loại thuốc điều trị HIV, ung thư và bệnh Alzheimer đã được phát hiện hoặc tối ưu hóa nhờ VS. Điều này chứng tỏ tiềm năng thực tiễn của phương pháp này trong việc cải thiện sức khỏe con người.
  • Thư viện ZINC là một trong những thư viện hợp chất lớn nhất được sử dụng trong VS: Chứa hàng triệu hợp chất có sẵn để sàng lọc, cung cấp nguồn tài nguyên phong phú cho các nhà nghiên cứu khám phá không gian hóa học rộng lớn. Bạn có thể tưởng tượng việc sàng lọc thủ công số lượng hợp chất khổng lồ này sẽ mất bao lâu?
  • “Neo đậu ngược (Inverse docking)” là một biến thể thú vị của VS: Thay vì tìm kiếm ligand cho một mục tiêu, neo đậu ngược sử dụng một ligand để xác định các mục tiêu tiềm năng trong proteome. Kỹ thuật này hữu ích trong việc tìm hiểu cơ chế tác dụng của thuốc và xác định các mục tiêu mới cho một loại bệnh cụ thể.
  • VS có thể được sử dụng để “tái định vị thuốc (drug repurposing)”: Xác định các ứng dụng mới cho các loại thuốc hiện có. Điều này có thể rút ngắn đáng kể thời gian và chi phí cần thiết để đưa một loại thuốc ra thị trường, vì các loại thuốc được tái định vị đã trải qua các thử nghiệm an toàn.
  • Các dự án khoa học công dân như Foldit đã kết hợp VS với trò chơi hóa (gamification): Người chơi Foldit có thể đóng góp vào nghiên cứu khoa học bằng cách dự đoán cấu trúc protein và thiết kế các phân tử mới. Điều này cho thấy VS không chỉ giới hạn trong các phòng thí nghiệm chuyên nghiệp mà còn có thể tiếp cận được với cộng đồng rộng lớn hơn.
  • VS không chỉ giới hạn ở các phân tử nhỏ: Nó cũng có thể được áp dụng cho các phân tử sinh học lớn hơn như peptide và kháng thể, mở rộng ứng dụng của phương pháp này trong việc phát triển các liệu pháp sinh học.

Nội dung được thẩm định bởi Công ty Cổ phần KH&CN Trí Tuệ Việt

P.5-8, Tầng 12, Tòa nhà Copac Square, 12 Tôn Đản, Quận 4, TP HCM.

PN: (+84).081.746.9527
[email protected]

Ban biên tập: 
GS.TS. Nguyễn Lương Vũ
GS.TS. Nguyễn Minh Phước
GS.TS. Hà Anh Thông
GS.TS. Nguyễn Trung Vĩnh

PGS.TS. Lê Đình An

PGS.TS. Hồ Bảo Quốc
PGS.TS. Lê Hoàng Trúc Duy
PGS.TS. Nguyễn Chu Gia
PGS.TS. Lương Minh Cang
TS. Nguyễn Văn Hồ
TS. Phạm Kiều Trinh

TS. Ngô Văn Bản
TS. Kiều Hà Minh Nhật
TS. Chu Phước An
ThS. Nguyễn Đình Kiên

CN. Lê Hoàng Việt
CN. Phạm Hạnh Nhi

Bản quyền thuộc về Công ty cổ phần Trí Tuệ Việt