biểu ngữ trang

tin tức

Giải thưởng Nghiên cứu Y học cơ bản Lasker năm nay được trao cho Demis Hassabis và John Jumper vì những đóng góp của họ trong việc tạo ra hệ thống trí tuệ nhân tạo AlphaFold có khả năng dự đoán cấu trúc ba chiều của protein dựa trên trình tự axit amin bậc nhất.

 

Kết quả của họ giải quyết một vấn đề đã làm đau đầu cộng đồng khoa học từ lâu và mở ra cánh cửa thúc đẩy nghiên cứu trên toàn lĩnh vực y sinh. Protein đóng vai trò then chốt trong sự phát triển của bệnh: trong bệnh Alzheimer, chúng gấp lại và kết tụ lại với nhau; trong ung thư, chức năng điều hòa của chúng bị mất; trong các rối loạn chuyển hóa bẩm sinh, chúng bị rối loạn chức năng; trong xơ nang, chúng xâm nhập vào không gian sai trong tế bào. Đây chỉ là một vài trong số rất nhiều cơ chế gây bệnh. Các mô hình cấu trúc protein chi tiết có thể cung cấp cấu hình nguyên tử, thúc đẩy việc thiết kế hoặc lựa chọn các phân tử có ái lực cao và đẩy nhanh quá trình khám phá thuốc.

 

Cấu trúc protein thường được xác định bằng phương pháp tinh thể học tia X, cộng hưởng từ hạt nhân và kính hiển vi điện tử lạnh. Các phương pháp này tốn kém và mất thời gian. Điều này dẫn đến cơ sở dữ liệu cấu trúc protein 3D hiện có chỉ với khoảng 200.000 dữ liệu cấu trúc, trong khi công nghệ giải trình tự DNA đã tạo ra hơn 8 triệu trình tự protein. Vào những năm 1960, Anfinsen và cộng sự đã phát hiện ra rằng trình tự axit amin 1D có thể tự động và lặp lại gấp lại thành một cấu hình ba chiều chức năng (Hình 1A) và các "chaperone" phân tử có thể tăng tốc và tạo điều kiện cho quá trình này. Những quan sát này dẫn đến một thách thức kéo dài 60 năm trong sinh học phân tử: dự đoán cấu trúc 3D của protein từ trình tự axit amin 1D. Với sự thành công của Dự án bộ gen người, khả năng thu được trình tự axit amin 1D của chúng ta đã được cải thiện đáng kể và thách thức này càng trở nên cấp bách hơn.

Cấu trúc protein ST6GAL1

Việc dự đoán cấu trúc protein gặp khó khăn vì nhiều lý do. Thứ nhất, tất cả các vị trí ba chiều có thể có của mọi nguyên tử trong mỗi axit amin đều đòi hỏi rất nhiều khám phá. Thứ hai, protein tận dụng tối đa tính bổ sung trong cấu trúc hóa học của chúng để định hình các nguyên tử một cách hiệu quả. Vì protein thường có hàng trăm "chất cho" liên kết hydro (thường là oxy) nằm gần "chất nhận" liên kết hydro (thường là nitơ liên kết với hydro), nên việc tìm ra các cấu hình mà gần như mọi chất cho đều nằm gần chất nhận có thể rất khó khăn. Thứ ba, có rất ít ví dụ để huấn luyện các phương pháp thực nghiệm, vì vậy cần phải hiểu các tương tác ba chiều tiềm năng giữa các axit amin trên cơ sở trình tự 1D bằng cách sử dụng thông tin về sự tiến hóa của các protein liên quan.

 

Vật lý lần đầu tiên được sử dụng để mô hình hóa sự tương tác của các nguyên tử trong quá trình tìm kiếm cấu hình tốt nhất và một phương pháp đã được phát triển để dự đoán cấu trúc của protein. Karplus, Levitt và Warshel đã được trao giải Nobel Hóa học năm 2013 cho công trình mô phỏng tính toán protein của họ. Tuy nhiên, các phương pháp dựa trên vật lý rất tốn kém về mặt tính toán và yêu cầu xử lý gần đúng, do đó không thể dự đoán được cấu trúc ba chiều chính xác. Một cách tiếp cận "dựa trên kiến ​​thức" khác là sử dụng cơ sở dữ liệu về các cấu trúc và trình tự đã biết để đào tạo các mô hình thông qua trí tuệ nhân tạo và học máy (AI-ML). Hassabis và Jumper áp dụng các yếu tố của cả vật lý và AI-ML, nhưng sự đổi mới và bước nhảy vọt về hiệu suất của cách tiếp cận này chủ yếu bắt nguồn từ AI-ML. Hai nhà nghiên cứu đã kết hợp một cách sáng tạo các cơ sở dữ liệu công cộng lớn với các tài nguyên điện toán cấp công nghiệp để tạo ra AlphaFold.

 

Làm sao chúng ta biết họ đã "giải quyết" được câu đố dự đoán cấu trúc? Năm 1994, cuộc thi Đánh giá quan trọng về Dự đoán cấu trúc (CASP) được thành lập, họp hai năm một lần để theo dõi tiến trình dự đoán cấu trúc. Các nhà nghiên cứu sẽ chia sẻ trình tự 1D của protein mà cấu trúc của nó gần đây đã được giải quyết nhưng kết quả vẫn chưa được công bố. Người dự đoán dự đoán cấu trúc ba chiều bằng trình tự 1D này và người đánh giá độc lập đánh giá chất lượng của kết quả dự đoán bằng cách so sánh chúng với cấu trúc ba chiều do nhà thực nghiệm cung cấp (chỉ cung cấp cho người đánh giá). CASP tiến hành đánh giá mù thực sự và ghi lại các bước nhảy hiệu suất định kỳ liên quan đến đổi mới phương pháp luận. Tại Hội nghị CASP lần thứ 14 năm 2020, kết quả dự đoán của AlphaFold cho thấy một bước nhảy vọt về hiệu suất đến mức ban tổ chức đã thông báo rằng vấn đề dự đoán cấu trúc 3D đã được giải quyết: độ chính xác của hầu hết các dự đoán đều gần bằng độ chính xác của các phép đo thực nghiệm.

 

Ý nghĩa rộng hơn là công trình của Hassabis và Jumper đã chứng minh một cách thuyết phục cách AI-ML có thể chuyển đổi khoa học. Nghiên cứu của họ cho thấy AI-ML có thể xây dựng các giả thuyết khoa học phức tạp từ nhiều nguồn dữ liệu, rằng các cơ chế chú ý (tương tự như trong ChatGPT) có thể khám phá các mối phụ thuộc và tương quan quan trọng trong các nguồn dữ liệu, và AI-ML có thể tự đánh giá chất lượng kết quả đầu ra. Về cơ bản, AI-ML đang thực hiện khoa học.


Thời gian đăng: 23-09-2023