Mùa hè năm 2022, một trong những AI thuộc công ty con của Google đã xác định cấu trúc 3D của gần như tất cả các protein mà nhân loại biết đến.
Sau hơn một thập kỷ bối rối về những hình ảnh mờ ảo, một bước đột phá về trí tuệ nhân tạo (AI) đã mang lại cho Matthew Higgins, giáo sư Đại học Oxford lời giải về vấn đề gây đau đầu kinh điển với các nhà khoa học: Protein trông như thế nào.
Trước đây, những kỹ thuật truyền thống chỉ tạo ra những bóng mờ mơ hồ về hình dạng của protein. Tuy nhiên, nhờ một công nghệ AI mới có tên gọi là AlphaFold2, Higgins đã tìm ra hình dạng thật sự của một loại protein quan trọng được sử dụng bởi ký sinh trùng gây bệnh sốt rét, kẻ thù mà phòng thí nghiệm của ông đã chiến đấu từ giữa những năm 2000.
Nhờ phần mềm AI mang tên AlphaFold2, việc dự đoán hình dạng và cấu trúc của protein có thể hoàn tất chỉ trong vài giây với độ chính xác cao. Ảnh: DeepMind.
AlphaFold2 chính phiên bản cải tiến từ công cụ AlphaFold của DeepMind, phần mềm đã đạt được thành tựu khoa học lớn nhất của AI cho đến nay, khi dự đoán cấu trúc của hầu hết mọi loại protein mà khoa học biết đến, một số trong đó rất cần thiết để hiểu các căn bệnh nguy hiểm như Alzheimer và Parkinson.
Bài toán hóc búa nửa thế kỷ
Bước đột phá từ AlphaFold2 đã giúp Higgins phát triển một loại vắc xin sốt rét thế hệ mới đang được thử nghiệm trên con người.
Trong một dự án nghiên cứu mới đây, Higgins cũng sử dụng AlphaFold2 để phác thảo hình dạng của một loại protein sốt rét khác, từ đó phát triển vắc xin thử nghiệm bản thứ hai, dự kiến sẽ bắt đầu nghiên cứu trên người vào cuối năm nay.
Vắc xin này có thể sẽ là một bước tiến quan trọng chống lại căn bệnh sốt rét đã khiến hơn 600.000 người tử vong mỗi năm, chủ yếu là trẻ nhỏ.
Những thành tựu của Higgins cho thấy AlphaFold2, một công nghệ dự đoán hình dạng protein, đang thúc đẩy ngành khoa học và y học nhanh như thế nào.
DeepMind tuyên bố khoảng 98,5% bộ protein của con người đã được mô hình hóa. Ảnh: New Scientist.
Chỉ trong một vài năm ngắn ngủi, DeepMind, công ty con của Google và là một trong những phòng thí nghiệm trí tuệ nhân tạo hàng đầu thế giới, đã đưa phần mềm AlphaFold đi từ vị trí thống trị các trò chơi cờ đến giải quyết một trong những thách thức lớn nhất của giới sinh học.
Theo Insider, phần mềm này hiện được sử dụng bởi hơn 1 triệu nhà nghiên cứu, bao gồm cả những người nghiên cứu ở trường đại học cho đến chuyên gia của các tập đoàn dược lớn.
AlphaFold được xem là bước đột phá trong lĩnh vực sinh học. Việc dự đoán cấu trúc protein có thể giúp các nhà khoa học tìm hiểu cơ chế gây bệnh, dự đoán mức hiệu quả của các loại thuốc và vai trò của protein trong cơ thể. Những vấn đề toàn cầu như nghiên cứu enzyme phân hủy nhựa cũng gắn liền với protein.
Trước khi AlphaFold ra đời, việc tìm ra hình dạng của protein là một nhiệm vụ cực kỳ khó khăn. Phần khó nhất chính là tìm ra những cấu trúc vật lý của protein. Thông thường, các nhà khoa học sẽ sử dụng tia X hoặc kính hiển vi điện tử (Cryo-EM) để khảo sát hình dạng của protein.
Tuy nhiên, những cách này rất phức tạp và mất thời gian, thậm chí lên đến vài tháng. Theo tiến sĩ Higgins, sinh viên có thể phải mất đến một hoặc hai năm mới có thể tạo ra một cấu trúc mới và thông thường, kết quả rất mờ nhạt và không thuyết phục.
Đến năm 2016, Demis Hassabis, nhà sáng lập kiêm CEO DeepMind chuyển sự chú ý của mình sang lĩnh vực protein sau khi phần mềm AI của DeepMind được công chúng biết đến rộng rãi với thành tích đánh bại một kỳ thủ đẳng cấp thế giới của môn cờ vây, một trò chơi cờ nổi tiếng của Trung Quốc.
Từng là một người chơi cờ vua giỏi và đi đầu về việc phổ biến AI, Hassabis đã bắt đầu thành lập DeepMind vào năm 2010 với mục tiêu xây dựng các hệ thống AI có thể thực hiện một số nhiệm vụ nhất định như con người hoặc thậm chí là tốt hơn.
Sau chiến thắng ở môn cờ vây, Hassabis và David Silver, một nhà khoa học hàng đầu tại DeepMind, quyết định đã đến lúc chuyển từ trò chơi sang các vấn đề trong thế giới thực.
Trong suốt 50 năm, các nhà khoa học đã tìm kiếm phương pháp dự đoán cấu trúc protein một cách nhanh chóng. Năm 2019, AlphaFold của DeepMind trình làng, tạo nên bước đột phá, vượt qua mọi hệ thống khác trên thế giới.
Các mô hình protein 3D được tạo ra bởi AlphaFold. Ảnh: DeepMind.
Với AlphaFold, việc dự đoán hình dạng và cấu trúc của protein có thể hoàn tất chỉ trong vài giây với độ chính xác cao.
AlphaFold sau đó được DeepMind đưa đi tham gia cuộc thi CASP (Critical Assessment of Protein Structure Prediction). Cùng với những phần mềm khác, AlphaFold được cung cấp trình tự axit amin cho 100 protein để dự đoán cấu trúc của chúng. Bài giải sẽ được đối chiếu với kết quả nghiên cứu trong phòng thí nghiệm.
Không chỉ vượt trội hơn đối thủ, tỷ lệ chính xác của AlphaFold còn tương đương các phương pháp được dùng trong phòng thí nghiệm.
Tại CASP14 tổ chức hồi tháng 11/2020, AlphaFold đạt điểm trung bình 92,5/100. Các dự đoán có biên độ sai trung bình khoảng 1,6 angstrom, có thể so sánh với chiều rộng của một nguyên tử hoặc 0,1 nm.
AI phát triển bùng nổ
Trong những tháng sau CASP, DeepMind tiếp phát triển rất nhanh AlphaFold. Đến cuối năm 2020, phần mềm AI này đã có thể dự đoán toàn bộ 20.000 protein trong cơ thể con người.
Những kết quả đó đã được công bố vào tháng 7/2021, đi kèm cùng với mã nguồn của phần mềm, trong một bài báo nổi tiếng trên tạp chí Nature và được trích dẫn hơn 8.800 lần, tức khoảng 15 lần một ngày.
Hassabis sau đó cho biết quyết định phát hành miễn phí AlphaFold2 để tối đa hóa lợi ích của nó cho nhân loại. Nhà sáng lập này tiếp tục thành lập thêm một startup công nghệ sinh học Isomorphic Labs vào năm 2021 để đi sâu vào nghiên cứu thuốc.
Trong khi đó, phiên bản mới có tên AlphaFold2 tiếp tục phát triển và cho đến mùa hè năm 2022 đã xuất bản 200 triệu dự đoán cấu trúc protein.
Tốc độ phổ biến của AlphaFold2 cũng phát triển với tốc độ chóng mặt. Theo PubMed, chỉ có 4 bài báo đề cập đến AlphaFold vào năm 2020.
Một cấu trúc protein do AlphaFold dự đoán. Ảnh: DeepMind.
Con số này đã tăng lên 92 bài báo vào năm 2021 và đạt con số khủng với 546 bài báo vào năm 2022. Hiện năm 2023 đang trên đà phát triển và dự kiến sẽ đạt cột mốc 1.000 bài báo đề cập đến AlphaFold2.
Một số công nghệ sinh học hiện sử dụng AlphaFold2 để phát triển thuốc. Trong số này, đã có một số công ty muốn mở rộng ý tưởng sang các lĩnh vực sinh học mới.
Trong khi đó, một số công ty công nghệ sinh học khác lại đang sử dụng AlphaFold kết hợp với một số công nghệ AI khác để xác định những loại thuốc mới tiềm năng một cách nhanh chóng mà không tốn kém.
Tiêu biểu là startup có tên Insilico Medicine đã sử dụng hệ thống AI của riêng mình cùng với AlphaFold để thiết kế các phân tử có thể ngăn chặn một loại protein liên quan đến ung thư gan.
Theo CEO Alex Zhavoronkov nói với Insider, nhóm của ông chỉ mất khoảng 50 ngày và chưa đến 100.000 USD để đi từ việc tìm ra loại thuốc mục tiêu cho đến khâu thiết kế và thử trong phòng thí nghiệm. Zhavoronkov rằng đây là tốc độ kỷ lục trong quá trình phát triển thuốc.