Những gì Netflix có thể dạy chúng ta về điều trị ung thư

Hai năm trước, cựu Tổng thống Barack Obama tuyên bố Sáng kiến ​​y học chính xác trong Địa chỉ Liên bang của mình. Sáng kiến ​​này mong muốn một kỷ nguyên y học mới của người Hồi giáo, nơi các phương pháp điều trị bệnh có thể được điều chỉnh cụ thể theo mã di truyền của mỗi bệnh nhân. Conversation

Điều này cộng hưởng âm thanh trong y học ung thư. Bệnh nhân đã có thể kiểm soát bệnh ung thư bằng các liệu pháp nhắm vào các gen cụ thể bị thay đổi trong khối u cụ thể của họ. Ví dụ, phụ nữ mắc một loại ung thư vú do sự khuếch đại gen HER2 thường được điều trị bằng một liệu pháp gọi là herceptin. Bởi vì các phương pháp điều trị nhắm mục tiêu này là đặc trưng cho các tế bào ung thư, chúng có xu hướng có ít tác dụng phụ hơn so với các phương pháp điều trị ung thư truyền thống bằng hóa trị hoặc xạ trị.

Tuy nhiên, phương pháp điều trị như vậy không có sẵn cho hầu hết bệnh nhân ung thư. Trong nhiều bệnh ung thư, những thay đổi di truyền cụ thể chịu trách nhiệm cho bệnh ung thư vẫn chưa được biết. Để tạo ra phương pháp điều trị ung thư cá nhân, chúng ta phải biết thêm về các thay đổi di truyền chức năng.

Với dữ liệu về di truyền ung thư đang phát triển nhanh chóng, toán học và thống kê giờ đây có thể giúp mở khóa các mẫu ẩn trong dữ liệu này để tìm ra các gen chịu trách nhiệm cho bệnh ung thư của một cá nhân. Với kiến ​​thức này, các bác sĩ có thể lựa chọn phương pháp điều trị thích hợp ngăn chặn hoạt động của các gen này để cá nhân hóa các liệu pháp cho từng bệnh nhân. Nghiên cứu của tôi nhằm cải thiện y học chính xác trong bệnh ung thư - bằng cách xây dựng các phương pháp tương tự đã được sử dụng để tìm các mẫu trong xếp hạng phim của Netflix.

Chọn lọc dữ liệu

Ngày nay, có sự truy cập công khai chưa từng có vào dữ liệu di truyền ung thư. Những dữ liệu này đến từ những bệnh nhân hào phóng đã hiến mẫu khối u của họ để nghiên cứu. Các nhà khoa học sau đó áp dụng các công nghệ giải trình tự để đo lường các đột biến và hoạt động trong từng gen 20,000 trong bộ gen của con người.


đồ họa đăng ký nội tâm


Tất cả những dữ liệu này là kết quả trực tiếp của Dự án bảo vệ gen người trong 2003. Dự án đó đã xác định trình tự cho tất cả các gen tạo nên DNA khỏe mạnh của con người. Kể từ khi hoàn thành dự án đó, chi phí giải trình tự bộ gen người có hơn một nửa mỗi năm, vượt qua sự tăng trưởng của sức mạnh tính toán được mô tả trong Định luật Moore. Việc giảm chi phí này cho phép các nghiên cứu thu thập dữ liệu di truyền chưa từng có từ các bệnh nhân ung thư.

Hầu hết các nghiên cứu khoa học về di truyền ung thư được thực hiện trên toàn thế giới công bố dữ liệu của họ vào một cơ sở dữ liệu công cộng tập trung được cung cấp bởi Thư viện Y khoa Quốc gia Hoa Kỳ (NIH). Viện Ung thư Quốc gia NIH và Viện Nghiên cứu Bộ gen Người Quốc gia cũng đã tự do công bố dữ liệu di truyền từ các khối u trên 11,000 trong các loại ung thư 33 thông qua một dự án được gọi là Bản đồ bộ gen ung thư.

Mọi chức năng sinh học - từ trích xuất năng lượng từ thực phẩm đến chữa lành vết thương - là kết quả của hoạt động trong các tổ hợp gen khác nhau. Ung thư chiếm đoạt các gen cho phép con người phát triển đến tuổi trưởng thành và bảo vệ cơ thể khỏi hệ thống miễn dịch. Các nhà nghiên cứu gọi đây là Dấu hiệu của bệnh ung thư. Cái gọi là rối loạn gen này cho phép một khối u phát triển không kiểm soát và hình thành di căn ở các cơ quan xa từ vị trí khối u ban đầu.

Các nhà nghiên cứu đang tích cực sử dụng những dữ liệu công khai này để tìm ra tập hợp các thay đổi gen chịu trách nhiệm cho từng loại khối u. Nhưng vấn đề này không đơn giản là xác định một gen bị điều hòa đơn lẻ trong mỗi khối u. Hàng trăm, nếu không phải hàng ngàn, các gen 20,000 trong bộ gen của con người bị điều hòa trong bệnh ung thư. Nhóm các gen bị điều hòa thay đổi trong từng khối u của bệnh nhân, với các bộ gen nhỏ hơn thường được tái sử dụng cho phép mỗi dấu hiệu ung thư.

Y học chính xác dựa vào việc tìm ra các nhóm nhỏ hơn các gen bị điều hòa chịu trách nhiệm về chức năng sinh học trong khối u của mỗi bệnh nhân. Nhưng, gen có thể có nhiều chức năng sinh học trong các bối cảnh khác nhau. Do đó, các nhà nghiên cứu phải phát hiện ra một tập hợp các gen gen chồng chéo có chức năng chung trong một nhóm bệnh nhân ung thư.

Liên kết trạng thái gen với chức năng đòi hỏi toán học phức tạp và sức mạnh tính toán to lớn. Kiến thức này rất cần thiết để dự đoán kết quả cho các liệu pháp sẽ ngăn chặn chức năng của các gen này. Vì vậy, làm thế nào chúng ta có thể khám phá những tính năng chồng chéo để dự đoán kết quả cá nhân cho bệnh nhân?

Những gì Netflix có thể dạy chúng ta

May mắn thay cho chúng tôi, vấn đề này đã được giải quyết trong khoa học máy tính. Câu trả lời là một lớp các kỹ thuật được gọi là ma trận nhân tố ma thuật - và bạn có thể đã tương tác với các kỹ thuật này trong cuộc sống hàng ngày.

Trong 2009, Netflix đã tổ chức một thử thách để cá nhân hóa xếp hạng phim cho mỗi người dùng Netflix. Trên Netflix, mỗi người dùng có một bộ xếp hạng các phim khác nhau. Mặc dù hai người dùng có thể có sở thích giống nhau trong phim, nhưng họ có thể khác nhau ở các thể loại cụ thể. Do đó, bạn không thể dựa vào việc so sánh xếp hạng từ những người dùng tương tự.

Thay vào đó, thuật toán nhân tố ma trận tìm thấy các bộ phim có xếp hạng tương tự giữa một nhóm người dùng nhỏ hơn. Nhóm người dùng sẽ khác nhau cho mỗi bộ phim. Máy tính liên kết mỗi người dùng với một nhóm phim ở một mức độ khác nhau, dựa trên thị hiếu cá nhân của họ. Các mối quan hệ giữa những người dùng được gọi là các mẫu của.

ung thư 4 21Genevease Stein-O'Brien, CC BY

Quá trình tương tự có thể làm việc trong bệnh ung thư. Trong trường hợp này, các phép đo rối loạn gen tương tự như xếp hạng phim, thể loại phim với chức năng sinh học và người dùng đối với khối u của bệnh nhân. Máy tính tìm kiếm trên các khối u của bệnh nhân để tìm ra các kiểu trong rối loạn gen gây ra chức năng sinh học ác tính trong mỗi khối u.

Từ phim đến khối u

Sự tương đồng giữa xếp hạng phim và di truyền ung thư bị phá vỡ trong các chi tiết. Trừ khi họ là trẻ vị thành niên, người dùng Netflix không bị gò bó trong những bộ phim họ xem. Nhưng, cơ thể chúng ta thay vào đó thích giảm thiểu số lượng gen được sử dụng cho bất kỳ chức năng nào. Ngoài ra còn có sự dư thừa đáng kể giữa các gen. Để bảo vệ một tế bào, một gen có thể dễ dàng thay thế cho một tế bào khác để phục vụ một chức năng chung. Chức năng gen trong ung thư thậm chí còn phức tạp hơn. Các khối u cũng rất phức tạp và phát triển nhanh chóng, tùy thuộc vào sự tương tác ngẫu nhiên giữa các tế bào ung thư và cơ quan khỏe mạnh liền kề.

Để giải thích cho những phức tạp này, chúng tôi đã phát triển một cách tiếp cận nhân tố ma trận gọi là Hoạt động gen được phối hợp trong các bộ mẫu - hoặc viết tắt là CoGAPS. Thuật toán của chúng tôi giải thích cho sự tối giản của sinh học bằng cách kết hợp càng ít gen càng tốt vào các mẫu cho mỗi khối u.

Các gen khác nhau cũng có thể thay thế cho nhau, mỗi gen phục vụ một chức năng tương tự trong một bối cảnh khác nhau. Để giải thích cho điều này, CoGAPS đồng thời ước tính một số liệu thống kê cho cái gọi là mô hình cơ bản của chức năng gen. Điều này cho phép chúng tôi tính toán xác suất của mỗi gen được sử dụng trong từng chức năng sinh học trong một khối u.

Ví dụ, nhiều bệnh nhân sử dụng một liệu pháp nhắm mục tiêu được gọi là cetuximab để kéo dài thời gian sống sót trong ung thư đại trực tràng, tụy, phổi và miệng. Nghiên cứu gần đây của chúng tôi đã phát hiện ra rằng những mô hình này có thể phân biệt chức năng gen trong các tế bào ung thư đáp ứng với tác nhân trị liệu nhắm mục tiêu cetuximab với những mô hình không.

Tương lai

Thật không may, các liệu pháp điều trị ung thư nhắm vào các gen thường không thể chữa khỏi bệnh của bệnh nhân. Họ chỉ có thể trì hoãn sự tiến triển trong một vài năm. Hầu hết bệnh nhân sau đó tái phát, với các khối u không còn đáp ứng với điều trị.

Công việc gần đây của chúng tôi thấy rằng các kiểu phân biệt chức năng gen trong các tế bào đáp ứng với cetuximab bao gồm chính các gen làm tăng sức đề kháng. Các liệu pháp miễn dịch mới nổi đang hứa hẹn và xuất hiện để chữa một số bệnh ung thư. Tuy nhiên, quá thường xuyên, bệnh nhân với các phương pháp điều trị cũng tái phát. Dữ liệu mới theo dõi di truyền ung thư sau khi điều trị là điều cần thiết để xác định lý do tại sao bệnh nhân không còn đáp ứng.

Cùng với những dữ liệu này, sinh học ung thư cũng đòi hỏi một thế hệ các nhà khoa học mới có thể kết nối toán học và thống kê để xác định những thay đổi di truyền xảy ra theo thời gian trong kháng thuốc. Trong các lĩnh vực khác của toán học, các chương trình máy tính có thể dự báo kết quả dài hạn. Những mô hình này được sử dụng phổ biến trong các chiến lược đầu tư và dự báo thời tiết.

Trong các lĩnh vực này và nghiên cứu trước đây của riêng tôi, chúng tôi đã thấy rằng các bản cập nhật cho các mô hình từ các bộ dữ liệu lớn - chẳng hạn như dữ liệu vệ tinh trong trường hợp thời tiết - cải thiện dự báo dài hạn. Chúng ta đều đã thấy tác động của những cập nhật này, với dự đoán thời tiết cải thiện càng gần với cơn bão.

Giống như các công cụ từ khoa học máy tính được sử dụng có thể phù hợp với cả khuyến nghị phim và ung thư, thế hệ các nhà khoa học tính toán trong tương lai sẽ áp dụng các công cụ dự đoán từ một loạt các lĩnh vực cho y học chính xác. Cuối cùng, với các công cụ tính toán này, chúng tôi hy vọng dự đoán phản ứng của khối u đối với trị liệu thường như chúng ta dự đoán thời tiết, và có lẽ đáng tin cậy hơn.

Giới thiệu về Tác giả

Elana Fertig, Trợ lý Giáo sư về Sinh học Ung thư và Tin sinh học, Đại học Johns Hopkins

Bài viết này ban đầu được xuất bản vào Conversation. Đọc ban đầu bài viết.

Sách liên quan

at Thị trường InnerSelf và Amazon