Trong nghiên cứu ung thư, các thước đo kết quả phức hợp, chẳng hạn như thời gian sống không tiến triển (PFS) và thời gian sống không bệnh (DFS), đang ngày càng thay thế các tiêu chí đánh giá truyền thống về thời gian sống tổng thể (OS) và đã trở thành cơ sở thử nghiệm quan trọng để Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ (FDA) và Cơ quan Dược phẩm Châu Âu (EMA) phê duyệt thuốc. Các thước đo này cải thiện hiệu quả thử nghiệm lâm sàng và giảm chi phí bằng cách kết hợp nhiều sự kiện (ví dụ: khối u phát triển, bệnh mới, tử vong, v.v.) thành một tiêu chí đánh giá thời gian, nhưng chúng cũng tạo ra nhiều vấn đề.
Những thay đổi trong các điểm cuối của thử nghiệm lâm sàng chống khối u
Vào những năm 1970, FDA đã sử dụng tỷ lệ đáp ứng khách quan (ORR) khi phê duyệt thuốc điều trị ung thư. Mãi đến những năm 1980, Ủy ban Cố vấn Thuốc Ung thư (ODAC) và FDA mới nhận ra rằng những cải thiện về tỷ lệ sống sót, chất lượng cuộc sống, chức năng thể chất và các triệu chứng liên quan đến khối u không nhất quán với mối tương quan ORR. Trong các thử nghiệm lâm sàng về ung thư, OS là một tiêu chí lâm sàng tốt hơn để đo lường lợi ích lâm sàng trực tiếp. Tuy nhiên, ORR vẫn là một tiêu chí lâm sàng thay thế phổ biến khi xem xét phê duyệt nhanh các loại thuốc điều trị ung thư. Trong các thử nghiệm lâm sàng một nhánh ở những bệnh nhân có khối u kháng trị, ORR cũng được coi là tiêu chí lâm sàng chính.
Trong khoảng thời gian từ năm 1990 đến năm 1999, 30 phần trăm các thử nghiệm thuốc điều trị ung thư được FDA chấp thuận đã sử dụng OS làm điểm cuối lâm sàng chính. Khi các liệu pháp nhắm mục tiêu phát triển, các điểm cuối lâm sàng chính được sử dụng để đánh giá thuốc chống ung thư cũng đã thay đổi. Trong khoảng thời gian từ năm 2006 đến năm 2011, con số đó đã giảm xuống còn 14,5 phần trăm. Khi số lượng các thử nghiệm lâm sàng với OS là điểm cuối chính đã giảm, việc sử dụng các điểm cuối tổng hợp như PFS và DFS đã trở nên thường xuyên hơn. Các hạn chế về tài trợ và thời gian đang thúc đẩy sự thay đổi này, vì OS đòi hỏi các thử nghiệm dài hơn và nhiều bệnh nhân hơn so với PFS và DFS. Trong khoảng thời gian từ năm 2010 đến năm 2020, 42% các thử nghiệm có đối chứng ngẫu nhiên (RCTS) trong lĩnh vực ung thư có PFS là điểm cuối chính. 67% thuốc chống khối u được FDA chấp thuận trong khoảng thời gian từ năm 2008 đến năm 2012 dựa trên các điểm cuối thay thế, trong đó 31% dựa trên PFS hoặc DFS. FDA hiện đã công nhận những lợi ích lâm sàng của DFS và PFS và cho phép sử dụng chúng làm tiêu chí đánh giá chính trong các thử nghiệm đang chờ phê duyệt theo quy định. FDA cũng thông báo rằng PFS và các tiêu chí đánh giá thay thế khác có thể được sử dụng để đẩy nhanh quá trình phê duyệt thuốc điều trị các bệnh nghiêm trọng hoặc đe dọa tính mạng.
Tiêu chí đánh giá cuối cùng sẽ thay đổi không chỉ khi các liệu pháp mới được phát triển mà còn khi các phương pháp chẩn đoán hình ảnh và xét nghiệm được cải thiện. Điều này được chứng minh bằng việc thay thế các tiêu chí của Tổ chức Y tế Thế giới (WHO) bằng tiêu chí RECIST cho Đánh giá Hiệu quả ở Khối u Rắn (RECIST). Khi các bác sĩ lâm sàng tìm hiểu thêm về khối u, những bệnh nhân từng được coi là ổn định có thể được phát hiện có di căn vi thể trong tương lai. Trong tương lai, một số tiêu chí đánh giá cuối cùng có thể không còn được áp dụng nữa, và các tiêu chí đánh giá cuối cùng mới có thể xuất hiện để đẩy nhanh quá trình phê duyệt thuốc một cách an toàn. Ví dụ, sự phát triển của liệu pháp miễn dịch đã dẫn đến sự phát triển của các hướng dẫn đánh giá mới như irRECIST và iRECIST.
Tổng quan về điểm cuối tổng hợp
Tiêu chí đánh giá tổng hợp được sử dụng rộng rãi trong các nghiên cứu lâm sàng, đặc biệt là trong ung thư và tim mạch. Tiêu chí đánh giá tổng hợp cải thiện sức mạnh thống kê bằng cách tăng số lượng biến cố, giảm quy mô mẫu, thời gian theo dõi và kinh phí cần thiết.
Tiêu chí đánh giá kết hợp được sử dụng rộng rãi nhất trong tim mạch là các biến cố tim mạch bất lợi lớn (MACE). Trong ung thư học, PFS và DFS thường được sử dụng làm tiêu chí đánh giá sống còn toàn bộ (OS). PFS được định nghĩa là thời gian từ khi phân nhóm ngẫu nhiên đến khi bệnh tiến triển hoặc tử vong. Tiến triển khối u đặc thường được định nghĩa theo hướng dẫn RECIST 1.1, bao gồm sự xuất hiện của các tổn thương mới và sự mở rộng của các tổn thương đích. Sống còn không biến cố (EFS), DFS và sống còn không tái phát (RFS) cũng là các tiêu chí đánh giá kết hợp phổ biến. EFS được sử dụng trong các thử nghiệm về liệu pháp tân bổ trợ, và DFS được sử dụng trong các nghiên cứu lâm sàng về liệu pháp bổ trợ.
Các tác dụng khác nhau của các liệu pháp khác nhau trên các điểm cuối hợp chất
Việc chỉ báo cáo các kết quả phức hợp cũng có thể dẫn đến giả định rằng hiệu quả điều trị áp dụng cho từng biến cố thành phần, điều này không nhất thiết đúng. Một giả định quan trọng khi sử dụng các điểm cuối phức hợp là việc điều trị sẽ thay đổi các thành phần theo cách tương tự. Tuy nhiên, tác động của liệu pháp chống khối u lên các biến số như sự phát triển của khối u nguyên phát, di căn và tỷ lệ tử vong đôi khi lại đi ngược lại. Ví dụ, một loại thuốc có độc tính cao có thể làm giảm sự lan rộng của khối u nhưng lại làm tăng tỷ lệ tử vong. Đây là trường hợp trong thử nghiệm BELLINI trên những bệnh nhân mắc bệnh đa u tủy tái phát/kháng trị, trong đó PFS được cải thiện nhưng OS thấp hơn do tỷ lệ nhiễm trùng liên quan đến điều trị cao hơn.
Ngoài ra, có dữ liệu tiền lâm sàng cho thấy việc sử dụng hóa trị liệu để thu nhỏ khối u nguyên phát làm tăng tốc độ di căn xa trong một số trường hợp vì hóa trị liệu chọn các tế bào gốc có nhiều khả năng kích hoạt di căn. Giả thuyết về hướng khó có thể đúng khi có nhiều biến cố trong tiêu chí đánh giá tổng hợp, như trường hợp của một số định nghĩa về PFS, EFS và DFS. Ví dụ, các thử nghiệm liệu pháp ghép tế bào gốc tạo máu đồng loại thường sử dụng tiêu chí đánh giá tổng hợp bao gồm tử vong, tái phát ung thư và bệnh ghép chống vật chủ (GVHD), được gọi là RFS không có GVHD (GRFS). Các liệu pháp làm giảm tỷ lệ GVHD có thể làm tăng tỷ lệ tái phát ung thư và ngược lại. Trong trường hợp này, tỷ lệ GVHD và tỷ lệ tái phát phải được phân tích riêng biệt để đo lường chính xác tỷ lệ rủi ro-lợi ích của phương pháp điều trị.
Việc báo cáo thường xuyên các tỷ lệ sự kiện khác nhau cho các kết quả phức tạp đảm bảo rằng tác động của phương pháp điều trị lên từng thành phần đều theo cùng một hướng; Bất kỳ “sự không đồng nhất về chất lượng” nào (tức là sự khác biệt về hướng) đều dẫn đến việc sử dụng các điểm cuối tổng hợp không hiệu quả.
EMA khuyến nghị “phân tích riêng lẻ từng loại sự kiện bằng cách sử dụng bảng tóm tắt mô tả và, nếu phù hợp, phân tích rủi ro cạnh tranh để tìm hiểu tác động của việc điều trị lên từng sự kiện”. Tuy nhiên, do sức mạnh thống kê của nhiều nghiên cứu còn hạn chế, nên không thể phát hiện ra sự khác biệt đáng kể giữa các sự kiện thành phần trong kết quả tổng hợp.
Thiếu minh bạch trong việc báo cáo các sự kiện điểm cuối tổng hợp
Trong các thử nghiệm tim mạch, thông lệ chung là cung cấp tỷ lệ mắc của từng biến cố thành phần (như đột quỵ, nhồi máu cơ tim, nhập viện và tử vong) cùng với tiêu chí đánh giá tổng hợp MACE. Tuy nhiên, đối với PFS và các tiêu chí đánh giá tổng hợp khác trong các thử nghiệm lâm sàng ung thư, tiêu chí này không áp dụng. Một phân tích của 10 nghiên cứu gần đây được công bố trên năm tạp chí ung thư hàng đầu sử dụng PFS làm tiêu chí đánh giá cho thấy chỉ có ba nghiên cứu (6%) báo cáo tử vong và các biến cố tiến triển của bệnh; Chỉ có một nghiên cứu phân biệt giữa tiến triển tại chỗ và di căn xa. Ngoài ra, một nghiên cứu phân biệt giữa tiến triển tại chỗ và tiến triển xa, nhưng không cung cấp số ca tử vong trước khi bệnh tiến triển.
Lý do cho sự khác biệt trong các tiêu chuẩn báo cáo cho các điểm cuối tổng hợp trong tim mạch và ung thư vẫn chưa rõ ràng. Một khả năng là các điểm cuối tổng hợp như PFS và DFS là các chỉ số hiệu quả. MACE bắt nguồn từ kết quả an toàn và lần đầu tiên được sử dụng trong nghiên cứu các biến chứng của can thiệp mạch vành qua da. Các cơ quan quản lý có tiêu chuẩn cao trong việc báo cáo kết quả an toàn, do đó cần có tài liệu chi tiết về các tác dụng phụ trong các thử nghiệm lâm sàng. Khi MACE được sử dụng rộng rãi như một điểm cuối về hiệu quả, việc cung cấp số lượng của từng sự kiện có thể đã trở thành thông lệ phổ biến. Một lý do khác cho các tiêu chuẩn báo cáo khác nhau là PFS được coi là tập hợp các sự kiện tương tự, trong khi MACE được coi là tập hợp các sự kiện riêng biệt (ví dụ: đột quỵ so với nhồi máu cơ tim). Tuy nhiên, sự phát triển của khối u nguyên phát và di căn xa khác nhau đáng kể, đặc biệt là về tác động lâm sàng. Tất cả những giải thích này đều mang tính suy đoán, nhưng rõ ràng không có giải thích nào trong số chúng biện minh cho một báo cáo không đầy đủ. Đối với các thử nghiệm ung thư sử dụng điểm cuối tổng hợp, đặc biệt khi điểm cuối tổng hợp là điểm cuối chính hoặc được sử dụng cho mục đích quản lý và khi điểm cuối tổng hợp có mặt như điểm cuối thứ cấp, thì việc báo cáo sự kiện thành phần minh bạch phải trở thành chuẩn mực.
Thời gian đăng: 23-12-2023




