Một nghiên cứu với 89 chuyên gia và bác sĩ lâm sàng tiết lộ việc triển khai trí tuệ nhân tạo (AI) tại một số bệnh viện lớn của Mỹ bị ‘lộn xộn’, thậm chí ‘hỗn loạn’.
Khi nói đến trí tuệ nhân tạo (AI), mọi người hy vọng đây là một cuộc cách mạng làm đổi thay mọi mặt của đời sống. Tuy nhiên bên cạnh một số thành tựu, không ít trường hợp AI gây “hỗn loạn”, theo một nghiên cứu mới đây tại Mỹ.
AI có thay được bác sĩ?
Nghiên cứu do các nhà khoa học tại Đại học Duke (Mỹ) thực hiện. Họ nhận định: trong nhiều năm, các hệ thống chăm sóc sức khỏe và bệnh viện Mỹ đã phải “vật lộn” với những nỗ lực không hiệu quả hoặc thất bại trong việc áp dụng các công cụ AI.
Tham gia nghiên cứu có 89 chuyên gia và bác sĩ lâm sàng (ẩn danh) tại 11 tổ chức chăm sóc sức khỏe, bao gồm cả Duke Health, Mayo Clinic và Kaiser Permanente.
Tuần trước, trên mạng JAMA Internal Medicine, nhóm nghiên cứu đã phát hiện một hội đồng gồm ba bác sĩ có chuyên môn y tế liên quan đã đưa ra đánh giá chủ quan: ChatGPT (phiên bản 3.5) đã “đánh bại” các bác sĩ trong việc cung cấp câu trả lời chất lượng cao trên ứng dụng subreddit r/AskDocs. “Đây là một kỳ công không nhỏ”, hội đồng này nhận định.
Nhưng nhóm chuyên gia lại có ý kiến khác với hội đồng trên. Họ lập luận: các loại câu hỏi y tế trên diễn đàn Reddit thường chung chung, không phải những câu hỏi chi tiết mà bệnh nhân sẽ hỏi bác sĩ thật để tin tưởng làm theo.
Cạnh đó, chất lượng câu trả lời của “bác sĩ ảo” cũng có vấn đề: rất nhiều tình huống không khớp với câu trả lời của các bác sĩ thật – những người đã theo dõi tình trạng sức khỏe bệnh nhân trong thời gian dài.
Ngoài ra, mỗi người bệnh có bệnh cảnh khác nhau, độ nặng nhẹ của bệnh khác nhau và sức khỏe chịu đựng bệnh cũng khác nhau, không thể dùng chung một trả lời.
Nhóm chuyên gia cũng cho biết mô hình phòng chống đại dịch vừa qua của Thụy Sĩ đã bộc lộ điểm yếu: Trong các hệ sinh thái AI chăm sóc sức khỏe đều chứa những lỗ hổng lớn, khiến việc phổ biến rộng rãi các sản phẩm y tế kém là điều không thể tránh khỏi.
Nhiều thách thức
Hiện nhiều giải pháp AI về cơ bản đang cố gắng làm những việc giống như một bác sĩ. 89 chuyên gia và bác sĩ lâm sàng tham gia nghiên cứu nói có nhiều vấn đề phát sinh.
Chẳng hạn như chụp X-quang. Nếu Al đọc phim X-quang như một bác sĩ X-quang, trong khi chúng ta đã có bác sĩ X-quang, vậy Al hay bác sĩ dư thừa? Nếu dẹp bác sĩ X-quang, khi máy móc trục trặc tìm đâu ra bác sĩ để đọc, nhất là trường hợp cấp cứu?
Ngay cả những công cụ tương đối đơn giản, như dùng AI để hoàn thành tự động các ghi chú phân loại bệnh ở khoa cấp cứu, cũng đã thất bại trong thực tế.
“Ứng dụng AI không thực hiện được như mong đợi. Không phải vì thuật toán sai. Thuật toán khá hay, nhưng nó không phù hợp với quy trình làm việc của các bác sĩ lâm sàng trên từng bệnh nhân”, họ cho biết.
Họ cũng nhấn mạnh: đó là trong trường hợp máy móc hoạt động tốt, nhưng nếu hệ thống máy móc bị lỗi, cả một dây chuyền hoạt động của bệnh viện cũng như điều trị cho bệnh nhân sẽ hỗn loạn.