Bác sĩ Mỹ sửng sốt khi phiên bản mới nhất của ChatGPT chẩn đoán 'giỏi hơn nhiều bác sĩ', phát hiện được cả bệnh hiếm gặp chỉ sau vài giây

Khi ứng dụng GPT-4, tiến sĩ Isaac Kohane, nhà khoa học máy tính tại Harvard, đồng thời cũng là một bác sĩ có nhiều kinh nghiệm y khoa, đã cảm thấy kinh ngạc trước khả năng của mô hình AI mới nhất do OpenAI phát triển.

GPT-4 là phiên bản mới nhất trong số các mô hình ngôn ngữ AI đang được dùng để vận hành ChatGPT và Bing Chat mới của Microsoft. So với mô hình GPT-3.5 trước đây, GPT-4 “sáng tạo hơn và độ hợp tác cao hơn bao giờ hết” cũng như có thể “giải quyết các vấn đề khó khăn với độ chính xác cao”, theo OpenAI.

Để kiếm chứng sức mạnh của GPT-4, tiến sĩ Isaac Kohane, nhà khoa học máy tính tại Harvard đồng thời cũng là bác sĩ, mới đây đã hợp tác với hai đồng nghiệp để tiến hành bài thử nghiệm với một mục tiêu chính: Xem mô hình trí tuệ nhân tạo mới nhất từ OpenAI hoạt động như thế nào trong môi trường y tế.

Kết quả thu được từ quá trình thử nghiệm GPT-4 đã khiến vị tiến sĩ này phải ngạc nhiên.

“Tôi vô cùng sửng sốt khi nói rằng: GPT-4 giỏi hơn nhiều bác sĩ mà tôi từng quan sát“, ông nói trong cuốn sách sắp xuất bản có tựa đề “Cuộc cách mạng AI trong y học”, được viết và biên soạn bởi nhà báo độc lập Carey Goldberg và phó chủ tịch phụ trách mảng nghiên cứu của Microsoft – ông Peter Lee.

Bác sĩ Mỹ sửng sốt khi mô hình AI GPT-4 chẩn đoán 'giỏi hơn nhiều bác sĩ', phát hiện được cả bệnh hiếm gặp không thua gì tiến sĩ y khoa giàu kinh nghiệm - Ảnh 1. — Isaac Kohane là một bác sĩ và nhà khoa học máy tính, tập trung vào sự kết hợp giữa y học và AI. Ảnh: Matthew J. Lee/The Boston Globe

Cách GPT-4 có thể chẩn đoán như một bác sĩ

Trong cuốn sách, Kohane cho biết GPT-4 (vốn được ra mắt vào tháng 3/2023 dưới dạng thử nghiệm cho những người dùng trả phí) trả lời chính xác hơn 90% các câu hỏi trong kì thi cấp chứng chỉ hành nghề y của Mỹ.

Như vậy, GPT-4 đã có thành tích tốt hơn nhiều so với các mô hình ngôn ngữ AI trước đây của OpenAI như GPT-3 và -3.5. Thậm chí, thành tích này còn vượt qua các một số bác sĩ đã được cấp chứng chỉ hành nghề y tại Mỹ.

Tuy nhiên, sức mạnh của GPT-4 không chỉ dừng lại ở khả năng tìm kiếm thông tin và thực hiện các bài kiểm tra. Mô hình AI này cũng rất có ích trong việc xử lý hồ sơ bệnh án của bệnh nhân.

Chẳng hạn, GPT-4 cũng là một ‘dịch giả’ tuyệt vời nhờ khả năng dịch thông tin xuất viện cho một bệnh nhân nói tiếng Bồ Đào Nha. GPT-4 cũng có thể chắt lọc những thuật ngữ kỹ thuật y học phức tạp thành thứ mà học sinh lớp 6 có thể dễ dàng đọc được.

Thậm chí, mô hình AI này đã cung cấp cho bác sĩ những mẹo hữu ích về cách thức nói chuyện với bệnh nhân về tình trạng của họ bằng ngôn ngữ rõ ràng, nhân ái.

Nó cũng có thể đọc các báo cáo hoặc nghiên cứu dài và tóm tắt chúng bằng chớp mắt. Bên cạnh đó, GPT-4 có thể giải thích về cách thức giải quyết vấn đề theo một cách ‘rất con người’, khiến chúng ta khó nhận ra đây là AI.

Tuy nhiên, nếu bạn hỏi GPT-4 làm thế nào nó làm được tất cả những điều này, nó có thể sẽ cho bạn biết rằng tất cả trí thông minh của nó vẫn “giới hạn ở các mẫu trong dữ liệu và không liên quan đến sự hiểu biết hoặc chủ ý thực sự.” Đó là những gì GPT-4 đã nói với các tác giả của cuốn sách, khi họ hỏi liệu nó có thực sự tham gia vào lý luận nhân quả hay không.

Ngay cả với những hạn chế như vậy, GPT-4 có thể bắt chước cách các bác sĩ chẩn đoán tình trạng bệnh nhân – mặc dù không hoàn hảo – với độ chuẩn xác lớn.

Trong quá trình thử nghiệm sức mạnh của GPT-4, tiến sĩ Kohane đã thực hiện một bài kiểm tra tư duy lâm sàng, dựa trên một trường hợp thực tế liên quan tới một em bé sơ sinh từng được ông điều trị vài năm trước đó.

Sau khi cung cấp cho GPT-4 một vài thông tin chính về tình trạng sức khỏe của bệnh nhân nhí, bao gồm một số thông tin từ việc khám siêu âm và đo nồng độ hormone, mô hình AI này đã đạt được kết quả chẩn đoán đáng kinh ngạc.

Theo đó, GPT-4 có thể chẩn đoán chính xác một hội chứng hiếm gặp (với tỷ lệ 1 trên 100.000 người) có tên tăng sản tuyến thượng thận bẩm sinh. Điều này có nghĩa, kết quả chẩn đoán của GPT-4 ‘ngang ngửa’ với tiến sĩ Kohane, một người có rất nhiều kiến thức và thành tích công tác lâu năm trong ngành y.

GPT-4 không phải lúc nào cũng đúng

Cũng phải nói thêm rằng, GPT-4 vẫn chưa thực sự hoàn toàn đáng tin cậy. Đôi khi, mô hình AI này vẫn mắc phải những sai lầm khá ngớ ngẩn. Nó bao gồm từ các lỗi văn thư đơn giản, chẳng hạn như viết sai chỉ số BMI mà GPT-4 đã tính toán chính xác ngay trước đó, đến các lỗi toán học như “giải” câu đố Sudoku không chính xác hoặc quên bình phương một số hạng trong một phương trình.