Là kết quả nỗ lực hợp tác giữa 5 sinh viên ngành Công nghệ thông tin, Khoa Khoa học, Kỹ thuật và Công nghệ – Đỗ Lê Long Ấn, Trần Minh Nhật, Vũ Quốc Gia Quân, Nguyễn Hà Kiều Anh và Hồ Bửu Quốc Phong, MedVoice tổng hòa giữa trí tuệ nhân tạo, tính hiệu quả trong lĩnh vực y tế và sáng kiến đổi mới của sinh viên.
(Trái sang phải) Sinh viên từ RMIT Việt Nam phát triển giải pháp MedVoice và thầy hướng dẫn: Hồ Bửu Quốc Phong, Trần Minh Nhật, Đỗ Lê Long Ấn, thầy Tom Huỳnh và Nguyễn Hà Kiều Anh.
Chuyển âm trực tiếp thành ghi chép hoàn chỉnh
Khó khăn chung mà nhân viên y tế toàn cầu gặp phải chính là quy trình lưu hồ sơ y khoa hết sức tốn thời gian và dễ xảy ra sai sót. Các phương thức ghi chép truyền thống thường tiêu tốn thời gian quý báu mà đáng ra họ có thể dành để chăm sóc bệnh nhân. Dự án MedVoice nhằm góp phần giải quyết nhu cầu cấp thiết này của ngành y tế.
Trọng tâm của công cụ này là một hệ sinh thái công nghệ tinh vi tận dụng công nghệ AI tân tiến. Người dùng có thể ghi âm các cuộc trò chuyện với bệnh nhân bằng tính năng ghi chép trực tiếp hiển thị trên ứng dụng. Dữ liệu được gửi đến trang Kho lưu trữ y tế có tích hợp tính năng chatbot giúp trả lời và truy xuất thông tin bệnh nhân.
Mô hình ngôn ngữ lớn xử lý các bản ghi âm trò chuyện với bệnh nhân được gửi tới Google Cloud, và được truy xuất bởi chương trình phụ trợ FastAPI, xử lý thông qua mô hình nhật ký Whisper cho người nói và tạo ra các bản ghi chép. Các bản ghi chép được đưa vào Meta Llama3-70B, định dạng bởi JSON và đăng lên giao diện người dùng.
Quy trình nền bao gồm phần phiên âm và sắp xếp dữ liệu âm thanh bệnh nhân, tiếp theo là phần nhúng và lưu trữ bằng mô hình văn bản nhúng ollma/nomic và cơ sở dữ liệu Vector (pgvector). Điều này đảm bảo truy xuất dữ liệu hiệu quả và tuân thủ các tiêu chuẩn bảo mật.
MedVoice, giải pháp đổi mới dựa trên AI do sinh viên RMIT phát triển, rất có tiềm năng to lớn trong việc chuyển đổi cách ghi chép hồ sơ sức khỏe bằng cách tự động chuyển âm thành văn bản viết.
“Bằng cách dùng các công nghệ tiên tiến gồm ‘chuyển giọng nói thành văn bản’ và ‘nhật ký người nói’, MedVoice ghi lại lời nói một cách chính xác và sắp xếp chúng thành bệnh án quy củ và chính xác”, thành viên Vũ Quốc Gia Quân giải thích. “Phát triển chuyên biệt cho đặc thù ngành y tế ở Việt Nam, công cụ này được tinh chỉnh để xử lý các thuật ngữ y tế phức tạp, môi trường nhiều tiếng ồn và bối cảnh có nhiều người nói cùng lúc”.
Thành viên nhóm Trần Minh Nhật mô tả việc xây dựng MedVoice là một hành trình đầy thách thức nhưng xứng đáng: “Chúng tôi giải quyết độ chính xác của bản phiên âm bằng cách chọn các mô hình AI được tối ưu hóa để xử lý các thuật ngữ y khoa tiếng Việt và môi trường ồn ào. Để đạt hiệu quả theo thời gian thực, chúng tôi đã tinh chỉnh các mô hình riêng cho Android và iOS”.
“Chúng tôi cũng ưu tiên quyền riêng tư dữ liệu, đảm bảo bảo mật các thông tin y tế nhạy cảm. Cuối cùng, chúng tôi đã cải thiện hiệu suất mô hình AI trên các ngôn ngữ có nguồn tài nguyên hạn chế, giúp công cụ dễ tiếp cận và đáng tin cậy với nhân viên y tế trên khắp Việt Nam”, Nhật cho biết thêm.
Cách tiếp cận toàn diện này nêu bật nỗ lực của nhóm trong việc tạo ra một giải pháp hiệu quả và đáng tin cậy.
Trải nghiệm học vô cùng hữu ích và tiềm năng mở rộng ứng dụng
Tính hiệu quả của MedVoice đã được chứng minh qua cả tiêu chuẩn kỹ thuật và sự công nhận tại các sự kiện lớn, trong đó có sự kiện tập trung vào AI lớn nhất Việt Nam năm 2024 - AI4VN và Ngày hội Trải nghiệm của Đại học RMIT Việt Nam, thành viên nhóm Hồ Bửu Quốc Phong chia sẻ.
Tại AI4VN 2024, MedVoice được giới thiệu trong phần thuyết trình của hai giảng viên RMIT. Bài nói nêu bật tính sáng tạo của ứng dụng trong việc đưa AI vào giải quyết các thách thức trong ngành y tế. Sự công nhận này đã đưa MedVoice lên tuyến đầu ngang hàng với các giải pháp AI tiên tiến tại Việt Nam và nhấn mạnh vào tác động tiềm năng của giải pháp đối với ngành y tế.
MedVoice còn tạo được sự chú ý tại Ngày hội Trải nghiệm của RMIT Việt Nam năm 2024. Đây là sự kiện thu hút hơn 11.500 khách tham dự ở cả cơ sở Nam Sài Gòn và Hà Nội. Là một trong hơn 100 workshop diễn ra trong khuôn khổ sự kiện, MedVoice được chọn để giới thiệu về những đóng góp của trường với đổi mới sáng tạo và ngành y tế. Người tham dự có cơ hội trải nghiệm phần mô phỏng hoạt động thực tế của giải pháp.
Thành viên nhóm Nguyễn Hà Kiều Anh cho biết sáng kiến thực sự đến khi các thành viên đồng lòng chia sẻ ý tưởng và cùng nhau giải quyết vấn đề. Thay mặt cho cả nhóm, Kiều Anh tri ân sự hướng dẫn và phản hồi mà nhóm nhận được từ các thầy là Tiến sĩ Arthur Tang và Thạc sĩ Tom Huỳnh. Nhờ sự chỉ bảo tận tình mà nhóm đã định hình được hướng tiếp cận, biết cách sửa đổi hoàn thiện ý tưởng và tập trung vào mục tiêu.
“Dự án dạy chúng tôi về tính kiên trì. Những đêm thức khuya để chạy bài và phải sửa ứng dụng tới lui nhiều lần giúp chúng tôi hiểu rằng để tiến bộ cần phải kiên nhẫn và có khả năng thích ứng”, Kiều Anh nói.
Tầm nhìn của nhóm vượt khỏi phạm vi Việt Nam. Các bạn muốn tạo ra một giải pháp có thể nhân rộng nhằm giải quyết thách thức trong việc ghi chép tư liệu y khoa ở các khu vực có nguồn lực y tế kém trên toàn cầu.
“Phát triển tương lai bao gồm cải thiện hỗ trợ cho các phương ngữ vùng miền ở Việt Nam, nâng cao hiệu suất của mô hình AI và tích hợp giải pháp này vào hệ thống hồ sơ sức khỏe điện tử (EHR)”, bạn Đỗ Lê Long Ấn cho biết.
MedVoice không chỉ là giải pháp về công nghệ, đó là minh chứng cho cách AI có thể cải thiện ngành y tế. Bằng cách giảm gánh nặng hành chính, dự án hứa hẹn cho nhân viên y tế thêm thời gian để tập trung vào việc họ làm tốt nhất – chăm sóc bệnh nhân với chuyên môn cao và sự ân cần. Như Tiến sĩ Arthur Tang chia sẻ, việc đẩy mạnh nghiên cứu để tạo ra sáng kiến đổi mới mang lại tác động là yêu cầu cấp thiết và MedVoice minh chứng rằng đổi mới thực sự có thể từng bước thay đổi sâu sắc ngành y tế.
Minh Ngọc