南洋理工大学的研究人员提出了首个全面评测大型语言模型(LLM)处理结构化电子病历(EHR)能力的综合基准EHRStruct。该基准由计算机科学家与医学专家共同构建,覆盖了11项核心任务,包含2,200个标准化样本,旨在为医疗大模型的可控性、可靠性与临床可用性提供统一而严谨的可解释评测框架。研究团队对20个主流LLMs与11种先进的增强方法进行了全面评测,并提出了代码增强框架EHRMaster,其性能全面超越现有最佳模型。同时,EHRStruct 2026挑战赛也已上线,为研究者提供统一的评测平台。