你是否想象过与《哈利·波特》中的邓布利多对话,或是向《傲慢与偏见》的伊丽莎白请教人生建议?复旦大学团队开发的CoSER系统,正让这种体验接近现实——通过创新的角色扮演语言模型,AI不仅能模仿角色台词,更能理解其复杂背景与性格内核。
当前基于大语言模型(LLM)的角色扮演系统(RPLA)面临两大难题:一是数据质量,现有数据集多为两个角色间的简单对话,缺乏书籍场景中的多角色互动和深层背景;二是评估标准,多数测试仅关注表面台词匹配,难以衡量角色性格的还原深度。更关键的是,许多数据集由AI自动生成,导致角色行为偏离原著设定——就像让莎士比亚笔下的哈姆雷特突然说起网络流行语。
CoSER团队从斯坦尼斯拉夫斯基表演体系获得灵感,提出“给定情境表演法”(given-circumstance acting)。这种方法要求AI像专业演员一样,在对话时综合考虑角色的时代背景、人际关系、过往经历等“情境要素”。例如,当模拟《了不起的盖茨比》中的黛西时,模型不仅要会说“老钱阶层”的优雅措辞,还需体现她对婚姻的矛盾心理——这种复杂性正是普通聊天机器人难以捕捉的。
研究团队创建了迄今最丰富的文学角色数据集,覆盖771部名著中的17,966个角色。与以往不同,该数据集包含三类关键信息:
对话上下文:记录场景中所有角色的互动,而非孤立问答
角色履历:整理人物的关键经历(如“蜘蛛侠曾失去叔叔本”)
内心独白:标注原著中的心理描写(如《罪与罚》主角的犯罪后焦虑)
这种立体化数据构建,相当于为每个角色建立了“人物传记档案”。
基于LLaMA-3.1架构,团队训练了80亿参数(CoSER 8B)和700亿参数(CoSER 70B)两个版本。测试显示:
在自建评估体系中,CoSER 70B对角色性格还原的准确率达75.8%
在“人生抉择”测试中(如判断《飘》的斯嘉丽在特定情境下的选择),准确率高达93.47%
综合表现持平甚至超越GPT-4o,但参数规模仅为后者的1/5
这项技术的价值不仅在于打造更真实的虚拟角色聊天:
教育领域:学生可与历史人物对话,理解特定时代的思维方式
心理治疗:通过模拟经典文学中的智者角色提供咨询
文化保护:数字化保存濒危语言文化中的典型人物形象
研究者特别指出,系统严格遵循原著设定,避免生成不符合角色设定的内容——这对防止文化误读尤为重要。