当AI学会“演戏”:如何用大语言模型精准还原经典角色

发布日期:June 10, 2025, 4:02 a.m.
摘要:

你是否想象过与《哈利·波特》中的邓布利多对话,或是向《傲慢与偏见》的伊丽莎白请教人生建议?复旦大学团队开发的CoSER系统,正让这种体验接近现实——通过创新的角色扮演语言模型,AI不仅能模仿角色台词,更能理解其复杂背景与性格内核。

角色扮演AI的瓶颈

当前基于大语言模型(LLM)的角色扮演系统(RPLA)面临两大难题:一是数据质量,现有数据集多为两个角色间的简单对话,缺乏书籍场景中的多角色互动和深层背景;二是评估标准,多数测试仅关注表面台词匹配,难以衡量角色性格的还原深度。更关键的是,许多数据集由AI自动生成,导致角色行为偏离原著设定——就像让莎士比亚笔下的哈姆雷特突然说起网络流行语。

从戏剧理论中寻找答案

CoSER团队从斯坦尼斯拉夫斯基表演体系获得灵感,提出“给定情境表演法”(given-circumstance acting)。这种方法要求AI像专业演员一样,在对话时综合考虑角色的时代背景、人际关系、过往经历等“情境要素”。例如,当模拟《了不起的盖茨比》中的黛西时,模型不仅要会说“老钱阶层”的优雅措辞,还需体现她对婚姻的矛盾心理——这种复杂性正是普通聊天机器人难以捕捉的。

构建文学角色的“百科全书”

研究团队创建了迄今最丰富的文学角色数据集,覆盖771部名著中的17,966个角色。与以往不同,该数据集包含三类关键信息:

  1. 对话上下文:记录场景中所有角色的互动,而非孤立问答

  2. 角色履历:整理人物的关键经历(如“蜘蛛侠曾失去叔叔本”)

  3. 内心独白:标注原著中的心理描写(如《罪与罚》主角的犯罪后焦虑)

这种立体化数据构建,相当于为每个角色建立了“人物传记档案”。

两大核心模型表现

基于LLaMA-3.1架构,团队训练了80亿参数(CoSER 8B)和700亿参数(CoSER 70B)两个版本。测试显示:

  • 在自建评估体系中,CoSER 70B对角色性格还原的准确率达75.8%

  • 在“人生抉择”测试中(如判断《飘》的斯嘉丽在特定情境下的选择),准确率高达93.47%

  • 综合表现持平甚至超越GPT-4o,但参数规模仅为后者的1/5

超越娱乐的应用潜力

这项技术的价值不仅在于打造更真实的虚拟角色聊天:

  • 教育领域:学生可与历史人物对话,理解特定时代的思维方式

  • 心理治疗:通过模拟经典文学中的智者角色提供咨询

  • 文化保护:数字化保存濒危语言文化中的典型人物形象

研究者特别指出,系统严格遵循原著设定,避免生成不符合角色设定的内容——这对防止文化误读尤为重要。