当AI学会“演戏”：如何用大语言模型精准还原经典角色

角色扮演AI的瓶颈

当前基于大语言模型（LLM）的角色扮演系统（RPLA）面临两大难题：一是数据质量，现有数据集多为两个角色间的简单对话，缺乏书籍场景中的多角色互动和深层背景；二是评估标准，多数测试仅关注表面台词匹配，难以衡量角色性格的还原深度。更关键的是，许多数据集由AI自动生成，导致角色行为偏离原著设定——就像让莎士比亚笔下的哈姆雷特突然说起网络流行语。

从戏剧理论中寻找答案

CoSER团队从斯坦尼斯拉夫斯基表演体系获得灵感，提出“给定情境表演法”（given-circumstance acting）。这种方法要求AI像专业演员一样，在对话时综合考虑角色的时代背景、人际关系、过往经历等“情境要素”。例如，当模拟《了不起的盖茨比》中的黛西时，模型不仅要会说“老钱阶层”的优雅措辞，还需体现她对婚姻的矛盾心理——这种复杂性正是普通聊天机器人难以捕捉的。

构建文学角色的“百科全书”

研究团队创建了迄今最丰富的文学角色数据集，覆盖771部名著中的17,966个角色。与以往不同，该数据集包含三类关键信息：

对话上下文：记录场景中所有角色的互动，而非孤立问答
角色履历：整理人物的关键经历（如“蜘蛛侠曾失去叔叔本”）
内心独白：标注原著中的心理描写（如《罪与罚》主角的犯罪后焦虑）

这种立体化数据构建，相当于为每个角色建立了“人物传记档案”。

两大核心模型表现

基于LLaMA-3.1架构，团队训练了80亿参数（CoSER 8B）和700亿参数（CoSER 70B）两个版本。测试显示：

在自建评估体系中，CoSER 70B对角色性格还原的准确率达75.8%
在“人生抉择”测试中（如判断《飘》的斯嘉丽在特定情境下的选择），准确率高达93.47%
综合表现持平甚至超越GPT-4o，但参数规模仅为后者的1/5

超越娱乐的应用潜力

这项技术的价值不仅在于打造更真实的虚拟角色聊天：

教育领域：学生可与历史人物对话，理解特定时代的思维方式
心理治疗：通过模拟经典文学中的智者角色提供咨询
文化保护：数字化保存濒危语言文化中的典型人物形象

研究者特别指出，系统严格遵循原著设定，避免生成不符合角色设定的内容——这对防止文化误读尤为重要。