长江云

DeepSeek助力，文物精灵开启最强大脑模式

长江云新闻 2025-02-14 20:17:35

分享到：

2月14日，在华中科技大学光影交互服务技术文化和旅游部重点实验室，文物精灵“楚铁”和“楚音”正在与记者进行实时语音对话，辅以肢体动作和特色音效，让这台AI大脑更富有人情味儿。

记者：“楚铁，请以武汉樱花作一首七言诗。”

文物精灵“楚铁”：“好的，樱落江城春意浓，剑影犹存岁月中。千年文脉续新梦，共赏花时乐融融。”

记者：“可以在诗里再加入一些湖北元素吗？”

文物精灵“楚铁”：“嘿嘿，好嘞。樱落东湖醉游人，黄鹤楼下赏樱春。楚地风华千古韵，剑气长存护故园。咋样，这下够湖北味了吧？”

（左一、左二分别为“楚音”“楚铁”）

与记者对话的“楚铁”，它的形象来自越王勾践剑，“楚音”的形象则提取于湖北省博物馆镇馆之宝“虎座鸟架鼓”中的“凤鸟”。为了打造更智慧、更人性化的数字人交互体验，团队创新性地将“楚音”“楚铁”与 DeepSeek 国产文本大模型进行深度融合。在DeepSeek的驱动下，两个形象更聪明，也更逼真了。“这次在技术上的突破不仅仅是接入了DeepSeek，更重要的是，我们让它更像一个‘人’的大脑。”华中科技大学光影交互服务技术文旅部重点实验室主任蔡新元告诉记者。

依托蔡新元教授团队ARTI designerXL 人工智能艺术超级计算平台的强大运算能力，输入相应关键词，该平台可以在2秒生成AI图，得出心仪的作品后，利用AI绘画、大模型等相关技术进行三维建模，然后就可以开始拟人化训练，让虚拟数字人从“活”过来到“动”起来，这项功能将会在今年下半年上线平台。

蔡新元教授介绍，当前的人工智能模型分为两大类，一类是知识模型，通过大量的语料、数据的训练，能将知识全都装进数字人的脑袋里；第二类模型是推理模型，不仅能让数字人具有聪明的大脑，同时能够在已有的知识里推理出未知的语料，而这些语料并没有提前“喂”给数字人。

依托DeepSeek大模型的万亿级参数知识体系，“楚铁”和“楚音”就是训练出来的推理性模型，在复杂场景下，他们的意图理解与逻辑推理能力得到提升，能够化身“时空导游”，上下五千年文化，诗词歌赋无所不能。“它并没有一个固定的知识库和知识结构，而是根据你的提问来对自己现有的知识进行归纳总结，之后再继续扩展回答。”蔡新元说，这款动漫文物精灵能够实现文本、语音、表情、动作的秒级同步响应，不再有传统数字人那样“说话像背书”的机械感，它们能够根据上下文实时调整表情，自然反映语境中的情绪波动，在情感表达上也更加丰富，在与他们的对话中，能够感受到更多深度思考和自然温度。

（长江云新闻记者王宇汪佳睿唐清辉）

责任编辑王宇