作者:三联生活周刊(微信公号)
01-07·阅读时长9分钟
“百年守护——从紫禁城到故宫博物院”展览期间,午门展厅几乎是故宫博物院里最受瞩目的地方。
《清明上河图》卷前,观众的队伍被一圈圈拉长。有人举着手机当放大镜,几乎是贴着玻璃寻找画中的桥洞或小贩;有人索性不拍照,只是站着,看一会儿,又慢慢挪开。
看画、看器物、看历史,“好东西”总是看不完的。展厅里,制作于春秋时期的青铜莲鹤方壶静立在展柜中。它与河南博物院收藏的另一件莲鹤方壶是一对“孪生兄弟”,1923年出土于河南新郑郑公大墓,现同属中国首批禁止出境展览文物。壶身之上,仙鹤昂首欲飞,双龙耳从器口垂至器腹,器表同时运用了圆雕、浅浮雕、细刻与焊接等多种工艺——懂行的观众,往往会在这些细节前多停留片刻,辨认工艺之间的差别。
图源:长歌行
密集的人群与静默的文物,这几乎是博物馆最常见的场景。只是,在故宫博物院建院一百周年的时间节点上,被赋予了更多象征意义。
百年展的名字“百年守护——从紫禁城到故宫博物院”,本身就暗示着一种变化:从皇权森严的禁宫,到属于公众的博物馆,守护并非静止不动,而是伴随时代不断调整姿态。
从近年来在社交网络上备受宠溺的“故宫猫”,到持续刷屏的故宫文创,再到关于“故宫如何年轻化”的反复讨论,人们已经敏锐感受到,在这座有着六百多年历史、百年院史的“城”里,“守护”这个词,正在发生一次意义深远的质变。
文物始终在场,观众却一代代更替。在当下,随着新的媒介不断出现,如何借助科技,让文物被更多人理解、被下一代重新认识,逐渐成为这场“守护”中绕不开的一部分。
从物质到价值
“守护”的时代演进
如果把时间拨回一百年前,故宫博物院最早面对的“守护”,是极其具体而残酷的。
文物南迁,是几乎每一个中国人都听说过的历史。彼时战火逼近,文物被装箱、编号,穿越战乱与动荡,辗转万里。那是一种近乎本能的守护——先保住它们的“存在”。
此后的几十年,文物被安置下来,修复成为日常。一代代文物修复专家在显微镜前、案台边,用极慢的速度与时间对抗。
莲鹤方壶的经历,几乎浓缩了这段复杂而漫长的过程。抗战时期,它随河南文物西迁,几经辗转,等到上世纪 50 年代调入故宫博物院,早已满身伤痕。专家们通过焊接耳朵、修补腹部参差不齐的裂口,再对修复处随色做旧,才总算让这尊重器,重新找回两千年前振翅欲飞的精气神。
2006年,故宫博物院专家王有亮正在修复莲鹤方壶
当修复体系逐渐成熟,学术研究不断深入,一个新的问题开始浮现:文物被保存下来了,但是否被真正理解、被持续地认识?随着社会的发展和公众文化需求的增长,包括故宫博物院在内的许多博物馆逐渐意识到,仅仅守护文物本体,并不足以完全释放这些文物与古建筑所承载的多重价值。如何将文物背后的历史信息、审美经验和文化意义,传递给更广泛的人群,成为新的课题。
正是在这样的背景下,“让文物活起来”成了近年来关于故宫博物院的一个高频词。从策展到教育活动,从文创产品到数字化内容,故宫开始主动寻找文物与当代生活之间的连接点。
今年中秋节上线的AIGC视频《故宫宝贝团圆夜》,便是一次有代表性的尝试。影片由故宫博物院与火山引擎合作完成,依托豆包视频生成模型与图像创作模型推出。围绕“中秋团圆”这一高度情感化的主题,让文物在中秋夜“苏醒”,以一种带着童趣的视觉效果,被重新看见。
到了“百年守护——从紫禁城到故宫博物院”展览的尾声,故宫博物院与火山引擎也再次携手,推出了更灵活的互动方式——「听宝贝说」AI互动播客,让线下的部分文物展览通过AI播客的形式,在线上得以延续。
与影像不同,「听宝贝说」选择从“声音”入手。它面向的并非专业研究者,而是亲子家庭和少年儿童群体。进入H5页面后,用户可以从30件文物中选择一件,只需对着手机跟读几句话,系统便会生成一段用户本人声线的文物讲解。生成的播客中,孩子可以扮演“小科普家”“小历史学家”等不同角色,也可以选择喜羊羊、熊大等动画角色的声音。
扫描右下方二维码或搜索故宫博物院小程序,即可进入AI播客
在具体的文物选择上,也经历了故宫方面的精心策划。30件文物横跨新石器时代至明清,既包括清明上河图卷、五牛图卷这样的“熟面孔”——也是“百年守护——从紫禁城到故宫博物院”展览现场观众关注的焦点;也包括更适合通过本次AI播客为小朋友“讲故事”的文物。
故宫博物院社会教育部主任吕晓刚提到,从故宫博物院190多万件藏品中选出这30件文物,并非简单的遴选,而是围绕项目本身面向儿童与亲子家庭的定位,反复权衡的结果:首先要有故事性和趣味性,让孩子愿意听、愿意讲;其次也要具备教育属性,能够承载历史纵深和正向的价值引导。
例如剔红百子宝盒,通体刻着一百个孩童的游戏场景,捉迷藏、放鞭炮、追逐嬉闹,不一而足。这些画面跨越时代,却并不陌生。今天的孩子听到这样的描述,很容易将自己的经验投射进去。文物不再是抽象的历史对象,而是一种可以被代入的生活片段。
「听宝贝说」中的剔红百子宝盒
又如掐丝珐琅嵌宝石缠枝莲纹多穆壶,它的价值不仅体现在工艺与装饰之上,更在于其背后所折射的文化交融。器型源自藏族和蒙古族人民的生活用具,工艺本由域外传来又早已内化为中国特色,艺术上则具有强烈的宫廷风格。一件器物,本身就是一段关于交流与吸纳的历史。
值得注意的是,在这30件文物中,有相当一部分本身就长期陈设在故宫博物院展厅中。吕晓刚提到,这种选择也是有意为之——当孩子在H5页面中听过、讲过一件文物,如果产生兴趣,完全可以在线下展厅中找到它的实体。这种线上体验与线下观看之间的衔接,让文物知识不再停留在单一媒介中。
出现在故宫博物院“百年守护——从紫禁城到故宫博物院”展览的掐丝珐琅嵌宝石缠枝莲纹多穆壶(中)
长久以来,博物馆教育常常是专业的、严谨的,但也容易显得遥远。在参与了本次AI播客制作的吕晓刚看来,AI在这里的作用,正是消解博物馆教育长期存在的疏离感,降低进入的门槛。“通过孩子熟悉的声音,无论是他自己的,还是爸爸妈妈的,甚至是动画人物的——去讲述文物故事,会让这些内容听起来更轻松、更亲切。”
最终,通过AI播客的形式,让原本容易被视为高深、学术的文物知识,被拆解成更容易被听进去、说出来的内容。
守护,也由此从对实体的保护,逐渐转向对理解与记忆的延续。
技术背后的敬畏
如果说「听宝贝说」在前端呈现的是轻松和趣味,那么在其背后,则是一套高度严密的技术流程。
对于火山引擎的技术团队来说,文物是一个极其特殊的应用场景。
火山引擎文旅行业总监宋博文在回顾项目时,反复提到一个词:敬畏。面对文物内容,技术团队不仅要解决“如何生成”,更要保证内容的严谨。
为了避免AI常见的“幻觉”问题,故宫方面为每一件文物都提供了由专家审核的一到两千字权威资料。这些文本本身严谨、密度高,但是儿童理解起来却有一定的门槛。接下来的工作,便是文本内容通俗化的过程:故宫专家先改写一轮,模型再改写一轮,双方不断比对、修正,最终形成可被模型学习的范式。
剔红百子宝盒的AI播客文本
在这一过程中,豆包大模型的语义理解能力发挥了关键作用。“它能够把控这个边界,哪些东西可以通俗化,哪些东西是不可以通俗化的,尤其是对于典故、文物知识,以及文物精确的材质、形状、工艺的介绍,那些特定词汇是不可以做大量改写的。”宋博文说道。
声音技术则是另一个挑战。「听宝贝说」所使用的豆包声音复刻模型2.0,具备在几秒录音样本中捕捉说话者情绪特征和语音风格的能力。从技术角度看,这已经足以实现高度相似的声音复刻。但在本次的AI播客中,“像不像”并不是唯一标准,更重要的是:这是不是一段适合给小朋友讲文物的声音。
宋博文提到,团队在测试阶段反复调整语速、语调和停顿方式。语气如果过于活泼,会削弱历史和文化本身的严肃性;如果过于平直,又容易让孩子失去兴趣和耐心。最终呈现出来的效果,是在亲切与准确之间不断试探后的结果。
除此之外,内容本身的情绪差异也需要兼顾。有些文物强调珍贵性,比如东珠朝珠,其产地、采集和使用都有严格规范,讲述时就需要传达出“珍贵”;而涉及礼仪和文化传承的器物,则需要一种略带敬畏的语气。
在技术层面,这意味着语音模型必须根据文本内容,自动调整语速、语调和情绪标签,而不是用同一种语气讲完所有故事。
除了对模型的训练,在整个项目中,细节上的“死磕”,也成了最耗时的部分。宋博文举了一个例子:《五牛图》卷相关内容中,“卷”字的读音究竟该如何处理。对于普通语境来说,这是一个极易被忽略的细节,但在文物讲述中,这样的差错意味着对专业的不尊重。
类似的情况还有很多。古诗文中“遗我双鲤鱼”的“遗(wèi)”,在现代汉语中并不常用其读作“wèi”时代表的“赠予”的含义,如果按照日常习惯处理,很容易造成误解。这些情况都需要火山引擎团队在生成内容时反复核对语境。
《五牛图》卷
在火山引擎团队看来,「听宝贝说」与普通的互联网产品最大的区别,在于价值取向上的不同。宋博文表示,“普通的互联网产品比较看重用户价值和效率,但是「听宝贝说」的本质是一个公益性的文化传播项目。”
正因如此,整个团队在文物选择、内容处理、模型推理和调试的每一个环节,都保持着高度谨慎。从这个意义上说,「听宝贝说」既是在行业上首次尝试文物AI的播客,也为未来如何让文物“开口说话”、做好文化传播,提供了一次可参考的实践经验。
AI播客里的亲子时间
与传统博物馆教育不同,「听宝贝说」并不是让孩子坐下来“听一段讲解”,而是邀请他们参与进来,成为讲述的一部分。
在H5页面的测试阶段,吕晓刚和宋博文都发现了一个细节,孩子们并不执着于更可爱的卡通音色,反而更愿意反复使用、调整自己的声音。一段播客往往会被录制好几次,直到他们觉得“满意”为止,然后迫不及待地分享给同学或家人。
这种分享行为,并非一开始就被设计出的传播策略,却反过来影响了产品形态。火山引擎随即在「听宝贝说」中开放了更多音色复刻的可能性:除了孩子本人,还可以录入父母、祖父母的声音,甚至是兄弟姐妹、同学的声音;同时,通过分享解锁新的音色角色,让“讲文物”这件事,从一个人的体验,变成家庭乃至同伴之间的互动。
在吕晓刚看来,这正是博物馆教育中难得的积极信号。传统的教育模式,往往是由专业者讲述、孩子聆听,而在「听宝贝说」中,叙述的主角发生了转移——孩子成为讲述者,用第一人称去说“我是谁”“我从哪里来”“我经历过什么”。这种角色转换,本身就是学习的开始。
这种变化,也为亲子关系提供了一个新的连接点。《听宝贝说》并不要求家长具备专业的文博知识,也不试图用AI替代陪伴。相反,它为忙碌的家庭提供了一个共同进入文物话题的入口——在节假日,在参观前后,家长和孩子可以围绕同一件文物,聊起时间、历史与记忆。
在这一段段由AI生成的播客中,六百年的厚重历史,被妥帖地嵌入一个现代家庭的日常生活。也让“守护”这件事,在亲昵的对话中,化作一种流动的情感纽带。
尾声
百年之后,故宫博物院不再只是被仰望的象征。通过AI技术,它开始学习如何与观众交流,尤其是下一代的声音。
从中秋节期间的视觉共创《故宫宝贝团圆夜》,到如今强调交互深度的「听宝贝说」AI播客,故宫博物院与火山引擎在合作中逐渐形成了一种默契:由博物馆提供权威内容,由技术团队负责转译与实现,最终,为AI技术进入文博垂直领域,梳理出一套可供参照的范式。
这种探索也正通过火山引擎,向更广阔的文化领域延伸:通过模型参与古籍的校对与异体字识别,与北京大学联合研发“识典古籍”平台,已开放超3万部古籍;打造首个非遗数字人“非非”,在国际非遗文化节与北京非遗周上,充当活动指引、非遗知识问答的角色;此外,火山引擎也正在与一批博物馆打造属于博物馆的AI讲解员,通过豆包大模型的自然语言处理与多模态能力,让大家拿着手机就能把博物馆“逛明白”。
2022年10月,识典古籍数据库开始完全对外免费开放
或许,这正是当下最具体的“守护”方式之一。
AI的加入,正在让博物馆中厚重的遗产,在数字时代拥有了向前的“生命力”,它不仅守护文物本身,更让其背后的历史、审美与文化意义被触达和传递,用一种更有温度、更具想象空间的方式,实现对文化遗产最长久的守护。
策划丨三联.CREATIVE
编辑 排版丨孙宏
作者丨梅卡
图片来源丨故宫博物院、火山引擎、视觉中国
*文章版权归《三联生活周刊》所有
欢迎转发到朋友圈,转载请联系后台

发表文章522篇 获得0个推荐 粉丝6671人
三联生活周刊微信公号
现在下载APP,注册有红包哦!
三联生活周刊官方APP,你想看的都在这里