AI 研究所 | 奥运记录、经典老片鲜活重现!AI 如何为影像“上色” 焕新?
2025-08-09 18:01:17 阅览:324
【导语】1952年,中国奥运代表团首次亮相赫尔辛基奥运会,这一历史时刻虽以黑白影像留存,却成为国人心中珍贵的记忆。随着AI技术的飞速发展,这一经典瞬间在“2024中国·AI盛典”上以彩(cǎi)色(sè)4K画(huà)质重现,栩栩如生。AI技术不仅让历史穿越时空,更在经典影视作(zuò)品(pǐn)修(xiū)复(fù)中展现出巨大潜力,助力文化传承与发(fā)展(zhǎn)。本(běn)文将探讨AI技术(shù)如(rú)何(hé)助(zhù)力(lì)经典影像修复,以及面临的挑战与未来展望。

1952年,新中国成立不到三年之时,第一次受邀参加奥运会。当中国奥运代表团几经波折抵达赫尔辛基后,他们做的第(dì)一(yī)件(jiàn)事(shì),便(biàn)是在奥运村升起五星红旗。这一珍贵的历史时刻通过影像得以记录、保存,成了见证我国开启奥运之路的珍贵回忆。然而,囿于当时的技术条件,原始版本的影像只能以黑白形式留存。随着人工智能(AI)技术的快速发展,在“2024中国·AI盛典”上,我们(men)得(de)以(yǐ)看(kàn)到(dào)这(zhè)一(yī)珍贵时刻的彩色影像,栩栩如生、生动再现,每个动作、每张笑脸,仿佛一下把我们拉回到了当时的场景。
让历史穿越(yuè)时(shí)空(kōng)
在《1952奥运》视频中,当鲜艳的五星红旗高高扬起,当年轻的笑脸清晰重现,AI技术让这一振奋人心的伟大时刻,穿越时空再一次栩栩如生地展现在我们面前。
“很多珍贵经典影像受到当时拍摄条件、保存条件的限制,存在划痕、霉斑、分辨率不足等问题,不符合当前观影的质量要求。传统人工+工具的修复方法一方面效率低下,另一方面质量达不到要求。”陶竹林表示。
AI技术的快速发展为这一问题提供了新的“解”。
通过深度学习与智能算法,AI技术为高质量、高效率的经典影像修复提供了可能。结合画质智能增强、色彩还原、音频同步修复等手段,AI技术能够助力经(jīng)典(diǎn)影(yǐng)像焕然一新。
在中央广播电视总台音像资料馆主导推进的“智能影像修复任务(wu)”中(zhōng),陶(táo)竹(zhú)林(lín)团(tuán)队(duì)与(yǔ)南京理工大学唐金辉团队合作参与了多项经典影像修复工作,《1952奥运》视频便是其中浓墨重彩的一笔。
“修复过程包括图像修复、图像上色、视频增强等阶段,最终实现了图像和视频质量的极大提升。”陶竹林的博士研究生翟艳介绍道。
具体而言,在图像修复阶段,针对老旧黑白图像中普遍存在的噪声、划痕及脏点问题,采用先进图像复原技术完成了图像的去噪、去划痕和脏点处理,有效提升了图像的清晰度和结构的完整性。
在图像上色阶段,基于图像修复基础,引入自动上色方法对图像进行初步着色,并通过人工优化,修复色彩不准确、边缘溢色等问题,最终实现真实感(gǎn)强(qiáng)、视(shì)觉(jué)效(xiào)果(guǒ)自(zì)然(rán)的(de)彩(cǎi)色(sè)图(tú)像(xiàng)生(shēng)成(chéng)。
在(zài)视(shì)频(pín)增(zēng)强(qiáng)阶(jiē)段(duàn),首(shǒu)先(xiān)基(jī)于(yú)上(shàng)色(sè)后(hòu)的(de)首(shǒu)尾(wěi)帧(zhèng)图(tú)像(xiàng),通(tōng)过(guò)颜(yán)色(sè)传(chuán)播(bō)方(fāng)法(fǎ)实(shí)现(xiàn)整(zhěng)段(duàn)视(shì)频(pín)的(de)自(zì)动(dòng)上(shàng)色(sè),确(què)保(bǎo)颜(yán)色(sè)在(zài)时(shí)间(jiān)维(wéi)度(dù)上(shàng)的(de)连(lián)续(xù)性(xìng)和(hé)一(yī)致性。随后采用深度学习方法完成视频的超分辨率重建,提升视频整体清晰度,从而实现完整视频的视觉增强。
“通过上述策略和方法,我们有效地在动态视频场景中实现了颜色的连续追踪与准确匹配,确保如旗帜飘动、人物行进等变化过程的色彩保持一致;同时,实现了特定区域的定向上色处理,满足对重要物体或场景的个性化修复需求,带来了更高的还原度与艺术表现力。”陶竹林介绍道。
让优秀文化鲜活留存
除再现重要历史时刻,AI技术还能助力经典影视作品活力焕新。“四大名著”是我国文学史中的经典作品,也是世界宝贵的文化遗产之一。根据“四大名著”改编的经典影视作品不胜枚举,从20世纪80年代一直跨越至今。
这些经典的影视作品成为一代又一代人的难忘记忆,也成为世界了解中国文化的重要窗口。然而,随着拍摄技术的不断精进,以及荧幕分辨率的逐渐提升,很多经典影像显得“格格不入”,无法满足当今高质量的观影要求。
如何让经典影像跟上时代的脚步,更好地实现文化传承与发展?AI技术给出了答案。
“AI助力经典影像修复的具体步骤包括总结分析、模型搭建、数据训练、实际修复等几个阶段”,翟艳介绍。
操作过程中,首先需要对影像中常见的退化问题进行系统性总结,包括图像噪声、划痕、模糊和分辨率低等。接着,基于这些分析构建模拟真实退化过程的退化模型,为后续训练提供有效的数据支撑。在此基础上,调研当前主流图像修复技术,优选基于扩散模型的图像生成方法,并结合所构建的退化数据,对模型进行有针对性的重新训练,从而更好地适应经典影像的修复需求。
“比如,图像修复环节主要采用扩散模型去除噪声和划痕,并结合超分辨率重建技术提升图像清晰度与细节表现力。在视频修复方面,则引入结合运动特征的扩散模型,有效处理视频中不同帧之间变化带来的时序不一致问题,同时实现去噪与划痕修复;在此基础上,根据修复目标,进一步集成上色算法与分辨率增强模型,实现视频在视觉效果与色彩层次上的整体提升。”陶竹林补充道。
团队正在参与开展的“四大名著”修复工作便为经典影像的清晰重现提供了解决方案。
以《西游记》为例,为实现影像整体视觉质量的提升,团队针对不同类型片段的结构特征,设计并实现了一套差异化的视频修复策略。
具体而言,将影像拆分成以背景(jǐng)场(chǎng)景(jǐng)为(wèi)主和(hé)以(yǐ)人(rén)物(wù)面(miàn)部(bù)细(xì)节(jié)为(wèi)主的(de)视(shì)频(pín)片(piàn)段(duàn),采取(qǔ)差(chà)异(yì)化(huà)的(de)修(xiū)复(fù)策(cè)略(è),更(gèng)好(hǎo)地(de)满(mǎn)足(zú)不(bù)同(tóng)的(de)修(xiū)复需求。
对于以背景场景为主的视频片段,重点关注帧间时序一致性,通过对连续帧之间的变化规律进行建模,实现画面在运动状态下的稳定还原,有效避免闪烁与结构漂移问题;而对于以人物面部细节为主的片段,则侧重于提升图像的纹理细节和真实感,使修复结果在视觉上更具表现力。
此外,“为了进一步改善整体修复效果,我们对视频内容进行分段处理,并结合片段拼接与融合技术,有效解决了统一模型难以兼顾不同片段特征的问题,确保整段视频在风格与质量上的一致(zhì)性(xìng)。”陶竹林补充道。
在AI大模型技术快速发展的背景下,团队还据此整理并建立了面向特定历史影视作品的近景图像数据集,为(wèi)模(mó)型(xíng)训练提供了极具代表性的训练样本。
让红色基因得以传承
经典影视作品还承载着传承优秀文化,赓续红色精神的重要使命,其中,20世纪60年代的经典电影作品《雷锋》便是这样一部激励一代又一代人成长的杰出作品。
原版影片以黑白方式呈(chéng)现,而经过AI修复后的彩色4K版影片,更好地还原了当时的场景与人物细节,目前已经在多个地方点映。
在修复过程中,团队采取了简单镜头与复杂镜头差异化的修复方案。“在部分简单镜头的处理中,针对自然景物、读书看报等静态场景,采用常规图像上色算法即可实现较高质量的着色,实现边缘过渡自然、无明显色彩异常的稳定效果。”翟艳介绍道,“而针对复杂镜头,普通上色方法却容易出现颜色漂移、边界溢色等问题。”
对此,对于光线昏暗、室内结构复杂、人物较多或场景发生渐变的镜头,团队创新提出对每一段片段提取关键帧进行精细化上色处理的方法,同时,结合帧间插值技术提升时序一致性,有效缓解了错上色与漏色现象,实现了整体视觉效果的显著提升。
修复过程中的另一个难点,则是如何处理人物快速运动或人物数量众多等高动态镜头。“我们在增加关键帧数量的基础上,引入了人工修复机制,对易被忽略的细节区域(如快速移动的人物轮廓、遮挡区域)进行手动精修,确保色彩还原的准确性与视觉自然度。”陶竹林介绍。
AI助力经典影像修复
仍存在诸多难点
“合理利用AI技术,不但可以让大家重温经典,接受爱国主义教育熏陶,还可以更好地传承中华优秀文化,增强文化自信。”陶竹林表示。然而,尽管AI助力经典影像修复已经实现了显著发展,但仍面临诸多挑战。
比如模型的泛化能力不足。当前模型大多依赖人工设计或理想化的退化模拟,难以全面覆盖经典影像的真实退化情况,导致在实际应用中泛化能力不足。效率和精度的平衡问题同样凸显。对于高分辨率图像的修复需要处理大量数据,对计算资源提出了很高的要求。此外,还面临AI大模型快速发展的通用问题,数据获取难度大。高质量的训练数据集对于基于深度学习的方法尤为重要,但获取大规模、标注精确的数据并非易事。
对此,陶竹林认为,影像修复领域未来将在作用机制、数据训练、技术融合等方面实现进一步发展。就作用机制而言,深度学习应与传统修复方法相结合,各自发挥优势;同时,针对不同用户需求和场景特点的个性化修复解决方案也尤为重要。就数据训练而言,应引入大规模真实退化影像数据,进一步提升AI模型对于复杂退化的适应性和泛化能力。就技术融合而言,借助大数据与云计算,能够更高效地处理大规模影像数据,从而实现修复效果的进一步提升。
采访专家:陶竹林(中国传媒大学人工智能系副(fù)教(jiào)授(shòu))
撰(zhuàn)文:记(jì)者(zhě) 贾(jiǎ)朔(shuò)荣(róng)
编(biān)辑(ji):段(duàn)大(dà)卫(wèi)
