020羊城论坛

标题: AI修复100年前北京生活影像,看完你想穿越吗? [打印本页]

作者: 周k呀    时间: 2020-5-11 06:41
标题: AI修复100年前北京生活影像,看完你想穿越吗?
十三 发自 凹非寺量子位 报道 | 公众号 QbitAI
百年前的北京是什么样子?
最近,一位叫大谷 Spitzer 的微博网友,便利用 AI 技术,将人民日报 4 年前发布的 1920 年北京黑白影像资料,做了修复工作:完成了上色、修复帧率、扩大分辨率等步骤。
[attach]45598[/attach]

如此工作满足了大批网友的好奇心,视频一经发布便得到了大量的关注:分享超过 12 万次、评论 3 万 +、点赞 5 万 +。
[attach]45599[/attach]

有网友评论到:
视频里人怎么也想象不到,一百年后会有一个人躺在床上拿着一个神奇的物品能够观察到他们当时的一举一动吧。科学和巫术果然就是一线之隔。
还有网友赞叹道:
Wow~ 一百年前的 vlog。不是概念的,宏观的,文字的,被描述的,被审视的。完全打破我的模糊想象,被触动了。
当然,还有感慨二环不堵了的……
[attach]45600[/attach]

话不多说,一起来体验下吧。
时光旅行,体验 100 年前的北京生活
1920 年的北京,入城出城的 " 客流 " 还算较多,有骑马的、有坐轿子的、有坐人力车的,当然多数人还是步行。
[attach]45601[/attach]

而在城内集市中,也是熙熙攘攘,好不热闹。当然,在那个年代,人们应该是对录影设备感到非常新奇了,图中的小哥驻足了良久,痴痴的看着镜头。
[attach]45602[/attach]

路边街头的小吃生意也是不错 ( 看完想来一屉小笼包了…… ) 。
[attach]45603[/attach]

寺庙里烧香拜佛的人们络绎不绝,当时的香火可比现在要鼎盛啊。
但细心的网友也发现:除了寺庙,在大街上很少看见女人。
[attach]45604[/attach]

再来到巷子里的百姓生活:小孩买了吃的蹲坐在别人家门口,然后被赶走了……
[attach]45605[/attach]

还有熟人见面鞠躬打招呼的场景。
[attach]45606[/attach]

[attach]45607[/attach]

可以看到男女打招呼的方式还是有些区别。网友对此还调侃道:萝卜蹲?
[attach]45608[/attach]

还有网友表示:真是百年巨变,没想到一百年前这么懂礼节。
当然,还有网友表示:100 年了,狗狗长得还是一样的……
[attach]45609[/attach]

最后,让我们一起来俯瞰百年前的北京城。
[attach]45610[/attach]

AI 修复百年古董老电影
虽然博主大谷 Spitzer 没有介绍具体采用了哪些 AI 技术,但其实修复老电影的工作也有许多。
今年 2 月,我们报道了国外网友 Denis Shiryaev 利用一种增强程序 ( Gigapixel AI ) ,将 1896 年的古董电影《火车进站》,转变成了 4K 60fps 高清 " 大电影 "。
[attach]45611[/attach]

在修复帧率方面,主要采用的技术是 AI 插值。
据 Shiryaev 介绍,他采用的是一种叫做 Gigapixel AI 的商业图像编辑软件 ( 付费 ) 。这款软件由 Topaz 实验室创造,可以让图像的质量提升 600%。
[attach]45612[/attach]

它利用一种专有的插值算法,对图像做分析、识别其细节和结构,最后将额外的 " 信息 " 填充到图像中。
这个工作量是什么概念?
普通的高清是 1920 × 1080,总像素为 2073600,而 4K 高清是 3840x2160,总像素是 8294400。
也就是说,光是要把普通高清提升到 4K 高清,就需要额外填充 600 万个像素。
不仅如此,还需要弄清楚如何显示这些额外的像素,这就是插值过程的用武之地。
插值估计每个新像素要显示什么内容,这个过程是基于它们周边的像素。对于这一点,有许多方法可以来衡量。
最近邻 ( Nearest Neighbor ) 方法,会简单地用与其最近邻相同的颜色填充空白像素。它虽然简单而有效,但结果是一个锯齿状、明显像素化的图像。
[attach]45613[/attach]

双线性插值 ( Bilinear Interpolation ) 方法需要更多的处理能力,但它基于最近的两个像素来分析空白像素,并在它们之间生成一个梯度,这会让图像变得更加清晰。
[attach]45614[/attach]

而双三次插值 ( Bicubic Interpolation ) 会对其 16 个最近邻像素进行了采样,这样就会让着色变得精确,但仍然存在图像模糊的问题。
[attach]45615[/attach]

通过结合双线性插值和双三次插值,就可以生成光学质量损失最小的放大图像。
而这一过程,Gigapixel AI 利用深度卷积神经网络来完成。
解决了像素低的问题,还需要解决视频卡顿问题。
Gigapixel AI 在关键帧之间进行 " 想像 " 之后,把这些想像出来的帧插进去。
而它插入的帧数多到可以让视频速率提高到 60 FPS。
这就是古董电影也能变得如此清晰、流畅的原因。
至于着色工作,同样是利用神经网络,从一堆彩色照片开始,将它们转换成黑色和白色,然后再重建彩色原图。
奉上完整视频,你想穿越吗?
最后,我们奉上大谷 Spitzer 的完整视频,里面还在各个场景中配上了背景音乐。
如此的场景,令不少网友想起老舍先生《想北平》中的一段话:
我所爱的北平不是枝枝节节的一些什么,而是整个儿与我的心灵相黏合的一段历史,一大块地方,多少风景名胜,从雨后什刹海的蜻蜓一直到我梦里的玉泉山的塔影,都积凑到一块,每一小的事件中有个我,我的每一思念中有个北平,这只有说不出而已。
那么,在看到百年前栩栩如生的生活状态,你会有想穿越回去的冲动吗?
快来评论区写下你的感受吧 ~
参考链接:
http://weibo.com/2395607675/J0ZsQnP6a?filter=hot&root_comment_id=4502616270201172&type=comment
http://arstechnica.com/science/2020/02/someone-used-neural-networks-to-upscale-a-famous-1896-video-to-4k-quality/




欢迎光临 020羊城论坛 (http://www.020.sh.cn/) Powered by Discuz! X3.2