最近,一款名叫Pokémon Go的游戏成为了全球新闻和社交媒体热话:这款游戏让卡通精灵宝可梦(Pokémon,旧译‘神奇宝贝’)“出现”在了现实生活中的各个角落,玩家可以通过手机屏幕“抓捕”小精灵。这体验不容易用二维文字描述,总之,它吸引了大批狂热粉丝在现实空间中,东奔西跑“捉精灵”……有人因此被车撞到,有人跌下桥梁,有人宣布辞去工作做全职“精灵捕手”,在游戏还未上线的地区,很多人“翻墙”到美国加州过把瘾。
Pokémon Go让许多人第一次真切地体会到什么叫AR──Augmented Reality,中文译为“增强现实”,或者“扩增实境”。虚拟与现实的界线,经由这款火爆的游戏,在手机屏幕上打开了一个缺口。而这才是刚刚开始。 AR、VR(Virtual Reality,虚拟现实)、AI(Artificial Intelligence,人工智能),这些以前听来仍然陌生的技术术语,如今都变成流行词。它们不仅正在重塑超人气手游,还在改变日常媒介中的多种互动。
6月15日,一年一度的全球编辑网络(Global Editors Network)峰会在维也纳召开,这一峰会除了是全球的600多名媒体高管的重要社交场合之外,还着力通过各种比赛与奖项,鼓励人们对媒体的全新想象与定义。来自世界各地的诸多参赛队伍参加了国际数字媒体创新大赛(Editors Lab)和为新闻服务的创业公司(Startup For News)展示大赛,会上还颁发了数据新闻奖(Data Journalism Awards)。他们有些是创业公司,有些则是老牌媒体,但都带着各种工具发明、创新设计,试图改写媒体的各种旧有习惯。笔者有幸在现场,记录下那些让人眼前一亮的创新时刻。
Trint:终结记者听打录音的时代
记者的背囊里,笔记本变成电脑,手写笔变成录音笔或者智能手机,但对于入行超过30年、做过中东战地记者的加拿大电视新闻人Jeff Kofman来说,最头痛却难以解决的,还是视频音频转录为文字的费时费力。
2014年,Jeff在伦敦遇到了资深程序员Mark Boas,Mark的团队当时在研究将视频/语言同步转录为文字的技术,当年年底,在意大利佛罗伦萨一间AirBnB公寓里,Jeff、Mark和另外两位程序员成立了Trint。一年半之后,这个转录工具夺得了今年全球编辑网络峰会上创业大赛的冠军。
Trint是目前市场上唯一一款支持视频转录成文字的软件,它利用机器学习,识别视频和音频内容,而且转换速度相当高,以一条长约7分钟的视频为例,上传到Trint平台只需要两三分钟,大约15分钟之后,文字转录完成的通知邮件就会发到用户的邮箱中。
Jeff指出,Trint的语音识别率高达98%。不过对记者来说,即便是2%的错误率,那也可能是致命的错误。 Trint的另一大亮点,就是方便记者修改、搜索比对,以及进行线上团队作业。用户选中特定文字时,相应的音频文件也会被选取,并显示选中段的播放时间。用户可以反复收听该片段,不需要的段落,可以划掉,视频在播放时则会自动跳过被划掉的片段。 Trint还允许采编团队对转录文字进行线上作业,不同成员,如“编辑”“记者”,都可以修改文本。
在维也纳峰会召开前不久,Trint增加了新功能,给视频一键添加字幕:用户选取了特定文字段落之后,选择“导出视频”,相关的视频片段就会被下载,并自动添加相应的字幕。用户也可以单独导出字幕。
目前Trint目前支持英语(英式、澳大利亚和北美口音)和西班牙语。新出的测试版支持德语和法语识别。用户可以注册账号,免费转录一小时时长的多媒体素材。
Valossa:视频也可以深度搜索了
有没有遇到过这样的时刻:你记得看过一个电影片段,令你印象深刻,但你怎么也想不起来电影的具体名字或者演员是什么,你想要在茫茫网海里找到全片来重温,怎么办?
创业公司Valossa试图解决这个问题,他们的办法是:让视频变得能够被智能读取,进而能够被文字搜索。
这个来自芬兰奥卢大学(University of Oulu)的研究团队,基于在大学里5年的研究成果,在2015年推出了视频内容认知识别系统,利用人工智能,通过机器深度分析视频中出现的人、物件、对话内容、人物的表情,进行比对识别,将其自动转换为元数据,添加标签,这样用户就可以对视频内容进行文字搜索。
他们用这个系统,分析了13万部从1900年一直到2015年上半年全球上映的电影,开发了一个叫Whatismymovie.com的电影资料库。在这个资料库中,用户可以通过文字描述,搜索想看的内容。譬如搜索引擎提示,你可以搜索“肖恩.康纳利演的邦德电影”或者“日本武士的冒险片”。笔者尝试了一些更复杂的搜索,如“父母双亡的超级英雄”,搜索结果出现了有父母双亡情节的《死侍》(Deadpool)、《蜘蛛侠》(Spider-Man)和《美国队长》(Captain America),不过,也有搜索结果并不准确,譬如爱情喜剧的《一日钟情》(One Fine Day)和《V字仇杀队》(V For Vendetta)。
目前该资料库只支持英语搜索,Valossa网站也明确表示搜索还在不断完善中。每个搜索结果旁边设有两个反馈按钮,一个是绿色大拇指的“找得对”(good match),一个是红色倒竖大拇指的“找错了”(bad match),用户可以通过这样的简易反馈,帮助引擎提升准确度。
这一对视频智能识别的系统,不仅有利用户,同样也方便包括新闻在内的视频内容生产者。观众在看什么?观众喜欢看什么?他们可以对视频内容进行标签,分析趋势,精准地找出用户的浏览喜好,制作更适合用户口味的视频。它获得了今年峰会中创业大赛的“特别提名”。
360度全景摄影机 更“平价”的虚拟新闻现场
除了Trint和Valossa,其它进入创业大赛决赛的队伍也推出了多种“新闻神器”,譬如抓取公开的公司和法庭文件资料,聚合成资料库,方便记者搜索;利用照相和定位功能,帮助媒体迅速识别新闻现场照片的真伪……
从现场连线、动画复原到网络直播,新闻报导一直追求带给读者最好的“现场感”,但有什么比直接把读者“送到”新闻现场更有现场感呢?此次大会专门设置了虚拟现实(VR)展示厅,探索VR可以把读者带到多远、把现场带到多近。
BBC等媒体展示了用VR技术制作的视频影像。观众戴上VR眼镜之后就可以与救援队一起,飞车前往遭遇轰炸的叙利亚村庄;或者坐在历经万难的难民们身边,听他们聊天,讲述自己的遭遇。
这些通过VR技术呈现出来的新闻内容让读者身临其境。它们有些是通过电脑模拟动画制成,有些是通过六个Go Pro捆绑而成的360摄像机拍摄,再由团队剪辑。无论是哪一种,单是购买一套全景相机耗资就起码以万港元计,而且拼接视频的过程繁杂耗时,制作经费不菲,目前更多都是专业团队或公司使用。
不过随着脸书和Youtube都开始支持全景影像,专业相机生产商也纷纷进军VR领域、生产万元以下的全景摄影工具,无论是成本还是技术,VR影像的拍摄和制作的门槛都在降低, “平民化”是必然趋势。
譬如柯达今年推出了PIXPRO SP360 4K虚拟现实运动摄像机,但如果需要拍摄360度,需要购买两个,绑定双机器拍摄。双镜套装价格为6500港币左右。理光的全景视角相机Theta S虽然支持360度全景拍摄,而且价格便宜,不到3000港币。但无法拍摄4K视频,只支持全高清(1920X1080像素),拍摄全景照片效果尚可,但全景视频不太清晰。尼康准备推出的4K 360运动全景相机是由两个180度镜头组成,具有防水功能,备受瞩目,但发布日期一直迟迟未定。
在大会上,以色列的3D硬件制造商HumanEyes Technologies展示了一款叫Vuze的360度全景摄影机,约在今年10月送到客户手上,预售价大概在6000多港币。机器主体是一个比Apple TV大一些的盒子状摄影机,四个方位分别有两个4K超高清摄像头。摄影机可以连上脚架。拍摄完毕之后,可以将视频导到Vuze专门的软件,进行剪辑。目前Vuze的官网上已经有样片可供观看。
未来:不好玩不潮流
机器代替人工写稿、以自然语言搜索影音内容、沉浸式体验全景新闻现场......这些都已经成为现实,只不过还只停留在少数媒体的试验场中,还有许多细节需要改进。随着技术的催化、读者需求随着体验而提升,未来,“身临其境”的“好看”已经不足以让媒体决胜市场,Pokémon Go的爆红似乎预示着,在虚拟新闻现场与增强现实之间来去自如的受众参与和互动──好玩──才是人气的关键。在维也纳的峰会上,近5、6年间兴起的“新闻游戏”概念再一次成为了全球网络编辑们的讨论热点。
新闻可以有多“好玩”?笔者结合大会讲者推荐和自己的体验推荐一下10款新闻游戏:
- 《请出示文件》(Papers, Please)
- 《纪念碑谷》(Monument Valley)
- 《史丹利的寓言》(The Stanley Parable)
- 《末日如何对爱侣》(Queers in Love at The End of the World)
- 《多边形的故事》(Parable of the Polygons)
- 《小小世界》(Days of Wonder: Small World)
- 《偷渔》(Pirate Fishing)
- 《急诊人生》(Daily Life of the Emergency Room)
- 《绿色救星:阻止霾害》(Green Savior Stop the Haze)
- 《发生命案了》
作者为香港大学新闻及传媒研究中心研究员
读者评论 0