Subly 指出,用 Facebook 观看视频时,有85%的视频是没有声音的,而那些有字幕的视频被完整观看的可能性高达80%。除此之外,全球约有4.66亿人患有听力障碍,占人类总人口的5%。而 Subly 推出的视频自动转录和字幕功能,也在一定程度上帮助了听障用户获取更多的信息渠道。
受COVID-19 新冠疫情影响,企业员工只能在家远程办公,学生也只能接受远程教学。在这个时候推出 Subly 是非常明智的,在隔离期间,公司的用户人数不断上升。

Subly 官网
Subly 的使用方法非常简单:只要在浏览器中上传视频,然后选择字幕语言,设置字幕样式,几秒钟就可以看到视频上的字幕了。Subly 可以识别多国语言,包括英语、法语、西班牙语、德语、葡萄牙语和意大利语等。在这个过程中,Subly 的字幕制作是对支持内容创作者免费开放的,公司还将于今年夏天推出更多功能,以进一步完善视频转录和编辑的过程。
自动字幕功能并不是最近才开始出现的,全球最大的UGC视频网站 YouTube 在2009年就已经开发了此项功能,开发这一功能的软件工程师肯·海伦斯坦是一位聋哑人士。这一功能的初衷和 Subly 一样,也是想通过将视频声音转化成文字字幕,为全世界有听力障碍的用户提供便利。目前,谷歌和 YouTube 团队还在利用机器学习为自动字幕增加音效信息,例如添加铃声、狗叫声和敲门声等音效字幕,改善用户的观看体验。
在自动制作字幕的赛道上,国内也有一些玩家。网易人工智能旗下的「网易见外」,曾于人人影视合作,以“AI翻译+人工精校”的模式向影视行业推广,用户每天有两小时免费使用额度,更多地是为制作短视频的博主服务。蜗牛派还曾报道过「画音」和「嘎嘎播」,分别将自动制作字幕的功能运用到了视频 IM 和教育行业中。
用户可以使用画音随时向好友发送“视频消息”,画音会自动帮视频配上字幕和表情,从而部分取代文字录入的交流方式。而启蒙英语教育短视频平台嘎嘎播,自主研发“处理字幕”的技术系统,来做高精度英文语音转录和多文件批处理以及实时转录,同时将音轨原声文本自动定位。

「网易见外」官网
免责声明:本文版权归原作者所有,文章系作者个人观点不代表蜗牛派立场,如若转载请联系原作者;本站仅提供信息存储空间服务,内容仅为传递更多信息之目的,如涉及作品内容、版权等其它问题都请联系kefu@woniupai.net反馈!
]]>不过,微信也不能避免的一个问题是:是否能满足新一代用户的需求,从而在代际迁移的浪潮中依旧屹立不倒?
此前曾在腾讯任职 8 年、完整经历了微信从诞生到月活用户过 10 亿历程的 Genie 认为,微信的崛起源于智能机 + 3G 网络的红利,语音的输入方式在某些场景下满足了用户更高效沟通的需求,不用痛苦的打字,且是最适合 3G 网速下的一种解决方案。
到了 5G 时代,社交工具很可能会随之改变,Genie 认为 “5G 网络 + 摄像头”,会逐渐替代“3G+文字/语音”,成为一种新的输入方式,从而催生新时代的社交工具。
因此,她 2017 年年底从腾讯离开创业,并于今天正式推出视频 IM 工具「画音」App。目前产品的 iOS 、安卓版本已于各应用市场上线(但需通过应用市场引导获得邀请码才可注册使用)。
作为一款视频 IM 工具,「画音」最大的特色在于:可以随时向好友发送“视频消息”,从而部分取代文字录入的交流方式。
这里的“视频消息”,并不是我们印象中的拍摄一段小视频、导入到好友对话界面发出,此种行为在 Genie 看来并不算视频消息,更像是在发送“视频文件” —— 一方面消息可能过大、加载速度慢,另一方面,用户要先用摄像头拍摄视频,再导入微信,操作繁琐。
为了将生产和消费“视频消息”的门槛降到最低,让视频沟通能做到像文字聊天一样简单,「画音」团队将视频的“收发读写”都在 IM 应用内进行了闭环(参见下图):

「画音」App 视频消息拍摄界面

「画音」App 读取视频消息界面
除了 IM 以外,「画音」还设计了“故事”模块,类似视频版的 QQ 空间,让用户以视频的方式记录自己的生活。

“故事”类似于视频版的 QQ 空间
从产品层面来看,基于视频来收发消息的产品形态,对用户而言最大的门槛在于:大家并不习惯“露脸”。对此,Genie 的解释是,「画音」本身是定位在让家人、密友之间拥有更好的沟通体验。
在工作场景中,微信上有着大量的商务、陌生人社交,导致用户不习惯于露脸,但 Genie 认为,在和最熟悉的人沟通时,露脸甚至能让彼此获得更好的体验,比如异地的父子、不常见的好友之间,如果能用视频消息的方式“看到”对方,更能拉近彼此的距离。
事实上,「画音」是 Genie 团队探索了 2 年的结果。最开始,这款产品的名字叫 Pop 而不是「画音」,形态也和现在完全不同。
“社交”是 Genie 团队最开始尝试的切入点。尽管她知道,IM 是一个比社交更有机会的市场(因为沟通是更底层、更高频的诉求),但是,最初从战略上公司还是选择了绕开 IM —— 因为微信是这条路上难以撼动的产品。
最开始,Pop 主推的是“故事”,即用类似视频版 QQ 空间的形态,让用户到这里分享生活、维持联系。由于采用了空间的形态,用户不会像在朋友圈中面临极大的社交压力,这是 Genie 一开始找到的机会点。
但尝试之后,团队发现,虽然空间的形态可以减少社交压力,不会有打扰别人,但这也增加了用户互动的“难度”。对于一个社交关系还未形成的平台来讲,很难形成冷启动的正循环,反而让用户感受到被冷落的氛围。
社交方向没走通,团队又将方向调整至“工具”,即做足够好用的视频编辑工具。但这一形态带来的问题是:即使工具足够好用,也很难从中长出社交关系 —— “用户会认为,工具很好用,我使用工具就好,为何要在这里社交?”Genie 说。
两个预想的切入点都没走通,最终团队才将切入点改回“聊天”,这个会和微信直面竞争的方向。
谈及如何看用户为何要从微信迁移到「画音」这样的信平台上?Genie 称,“我们不认为视频是一种需求,而是一种语言,只是过去人们被工具限制了,无法使用这种语言”。
在她看来,思考的角度不是如何满足微信没有满足的需求,而是如果视频将成为未来一种最基本的信息载体、人类最基础的沟通语言,在彼时的场景下,大家会用什么样的工具来沟通?团队至始至终的目标,都是找到这个解决方案。
接下来,公司将会在“摄像头+5G”的趋势下做更多探索,目前的“视频IM”只是第一步,解决了碎片化异步沟通的需求,而在实时沟通等场景下,还有更多探索的可能性。
团队方面,CEO & 创始⼈ GENIE LIN 是前微信产品总监、微信创始团队成员,负责微信基础,直接向腾讯高级副总裁张⼩⻰汇报。CTO & 创始⼈ Roy 先后在⼈人网、LeanCloud、微信、BearyChat(滴滴收购) 负责移动端开发,有多年创业经验,iOS / Android / 后端全栈。CPO & 创始⼈人 Remy Ho 担任前微信创新产品团队负责⼈,曾是独⽴ App 开发者,产品设计开发全栈。
此前,「画音」已获得贝塔斯曼亚洲投资基金 BAI 的投资,新一轮融资正在进行中。
免责声明:本文版权归原作者所有,文章系作者个人观点不代表蜗牛派立场,如若转载请联系原作者;本站仅提供信息存储空间服务,内容仅为传递更多信息之目的,如涉及作品内容、版权等其它问题都请联系kefu@woniupai.net反馈!
]]>