请问有没有 AI 可以线上辨识被消音的人声视频(视频读唇)的服务? 我是有看到几个 github 项目,但是有没有已经可以实际运行的?
(原由是我拍了一些访问视频,麦克风出问题,全部被消音,只看到人说话嘴在动)
1
passive 252 天前 via Android
这个太科幻了。要是可行,架一台普通相机都能收听对面楼里的开会内容了。
之前有过高速相机拍摄薯片袋震动还原声音的,人家好歹采样率能跟上。 |
2
jstony 252 天前
如果有足够的样本数据用于训练,我猜测是有可能的。实际上好像没有这样的数据,所以是不可行的。
|
3
junan 252 天前
要不找人读唇语,然后重新配音?
|
4
ceeeeeeeeeeeeeeb 252 天前
加上读舌还差不多
|
5
hanqian 252 天前 via iPhone
读唇没有那么魔幻,效果很有限
|