首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX 提问指南
广告
V2EX
›
问与答
如何编写一个通用的视频搜索引擎?
dingyaguang117
·
2013-06-24 11:23:50 +08:00
· 2336 次点击
这是一个创建于 4020 天前的主题,其中的信息可能已经有所发展或是发生改变。
所谓“通用”就是可以抽取不同网站,不同结构页面的视频信息(标题,截图,描述,剧集播放页列表)。
我想知道百度视频搜索是怎么做到的?难道是针对各大视频网站的不同页面的结构编写不同的抽取程序吗?不然是怎么做到精准的信息抽取的。
视频
抽取
页面
3 条回复
•
1970-01-01 08:00:00 +08:00
1
luikore
2013-06-24 11:32:44 +08:00
在人力资源丰富的国度, 思路就是这样:
招 100 个程序员, 针对数据量前 100 的视频网站写不同的抽取
招 1000 个运营, 手工录入 100 以后的视频网站上的信息
2
dingyaguang117
OP
2013-06-24 11:43:30 +08:00
@
luikore
= =那百度视频,快手看片等等 都是这么做的吗?
3
jjplay
2013-06-24 12:12:50 +08:00
百度视频 都是第一索引自己的站 爱奇异 -> 百度影音 -> 奇热 ,优酷 土豆 ..... 前面自己站数据调用,后面大站肯定都是战略合作,毕竟谁都想和百度合作 引流巨大 不就是钱么,最后面应该是自己的算法识别 和一定的人工,差不多这样吧,百度视频
soku.com
都有递交视频的规范 当然收录几率几无
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
1057 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 25ms ·
UTC 22:35
·
PVG 06:35
·
LAX 15:35
·
JFK 18:35
Developed with
CodeLauncher
♥ Do have faith in what you're doing.