V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  phpfpm  ›  全部回复第 22 页 / 共 27 页
回复总数  526
1 ... 14  15  16  17  18  19  20  21  22  23 ... 27  
有一个网站,叫啥来着

反正得稍微花点钱,不多,几十一百,然后买一张蓝色的小票票,然后,跑吧
2020-05-14 13:26:51 +08:00
回复了 jerrodpoole 创建的主题 分享创造 这个服务器监控微信小程序,有点意思
所以你 dom 是怎么写的?
```

<img src="http://foo.bar.com/hint.svg" bindload="foo">
```
这样吗?这样的图片能被加载出来吗?

换句话说直接显示这样的图片不行吗
2020-05-14 11:50:13 +08:00
回复了 phpfpm 创建的主题 问与答 每天早晨 mysql 8.0 被关闭一次,不知道为啥
@keepeye 没有 crontab

@fancy111 emm howto ?
@ohao
@dolphintwo 每天时间还不一样

我决定背锅。

mysql 每天定时都有备份,我选择重装机器。
这台机器装的是 19.04desktop 升级上来的本来就比较个性

回头直接重装 20.04 server
2020-05-14 11:27:26 +08:00
回复了 phpfpm 创建的主题 问与答 每天早晨 mysql 8.0 被关闭一次,不知道为啥
@nutting 不是虚拟机,物理机。
2020-05-13 16:56:52 +08:00
回复了 phpfpm 创建的主题 问与答 有没有什么开箱即用的人脸识别数据库?
@sadfQED2 我能贪心一些,求打包好的 docker 。。。
2020-05-12 08:54:53 +08:00
回复了 phpfpm 创建的主题 问与答 有没有什么开箱即用的人脸识别数据库?
@askfermi cooool,我只看了 demo 文档没看到这个方法,回头我试一下。
问下这个吃显卡么,还是 cpu 好点就行。

暂时还没有对外使用的想法,还是想把存量的数据分类清楚。
@miao666 百度云的话,我的图敏感度偏高,怕被喝茶。
2020-05-11 22:46:52 +08:00
回复了 phpfpm 创建的主题 问与答 有没有什么开箱即用的人脸识别数据库?
@askfermi emm 是不错,但是感觉解决的是框出来人脸&与已有的比对,互相之间比对还是要靠炼丹了么。。
2020-04-30 17:38:04 +08:00
回复了 Cielos 创建的主题 JavaScript 菜鸟发问!在 for 循环里写 (a == -1) && break; 会报错是咋回事?
看了你的头像,我发出了沉思:可能你入错行了。。
2020-04-29 14:34:00 +08:00
回复了 phpfpm 创建的主题 问与答 百万级图像抓取去重存档技术方案
@rrfeng 按照我现在的硬件这个查询效率我觉得差不多了,换一台好的服务器还能提高不少效率。
更好的算法也得基于更好的硬件,比如显卡加入什么的,愿闻其详
根据上面的帖子优化了一版
从 5*200*25k 个 distance 用 10s 了
到 5*200*200k 个 distance 用 15s

之后一个点的全量数据对比 (5*1M )个 distance 在 20s 内能搞定,考虑用队列离线算~
@0o0o0o0
@tzm41
@yuruizhe
@also24

昨天想了一个思路,准备动手去做
还是空间换时间,而且要利用好“diff < n”这个条件去筛。

128bit diff <=3 那么把 128bit 分成四段,至少能有一段是完全一致的。

1M 个 分成 4M 段 每段按照哈希值存到一个桶里面,会有 2^32 个桶,每个桶基本不会有冲突。
之后每个 hash 找近邻的时候只需要找 4 段对应的 hash 取个并集,算一下这部分就好。
@vchar2ex 我已经找到实现了,我的问题不是如何算 hash,而是如何降低复杂度快速去找。
@yuruizhe 没毛病,空间换时间。
你空间给小了和 1-count 预处理效果差不多
给大了……你给不起。。
128bit 不小的。。。
@imn1 更正一下,FFI

我的场景这个判重已经足够了,稍后算一下几个 hash 算法的 dist 的权重,做一个新的阈值。
@imn1 世界上最好的语言对 OpenCV 的封装不好。。。
当然 php74 之后就有 ffp 了,拭目以待吧~
@also24 我直接硬数的,反正 n^2 的算法里面的 n 次 bit 计算怎么搞都不差太多……
但是优点确实是能省好多 distance
毛估,distance 计算数量减少百分之 90,但是多算了 n 次绝对值相减,里外里效率提升 50%这样

ext_gmp 的 distance 已经很省时间了
@lizytalk lsh 是分段的,会降低敏感度,因为图片无法分段。
@imn1 处理的已经是针对 hash,而不是图片了。

踩了一个语言的坑,有一些代码写的还不够 dry,目前已经优化到计算
5*200*25k 个 distance 用 10s 了。
@also24 又做了一个优化,比较 distance 之前算下 bit count 的差值,超过阈值就不算了。
这样又可以快一点点。
@imn1 我尝试了一下算 hash dup 的算力。
必要的缓存优化我做了,hash 全部读取到内存没有 io 问题。

计算 5(个算法)*200 个 src*10k 个目标的汉明距离大概需要 1 分钟
i5 4200U@1.6G 睿频到 2.2 的单核

如果目标上升到 1M(100 倍),5*200 这组需要的时间将会上升到 100 分钟

当然换一个好点的 cpu 提升 10 倍也就顶天了,10 分钟算 200 个(因为前面的 target 少)

1M=200*5000, 算均值是 5 分钟一批,需要 25000 分钟,大概 400 个小时。
1 ... 14  15  16  17  18  19  20  21  22  23 ... 27  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2917 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 13:59 · PVG 21:59 · LAX 06:59 · JFK 09:59
Developed with CodeLauncher
♥ Do have faith in what you're doing.