V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Morriaty  ›  全部回复第 15 页 / 共 30 页
回复总数  599
1 ... 11  12  13  14  15  16  17  18  19  20 ... 30  
@whp1473 scroll 的方式满足不了线上耗时要求
@mymike 终于有人说到点上了,朋友你应该也是做搜索推荐的吧。你说的这种后过滤有个比较麻烦的问题是,分页后请求,被过滤掉的部分,就得补全,补全的部分还要从下个分页里去掉,导致分页逻辑极其复杂
@Nillouise 实际是有个千万级的 item 索引,每次查询 1000 个左右的 item_id 的 status,对应的 es query 是:
{
"query": {
"bool": {
"filter": [
{
"term": {
"status": {
"value": "1"
}
}
},
{
"terms": {
"item_id": ["id1", "id2", ..., "id1000"]
}
}
]
}
}
}

流量大峰值的时段,其中 terms 那个查询 es 扛不住
@Nillouise 当然是后者了呀
@li24361
@chihiro2014

请问有完整的描述,或者相关链接吗?我是指整体的技术方案,包括布隆过滤器是在代码层实现,还是通过一些 redis 等中间件实现?过滤器怎么同步数据变更?等等
纠正一下,篮球大都是不认识的人组队玩场子的,哪有次次都约上十几号人打篮球的啊
2020-09-04 11:39:02 +08:00
回复了 felixliu95277 创建的主题 上海 浦东这边有什么好的公共篮球场吗?顺带寻球友。
浦东太大了胖友
2020-09-03 10:02:31 +08:00
回复了 Awes0me 创建的主题 问与答 把牛奶当水喝会有什么健康问题吗?
会费钱
2020-09-03 10:00:29 +08:00
回复了 xtx 创建的主题 生活 在家里休息一天,没有任何人联系,这是正常的么?
@loading 这个说法太武断了点,偶尔工作日晚上出来和好朋友吹吹牛逼,虽然明天还要上班,但去特娘的傻 x 工作、去特娘的烦心事,那种暂时放下重担的感觉,还是很舒服的
2020-09-01 14:07:49 +08:00
回复了 chaos93 创建的主题 新手求助 [不懂就问] SAP 是啥有大佬懂么
外企,做 ERP 的,中国总部在上海张江
2020-08-25 10:21:46 +08:00
回复了 KalaSearch 创建的主题 程序员 也没融钱,就俩程序员自己搞, 12 个月从 0 到 700 万
楼主你们当前产品的目标用户群是开发者吗?「比 es 快」并不是 B 端 C 端的痛点需求啊
2020-08-21 11:36:58 +08:00
回复了 shuxuanshu 创建的主题 酷工作 北京公司的一个 hr 小菜鸟,招不到推荐算法该怎么办?
现在这个国际环境,真的好说“出海是一个非常不错的方向”吗
官方推荐的 debug 方式也是 _cat/hot_threads,但这玩意的输出不是资深 es 专家真的很难看懂

建议还是观察 kibana 的 monitor 信息,以及观察 gc log 、slow log 之类的
2020-08-14 14:11:20 +08:00
回复了 gaopan123 创建的主题 Python 大家有接触过语义转换吗
摘要提取咯?

传统一点的方法是 Textrank,也可以转化为二分类问题,原句中每句话重要( 1 )或者不重要( 0 ),但训练集不好构造。

现在主流一点是文本生成,TextGAN 之类的,但都只是 demo,也就是不靠谱....
2020-08-10 14:32:48 +08:00
回复了 i66 创建的主题 美酒与美食 手工冰粉不是非物质文化遗产,非遗么?
啊,冰粉和烧仙草原来不是一样的
2020-08-06 18:24:57 +08:00
回复了 Beeethoven 创建的主题 程序员 国内有什么好用的 PDF 文档 OCR 产品吗
ABBYY 似乎要有个物理 U 盘狗才能用?

国内的话,庖丁科技有个完整的产品叫 PDFlux,demo 看起来很牛逼,不知道有没有付费 sdk
2020-08-06 18:21:22 +08:00
回复了 zyeoman 创建的主题 问与答 腾讯云机翻 stackoverflow 是图啥?
SEO 引流呗
2020-07-08 10:56:18 +08:00
回复了 tangtaorong 创建的主题 问与答 开源软件的持续动力在哪?
自己撸的小 repo 开源,和 RedHat 、Docker 这种商业化开源还是有本质区别的,国内近期的正例就是 PingCap ( TiDB )

我自己的理解就是培养社区,让社区反哺软件,使得该软件成为某特定场景下事实标准,可以理解为安卓、应用市场、开发者这样的三角关系
2020-07-02 15:38:16 +08:00
回复了 arth 创建的主题 上海 转租房屋-中山公园华师大环球港,两室全明精装家电 5200 元
好房子,羡慕那个实木书柜,帮顶
2020-07-01 17:10:47 +08:00
回复了 imn1 创建的主题 Python 以图搜图要靠算力么?
抽象出的问题是 ANN (approximate nearest neighbor), 一般方法有

- LSH and multiprobe LSH for euclidean distance
- partition trees for euclidean/cosine distance
- clustering-based approaches, including product quantization

python 的话就直接调用 annoy
1 ... 11  12  13  14  15  16  17  18  19  20 ... 30  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5194 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 09:11 · PVG 17:11 · LAX 02:11 · JFK 05:11
Developed with CodeLauncher
♥ Do have faith in what you're doing.