V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  enenaaa  ›  全部回复第 20 页 / 共 36 页
回复总数  712
1 ... 16  17  18  19  20  21  22  23  24  25 ... 36  
2017-09-07 10:44:31 +08:00
回复了 gxf506 创建的主题 程序员 5000 元请高手写一个应用程序屏幕窗口文字抓取程序
这活你发到易语言或者按键精灵论坛上, 估计 2k 都不用。哈哈。
2017-09-06 16:54:52 +08:00
回复了 polandeme 创建的主题 程序员 c++和 Java 的 socket 通信协议解析请教
@polandeme 那你慢慢研究吧。 首先确定客户端发送数据的字节序, 可能是 Little-Endian 也可能是 Big-Endian。
这个之后,再确定数据类型长度, 一般来说是可以解释的。
2017-09-06 16:42:14 +08:00
回复了 polandeme 创建的主题 程序员 c++和 Java 的 socket 通信协议解析请教
可能是字节序不一致。
这种跨编译语言的数据传输, 最好用文本格式,例如 json。或者支持跨平台的二进制格式, 例如 protobuf
@a523860 在安骑士页面左下有个“告警配置”, 可以关掉。
告诉你有漏洞, 还得先买服务才能知道漏洞列表, 真特么鸡贼。
还好后台能关掉提示。
正在关注。 书看不下去, 直接去参加比赛边学边玩了。
2017-09-04 09:36:15 +08:00
回复了 rajiha 创建的主题 全球工单系统 日常(?) 吐槽鹅厂游戏平台
找到占 cpu 的进程, 查看其线程列表。 通过线程切换次数变化来大体判断占 cpu 的线程, 查看线程对应的模块。
2017-08-24 15:57:32 +08:00
回复了 yujianwjj 创建的主题 Linux poll/epoll 关于突破 1024 限制的疑问?
2017-08-23 17:04:09 +08:00
回复了 MyFaith 创建的主题 云计算 阿里云每天 4 次准时被 DDOS
用 slb 或反向代理,不暴露真实 ip。
只把入口 ip 发给可靠的人。
2017-08-17 11:27:53 +08:00
回复了 can126 创建的主题 程序员 我这种资历能找到机器学习方面的工作嘛?
最近在参加阿里天池的数据分析比赛, 真的是有差距。
楼主可以先试试。
如果在浏览器执行, 怎么操作本地文件,调用系统 API 呢?
如果在独立应用内执行, 那也先得有应用啊。
@zengzizhao +1, 要是上线后留存、付费不好。各种瞎分析,无头苍蝇的优化会更折磨。
2017-08-09 09:19:29 +08:00
回复了 imherer 创建的主题 程序员 长连接手游 ping 值是怎么实现的?
@realpg 一般开始游戏时会对时。 另外心跳计算延迟跟两边时钟差距没关系啊,本地计算发送时间、接受时间即可。
2017-08-05 13:13:55 +08:00
回复了 enenaaa 创建的主题 程序员 求一个数组匹配的优化思路
@h4x3rotab
@ccpp132
以 id 为节点构建字典树或 dfa 有个比较大的困难。由于 rule 每段的 id 数较多,节点数很快爆炸。例如一个 10 段, 每段 100 个 id 的 rule, 按正常做法节点数是 100^10。

如果改为共用节点, 即 100+100+100。。。的方式, 由于 id 重叠,又会在多个 rule 之间造成混乱。

例如下面 2 个 rule 构造树:

rule1 = [[1, 3], [2]]

rule2 = [[1, 6], [2], [4]]

rule1 和 rule2 共用了 1,2 节点。但是 3 和 6 也连到 2 上,2 又连到 4 上。 这样 4 节点没法判断到底 rule1 还是 rule2。

现在看来, 可能先得划分好 rule 的数据, 才能进一步处理。



@vegito2002 #4 #6 就是这个想法,效果有限。
2017-08-04 14:03:05 +08:00
回复了 enenaaa 创建的主题 程序员 求一个数组匹配的优化思路
@h4x3rotab 先前我想的是以段为节点构建字典树或 DFA,这样因为段内 id 有重叠,不满足查找性质。
不过如果用 id 作为节点, 可能是个好主意。
2017-08-04 13:29:01 +08:00
回复了 enenaaa 创建的主题 程序员 求一个数组匹配的优化思路
@imn1 在我的机器上,一次处理跑下来要 15 秒左右。整个数据库迭代一次耗时近 10 天。大头就在这个匹配上了。
我对 numpy 不熟,因为还有些通配符的处理,不晓得是否适用。

append 里主要想说 rule 段内 id 是以 set 方式存放的, 在预处理阶段已经将 id 组编号转换为 id set 表。
但如#6 所说, 段内 id 存成一个大 set, 相对于多个小 set 只有在首段有较为明显的效率提升。

为简化讨论, 这里就当一个段是一个 set 好了。
2017-08-04 13:02:29 +08:00
回复了 enenaaa 创建的主题 程序员 求一个数组匹配的优化思路
@vegito2002 假设查表消耗为常量。arr 长度为 n, 那么直接检索查表次数为 n 次。
而你的办法, 一次比较需要两次查表,查表次数为 2n 次哦。
2017-08-04 12:01:02 +08:00
回复了 enenaaa 创建的主题 程序员 求一个数组匹配的优化思路
@momocraft 忘了说了,段内本身就是 set 存储的。
2017-08-04 11:58:50 +08:00
回复了 enenaaa 创建的主题 程序员 求一个数组匹配的优化思路
@momocraft arr 数组 10 万左右,rule 现在近 2000 条。你说的方法,将 rule 段内拼合成唯一表, 我也尝试过,只有首段有些效果,后续段提升不明显。原因可能是 10 万条 arr 中,最终匹配的只有 10%左右, 大部分在 rule 首段就失配了。
2017-08-04 11:45:49 +08:00
回复了 enenaaa 创建的主题 程序员 求一个数组匹配的优化思路
@qianlv7 因为 rule 的段内有重叠,不是一般树的查找。
@imn1 用的就是 python, 运行太慢了。 上了 cython 还是慢。
1 ... 16  17  18  19  20  21  22  23  24  25 ... 36  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4860 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 52ms · UTC 09:51 · PVG 17:51 · LAX 01:51 · JFK 04:51
Developed with CodeLauncher
♥ Do have faith in what you're doing.