1
msg7086 2014 年 7 月 9 日 不算。Allow: / 了。但是别爬太过火把人机器搞挂了。
|
4
msg7086 2014 年 7 月 9 日
2楼被删了或者折叠了。
|
5
qiongqi OP 还有个疑惑是:
如果 http://abchost/detail/555 从来没有出现在其它页面的href里,搜索引擎会抓到这个页面吗? |
6
Livid MOD PRO V2EX 有个功能叫 block,如果你 block 其他人,你就看不到他的回复了。这不是 bug,OK?
|
7
alexkh 2014 年 7 月 9 日
User-agent: *
Allow: / 意思是所有的UA,允许抓取所有页面。 另外,自己的爬虫也不用都遵守这种规则吧。 |
8
kennedy32 2014 年 7 月 9 日
奇怪,也不知道2楼是谁,我也看不到
|
10
mkeith 2014 年 7 月 9 日
难道2楼这么遭人Block啊,我也看不见啊.
|
11
Livid MOD PRO 我可以看到,不过是一条毫无意义的灌水。估计是被其他管理员 hide 了。
|
12
1994S 2014 年 7 月 9 日
我也看不见-_-a
|
13
ChiangDi 2014 年 7 月 9 日
我一个人都没Block也没看到。
|
14
dong3580 2014 年 7 月 9 日 via Android
这个应该没问题吧,不算违反robots协议。试试先访问一下协议内容再过滤抓。
—— 我也看不到,表示我没block任何人。难不成二楼复读了一楼的了? |
15
txlty 2014 年 7 月 9 日
你个小脚本装什么蜘蛛。。
|
16
Livid MOD PRO |
18
arcas 2014 年 7 月 9 日
竟然还有其他管理员。。
|
19
jeansfish 2014 年 7 月 9 日
啊,见到管理员的世界了。
歪楼不算灌水吧(事实上已经歪了 ====================== 楼主要爬V2EX吗? |
22
wy315700 2014 年 7 月 9 日
@Livid 能不能这么做,把折叠放到前端,然后提供一个按钮展开,既方便大家查看被Hide的,同时大部分人也看不到被hide的内容,提供个建议而已。
|
25
coosir 2014 年 7 月 9 日 via iPad
最好显示如:23回复(1折叠)
点击折叠数可展开 |
26
Livid MOD PRO |
27
yangqi 2014 年 7 月 9 日 @Livid 至少你也同意了这是优雅的处理,对于完善一个社区来说why not? 至于你说的时间和优先级上面你比大家更清楚,大家也只是提建议而已。
|
28
Livid MOD PRO |
29
yangqi 2014 年 7 月 9 日
@Livid 采不采纳是你的自由,大家的建议就一个目的,让被删或者被隐藏的帖子至少有个提示。
而且二楼内容是不是垃圾内容这个个人看法不一样的,我觉得只是歪楼了而已,不算垃圾啊。如果任何人的内容都可以被删除或者隐藏,只是基于管理员个人的喜好和判断的话,对于社区来说绝对不是好事。 |
33
shakoon 2014 年 7 月 10 日
原来这里除了站长还有其他管理员啊,我一直以为就一个人
|
34
mikuazusa 2014 年 7 月 10 日
不能忽略这里确实有个BUG...
正常逻辑应该是Block之后用户见到的回复数量还是显示出来的数量而不是包含被block了的数量吧? 起码单纯地从用户的角度说,看到了一个错误的数字可能会导致更多的误解...@Livid |
35
Livid MOD PRO @mikuazusa 那我希望大家能够有个默契就是,如果在 V2EX 看到某些楼层没显示出来,那么只有几种可能就是:
- 那个人被 block 了 - 那层楼是纯粹的不需要关注的无意义信息 如果这个地方动态计算的话,造成的后果就是每个人看到的楼层数都不一样,因为每个人的 block 列表不一样。 |
36
yfdyh000 2014 年 7 月 10 日
@Livid 那么把隐藏的内容从回复总数中减掉吧,反正没人看得见。但既然不想写多余的代码,干脆直接把回复总数和“直到 ...”拿掉吧,反正右侧有序号,似乎“没有意义”。
现在上面写着“33 回复”,下面却只有32个回复,就好像用户不识数一样,绝对不是良好的设计。 |
38
yangqi 2014 年 7 月 10 日
|
39
yfdyh000 2014 年 7 月 10 日
@Livid 用户真的该花费这种学习成本吗。RTFM?但这连手册都没有呢。
如果真的希望保持一致,那么:右侧的楼层号目前是显示序号,而不是真正的序号,这样真的好吗,讨论指向可能出现错位。如果那是真正的序号,这个问题也将有所缓解。 总之,不太满意这种略显诡异的设计,但如果站长坚持,只能。。。 |
40
Livid MOD PRO |
41
qiongqi OP @Livid 抱歉,我刚看到的时候,下意识的就说是个bug,确实不谨慎。
之前浏览的时候没有注意过楼号,只是顺着浏览的,这次是因为自己提问,看到回复比较敏感。 最近写了一堆phpunit的东西测自己新写的功能,有一个测到的bug就是删spam内容后,计数表内没有-1,所以就下意识的以为在v2ex遇到了同样的bug了,没有任何幸灾乐祸的意思。。 |
43
shiniv 2014 年 7 月 10 日
话说 跟话题扯的有点远了把- -!
|
44
yfdyh000 2014 年 7 月 10 日 @qiongqi 只要网站没有禁止索引,通常来说这都没有问题,哪怕它是个孤岛页面。就如同很多因被索引而泄漏数据的案例一样,通常不认为这是蜘蛛的错,信息安全是网站的责任。
另外,Google等蜘蛛估计也会猜测连续的索引参数,例子: http://webmasters.stackexchange.com/questions/25560/does-the-google-crawler-really-guess-url-patterns-and-index-pages-that-were-neve |
45
Livid MOD PRO 以后大家在面试产品设计人员的时候,可以把这个帖子作为一个案例让被面试者谈谈自己的想法。
这是一个没有答案的开放问题。 我所说的,可能全是错的。 |
48
riophae 2014 年 7 月 10 日
我同意 @Livid 的设计. 允许用户去查看被折叠的消息纯粹是浪费时间.
因为很多人都有类似 "偷窥" 的癖好, 想要看看那些一般情况下看不到的东西. 所以只要允许用户查看, 那么一定会有很多很多用户故意去点的. 这真的浪费时间. |
49
a154312237 2014 年 7 月 10 日
彻底歪了...
|
50
alexkh 2014 年 7 月 10 日
@qiongqi 不会发现。除非站长通过各种方式将这个页面展示出来,否则将永远不会被发现。
搜索引擎也面临这个难题,所以提供了sitemap等多种形式,去接触这些孤岛页面。 |
51
Shieffan 2014 年 7 月 10 日
我也不知道2楼是谁 --
|
53
icanfork 2014 年 7 月 10 日
楼歪了
(我会不会被block掉?) |
54
jsjscool 2014 年 7 月 10 日
@livid 的观点我再赞同不过,如果为了一些花活功能对UI做大改造,完全就是扯淡。
就好比在网站加个天气显示,加个时钟。用户是觉得好啊,多方便。加了之后其实没多大用(只是举个例子) |
55
dong3580 2014 年 7 月 10 日 @qiongqi
这样我可不可以理解你的页面相当于查询数据库,每个页面对应id号就是查询标识。 如果专门做该站的爬虫的话,我会可能根据大略规律爬出来,那么你这个555页面数据也出来的。 大型搜索引擎应该对常用的链接形式都有关注吧?感觉可以出来的样式。 我之前见到一个简单的网站,有个页面没有任何链接,但是在百度上搜这个网站名的时候出来的正是这个页面。 |
56
dasher 2014 年 7 月 10 日 这是livid的论坛,充斥着其自己的意志以及权力。如果不喜欢其人的做事方式,或许也只能无视或者离开。
|
57
saybye 2014 年 7 月 10 日
歪了。。。
|
58
phyng 2014 年 7 月 10 日
|
61
tomnee 2014 年 7 月 10 日 via Android
@Livid 你实在是很有趣. dasher这个账号已经登陆不上去了。你的行为正好应证了我所说的。看不出我哪里有用秽语侮辱你,本身对你看法很中性。现在算是明白为什么有人要黑你。随便封号,就是你所谓做有趣的事情么。你技术能力和对其的态度让人向往,你的这种小心眼偏执不会让人觉得难相处么?
|
64
imn1 2014 年 7 月 10 日 我觉得搜索引擎理论上是能爬都爬的,只是在遇到黑白名单才“特殊”处理,至于怎么处理还是爬虫自己定的准则,一般情况下,爬了而不发布或者遇到黑名单就不爬
|
65
peartail 2014 年 7 月 10 日 via iPad 您所说的“孤岛”,搜索引擎用常规方法是找不到的。
但有很多非常规方法可以帮助搜索引擎发现这个链接,例如,把用户浏览器里的网址发回给搜索引擎。这昂没如果用户访问了这个孤岛,搜索引擎也知道了这个孤岛的存在。 |
66
tomnee 2014 年 7 月 10 日 via Android
@Livid …… 你怎么又在印证我所说的。我真没想黑你,你不值得我去所谓的黑。看把你气的。到底是谁玻璃心? 专门注册?那个号是上个月注册的。不要逃避话题好吗?因为一句话你看着不爽封号是事实。得,还真是不用交流了。您去做您的事吧。我真没那么无聊专门去黑你。还什么写文章,真说的出口。你都快30的人了,怎么这么沉不住气?说些有反对性质的话就是黑你?你也太以自己为中心了。你要不要在你所有看到的资料上加一个过滤器?抱歉楼主,污染了你的贴。
|
68
tomnee 2014 年 7 月 10 日 via Android
@Livid 随机登罢了,没有您有种。您可完全封掉我。好了,真没必要争论了,我的原意只是觉得你与会员讨论的语气不怎么好,不知道你这么有攻击性。我没有兴趣去专门指责你。我也只是评论罢了。您也不用继续含沙射影发贴发推。欣赏您审慎对产品的态度。只是咱们别在歪楼了。去做您有趣的事吧,别浪费时间在回帖上面。天热,注意消暑 :)
|
69
mkeith 2014 年 7 月 10 日 GFW也是这么想的,帮我们Block了好多的东西.
|
70
ctsed 2014 年 7 月 10 日
如果不喜欢其人的做事方式,或许也只能无视或者离开。
按这个逻辑来看行动,这哪里是黑,明明是真爱啊 233 |
71
mhycy 2014 年 7 月 10 日
只能说任何一个网络社区都是管理员的社区。。。。
有谁反对么?请给出反例~ |