V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
baskice
V2EX  ›  问与答

百度搜索为什么会对一个被墙掉的网址不离不弃 3 年不删?

  •  
  •   baskice · 2014-11-06 10:04:02 +08:00 · 4259 次点击
    这是一个创建于 3675 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我维护的 萌娘百科 wiki.moegirl.org 这一地址大约3年前就被GFW掉了,域名换成zh.moegirl.org之后,百度一直拒绝将wiki.moegirl.org链接更新成zh.moegirl.org。(不管我提交了多少次网站改版通知)

    最近查了下百度的收录情况,在站长工具平台里,百度显示平均收录1条(是首页,wiki.moegirl.org/Mainpage)。偶尔会反弹突然收录很多第二天又全部删掉。

    到底是什么原因导致百度一直拒绝将结果里的wiki.moegirl.org改成zh.moegirl.org?

    百度不改,导致搜索 [萌娘百科] 这一关键字的用户,70%以上会直接撞墙。即便用户之后访问zh.moegirl.org也会因为墙导致至少15分钟内无法访问任何境外网站而无法访问。
    第 1 条附言  ·  2014-11-06 10:44:11 +08:00
    301做了,301肯定做了,换域名的时候就已经做上了,为了方便百度识别301,我还特意在大陆境内放了一个节点专门用于wiki.moegirl.org301到zh.moegirl.org(放境外就直接被墙了)
    44 条回复    2017-11-15 12:24:43 +08:00
    wzxjohn
        1
    wzxjohn  
       2014-11-06 10:06:28 +08:00 via iPhone
    百度就是这么蛋疼。。。
    话说没想到这个网站的维护人员也在v2
    cxd44
        2
    cxd44  
       2014-11-06 10:07:12 +08:00 via Android
    把wiki删除,301到zh不就行了
    lyragosa
        3
    lyragosa  
       2014-11-06 10:14:08 +08:00
    我擦……原来冰娘也混v2……v2真是藏龙卧虎。

    以及百度一向对wiki这种关键词的URL有天生的厌恶。
    qiayue
        4
    qiayue  
       2014-11-06 10:14:18 +08:00
    是否做了 301 跳转?
    chloerei
        5
    chloerei  
       2014-11-06 10:16:01 +08:00
    我觉得这个问题要联系销售人员。
    aa65535
        6
    aa65535  
       2014-11-06 10:19:37 +08:00
    大概是因为百度蜘蛛没翻墙,访问 wiki.moegirl.org 时撞墙了看不到 301 重定向。
    alex321
        7
    alex321  
       2014-11-06 10:20:55 +08:00   ❤️ 1
    公司大量和百度收录业务相关。
    可以告诉大家的是,百度内部现在比较混乱,就搜索引擎这一块来说,百度自己都遵循自己发布出来的搜索引擎规范或要求。
    比如,301 跳转声明,不使用百度主动提供的触屏版转码声明,电脑端网址适配的触屏版网址声明等等。
    alex321
        8
    alex321  
       2014-11-06 10:21:30 +08:00   ❤️ 1
    @alex321 sorry,自己都不遵循自己发布出来的搜索引擎规范或要求。
    aero99
        9
    aero99  
       2014-11-06 10:36:18 +08:00 via iPhone
    没交保护费吧?百度让你竞价排名不答应暗中报复你
    kisshere
        10
    kisshere  
       2014-11-06 10:49:20 +08:00 via Android
    话说为啥你这个网站会被墙?
    cst4you
        11
    cst4you  
       2014-11-06 10:58:40 +08:00
    何不直接干掉百度 Spider 一了百了, 干 UserAgent, 干IP.
    surbeta
        12
    surbeta  
       2014-11-06 11:21:42 +08:00
    已经墙掉三年了?我还记得我看见你们在AcFun的wiki里面留言换友链呢。。(当然现在acwiki都已经没了。。
    binux
        13
    binux  
       2014-11-06 11:24:50 +08:00
    这个有点复杂
    wiki.moegirl.org/ 在10月26日还有成功访问
    wiki.moegirl.org/Mainpage 倒是会在 21号删除
    而且有地址改写策略会把 zh.moegirl.org/Mainpage 改成 wiki.moegirl.org/Mainpage

    你发个邮件给 bugs#baidu.com
    erit
        14
    erit  
       2014-11-06 11:56:51 +08:00 via Android
    原来你就是萌娘百科站长⊙3⊙我要和你做好朋友
    vvard3n
        15
    vvard3n  
       2014-11-06 12:47:26 +08:00
    楼主求包养
    BGLL
        16
    BGLL  
       2014-11-06 13:25:04 +08:00
    是域名带 wiki 所以被墙么.....
    xjoker
        17
    xjoker  
       2014-11-06 14:00:59 +08:00
    前来围观萌娘百科的站长~~ 求握手゚ ∀゚)ノ
    DearMark
        18
    DearMark  
       2014-11-06 14:12:05 +08:00 via Android
    人在做,天在看。
    墙百度,保平安。
    qifei
        19
    qifei  
       2014-11-06 15:09:48 +08:00
    顶楼上,退百度,保安心。
    xudshen
        20
    xudshen  
       2014-11-06 15:20:44 +08:00
    退百度,保平安
    Sunyanzi
        21
    Sunyanzi  
       2014-11-06 16:04:05 +08:00
    给萌娘百科的站长跪 ...

    不是看了这个帖子我都没发现萌娘百科居然还有一个被认证了的域名 ...

    一般搜索的时候其实不会有这个问题 ... 随便举几个例子 ...

    http://www.baidu.com/s?wd=%E7%9C%9F%E7%99%BD%20%E8%90%8C%E5%A8%98
    http://www.baidu.com/s?wd=%E7%A9%B9%20%E8%90%8C%E5%A8%98
    http://www.baidu.com/s?wd=%E5%B2%9B%E9%A3%8E%20%E8%90%8C%E5%A8%98

    比如上述几个 ... 搜具体人物的时候链接都是正确的 ...

    加尾缀「萌娘」只是为了净化显示 ... 不加的话也是一样的 ...

    再及如果以关键字「萌娘百科」搜索 ... 虽然第一条是错的 ...

    但下面紧跟着就是「R-18」和「prpr」 ...

    我觉得看到这两个标签还能不为所动毅然决然的去点首页的人 ... 撞墙也是活该了吧 ...
    Starduster
        22
    Starduster  
       2014-11-06 17:23:08 +08:00 via iPhone
    我是来围观萌娘百科的
    Quaintjade
        23
    Quaintjade  
       2014-11-06 17:58:42 +08:00 via Android
    百度的搜索结果很混乱的,有时过期搜索结果删了,过段时间又冒出来。
    garipan
        24
    garipan  
       2014-11-06 18:06:40 +08:00
    围观萌娘百科
    tumutanzi
        25
    tumutanzi  
       2014-11-06 18:27:38 +08:00
    这事我有发言权。

    你的根域名进了黑名单,你搞其它二级域名有什么用?百度坚持“原则”就是不会放出这些黑名单域名的,但是,百度会一直在服务器上收录哪怕是黑名单的内容——方便哪天解禁?

    我本人的域名 tumutanzi.com 一年多前就上了黑名单了,百度一点收录都没有,但服务器的日志发现百度的蜘蛛经常来转——哪怕我用ROBOTS.TXT禁止它都没有用。而国内其它的小搜索引擎倒是收录我的HTTPS页面。

    百度是多么坚持原则的啊……
    lsylsy2
        26
    lsylsy2  
       2014-11-06 19:04:43 +08:00
    恩,萌娘百科的备案和相关的一部分东西是我做的。
    wiki二级域名被墙有一段时间了……是关键字reset,不是IP被封(记得),后来似乎解封过?
    然后当时是把wiki域名智能解析到国内,做了301,所有国内用户都会301过去,包括百度;然后主站内容在国内也是有反代的;最近因为不明原因,反代到源(linode美国西)的网络很不稳定,就暂时取消了。
    @tumutanzi 并不是百度的黑名单,刚才测试了下萌百的百度收录还有八万多;我们也并不非常在乎百度“有没有”收录。但是在我们做了301的情况下百度依旧收录旧域名(被墙)而不是新的域名这非常蛋疼……
    AlanZhang
        27
    AlanZhang  
       2014-11-06 19:07:40 +08:00
    个人感觉,百度还不如360和搜狗。搜一个英文,360和搜狗都能搜到,就是百度搜不到。
    binux
        28
    binux  
       2014-11-06 20:00:02 +08:00
    LZ你就是搜“萌娘百科” 出 wiki.moegirl.org 的问题?找人帮你改了。
    收录没问题吧?如 @Sunyanzi 所说,看起来大部分收录的实际是 zh.moegirl.org
    lsylsy2
        29
    lsylsy2  
       2014-11-06 20:04:20 +08:00
    @binux 你在狼厂么……orz
    恩,就是这个问题,然后有时候收录也会收录到wiki.moegirl.org/xxx
    wdlth
        30
    wdlth  
       2014-11-06 20:33:27 +08:00
    百度还收录U2B和FB呢,FB甚至还有连通率……
    baskice
        31
    baskice  
    OP
       2014-11-07 07:36:31 +08:00
    @binux 是的,目前似乎只有首页还是 wiki.moegirl.org,其他都是正确的zh.moegirl.org了。目前看起来百度收录大部分是正常的

    (虽然百度明显没有遵守robots.txt收了大量额外的死循环之类的特殊页面)
    elvba
        32
    elvba  
       2014-11-08 12:57:55 +08:00
    @Sunyanzi "看到这两个标签还能不为所动毅然决然的去点首页的人" 23333
    baskice
        33
    baskice  
    OP
       2014-11-19 05:09:43 +08:00
    @binux 百度搜索的结果又变回wiki.moegirl.org了哈哈哈哈。这是怎么回事?
    binux
        34
    binux  
       2014-11-19 09:59:20 +08:00
    @baskice 原来好过一段时间吗?貌似这次不是人工规则,而是13号貌似有一次成功抓取。
    baskice
        35
    baskice  
    OP
       2014-11-20 00:24:23 +08:00
    @binux 为什么wiki.moegirl.org的“权重”那么高,系统抓到一次就无视设置的301到zh.moegirl.org
    binux
        36
    binux  
       2014-11-20 16:44:42 +08:00
    @baskice 好过吗?
    baskice
        37
    baskice  
    OP
       2014-11-23 10:11:23 +08:00
    @binux 16天前似乎是被人工强制设置成zh.moegirl.org了。过来几天又变成wiki.moegirl.org
    binux
        38
    binux  
       2014-11-23 10:35:32 +08:00   ❤️ 1
    @baskice 其实是反过来,原来是被人工强制设置为了 wiki.moegirl.org 然后让人把规则下了。现在是真的抓到了 wiki.moegirl.org ...
    binux
        39
    binux  
       2014-11-24 15:52:28 +08:00
    @baskice 现在对 wiki.moegirl.org 停止DNS解析了吗。。
    baskice
        40
    baskice  
    OP
       2014-11-25 11:48:12 +08:00
    @binux 怎么会人工强制设置成wiki.moegirl.org呢?

    是的,干脆把wiki.moegirl.org的解析去掉了
    binux
        41
    binux  
       2014-11-25 11:54:20 +08:00
    @baskice 以前是PM配的啊,现在把 wiki. 当做死链处理掉了
    baskice
        42
    baskice  
    OP
       2014-11-25 12:04:38 +08:00
    @binux 这百度搜索部门也太混乱了吧……google发现网站被墙了换域名马上就改链接,甚至360都很快就换了。
    binux
        43
    binux  
       2014-11-25 12:30:53 +08:00
    @baskice 因为是人工的
    notgood
        44
    notgood  
       2017-11-15 12:24:43 +08:00 via iPhone
    @binux 你好请问现在收录还可以通过 wP 插件 ziyuan.baidu.com/wiki/425 快速提交吗?我想提交个人网站,要先让完善个人信息,现在就一直在这个提交界面,已经显示保存好个人信息,又不断地跳出来空白界面,让我继续完善个人信息,有什么办法解决吗?谢谢了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1085 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 20:18 · PVG 04:18 · LAX 12:18 · JFK 15:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.