V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
mostkia
V2EX  ›  程序员

使用 Bing 搜索 b 站,会被引导到一个异常的页面

  •  
  •   mostkia · 2020-04-28 17:08:35 +08:00 · 4641 次点击
    这是一个创建于 1705 天前的主题,其中的信息可能已经有所发展或是发生改变。

    不知道大家碰到过吗?有兴趣可以自己复现一下。

    点击后会被引导到这个异常地址: https://www.bilibili.com/index.php

    进入后所有内容显示都有问题,而且 css 也有异常,整个 foot 页脚都浮上来了。

    不清楚 b 站留这个入口文件是派什么用处的,不是说后台已经转 GO 了吗? php 还保留了?

    23 条回复    2020-04-29 14:48:14 +08:00
    iminto
        1
    iminto  
       2020-04-28 17:22:32 +08:00
    为了 SEO 吧,京东现在登陆页面还保留着 aspx 的后缀,淘宝也保留着 PHP 后缀,尽管他们都早就转 Java 了
    mostkia
        2
    mostkia  
    OP
       2020-04-28 17:36:32 +08:00
    @iminto 那 403 跳转到主页不行吗?这样其实已经影响到使用了,多多少少会有一些人点开页面后,有 B 站打不开了的误解。毕竟 Bing 就爬到了错误的页面。普通吃瓜群众不太懂这种东西的
    baiduyixia
        3
    baiduyixia  
       2020-04-28 17:38:54 +08:00
    @mostkia 没什么影响,没什么人用 bing
    ben1024
        4
    ben1024  
       2020-04-28 17:40:12 +08:00
    @mostkia 403 跳转理论上对权重传递有影响,这个更像是 Bing 的爬虫对动态渲染对支持性不强
    tojonozomilk
        5
    tojonozomilk  
       2020-04-28 19:05:00 +08:00
    涨姿势了,想起来我从必应推出开始用到现在,还真没用它搜过 B 站……
    mostkia
        6
    mostkia  
    OP
       2020-04-28 19:07:26 +08:00
    @baiduyixia 的确,我承认,中文领域百度搜索还是绝对强者的,哪怕是一堆乱七八糟的广告百家号之类的。资本都是逐利的,不要说 bing 了,google 搜中文也是很差劲的。
    @ben1024 这个更像是爬虫策略问题,主动爬了 php 后缀,假设直接按域名进入站点,根据服务器引导,不会爬倒这东西的,这个情况更像是爬虫主动爬到了 PHP 后缀的废弃的版本遗留文件。
    Greendays
        7
    Greendays  
       2020-04-28 19:09:41 +08:00
    这种大网站,应该是 Bing 需要主动更新搜索内容吧
    cominghome
        8
    cominghome  
       2020-04-28 19:12:30 +08:00
    @baiduyixia 扎心了哈哈
    wi
        9
    wi  
       2020-04-28 19:44:52 +08:00
    Bing 还是用的
    MisakiYui
        10
    MisakiYui  
       2020-04-28 20:08:55 +08:00
    我觉得搜 "bz" 的人应该很少吧。
    mostkia
        11
    mostkia  
    OP
       2020-04-28 21:47:01 +08:00
    @MisakiYui 和这个没什么关系吧,弹出来得结果有 b 站就对了。你正儿八经输入 bilibili 也是弹出相关的内容,只是排序上或许有差别而已,况且我这个已经排到第一了[doge]
    RickyC
        12
    RickyC  
       2020-04-28 23:32:05 +08:00
    @iminto 我觉得淘宝和天猫可能还保留着一些 php 技术栈, 不然实在没有必要使用 www.taobao.com/index.php www.tmall.com/index.php 这样的扩展名
    ipixeloldc
        13
    ipixeloldc  
       2020-04-28 23:45:50 +08:00
    @mostkia 直接搜 bilibili,我翻了 6 页都没有,第一条就是正确的信息,这个问题确实有点意思
    ipixeloldc
        14
    ipixeloldc  
       2020-04-28 23:47:35 +08:00
    @ipixeloldc 搜 b 站也没有,bzhan,b zhan 都没问题,bzh 倒是完全是其他东西了,感觉这个问题就只有 bz 有了
    jinliming2
        15
    jinliming2  
       2020-04-29 01:22:08 +08:00 via iPhone   ❤️ 1
    @mostkia
    @ben1024
    403 跳转?你们说的是 301 跳转吧?
    0312birdzhang
        16
    0312birdzhang  
       2020-04-29 08:16:38 +08:00 via iPhone
    @jinliming2 我也懵了,403 还能跳转的? 302 比较好吧
    jinliming2
        17
    jinliming2  
       2020-04-29 08:48:01 +08:00 via iPhone
    @0312birdzhang 302 是临时跳转,像这种永久变更应该用 301 。
    302 表示当前地址任然可用,但临时跳到另一个地址,以后应该继续请求旧地址
    MaiKuraki
        18
    MaiKuraki  
       2020-04-29 08:53:37 +08:00
    我现在搜正常啊
    0312birdzhang
        19
    0312birdzhang  
       2020-04-29 08:58:07 +08:00 via iPhone
    @jinliming2 我知道,301 太暴力了,用户访问一次就被浏览器记住了,以后想跳到别的网址都不受服务端控制了,不太喜欢,被坑过
    baobao1270
        20
    baobao1270  
       2020-04-29 09:26:21 +08:00
    @0312birdzhang
    @jinliming2
    有的浏览器只要 Header 里有 Location 字段,不论 status code 是多少都给你跳转……

    @RickyC
    @iminto
    很多网站都有 index.php ……可能是 SEO 的考量;也可能是初期用 PHP,转移技术栈时为了防止死链留着的;也许是某种对网站第一代技术栈的致敬?
    0312birdzhang
        21
    0312birdzhang  
       2020-04-29 09:30:07 +08:00
    @baobao1270 #20 学习了,之前还没注意这个。
    Nasei
        22
    Nasei  
       2020-04-29 10:03:49 +08:00
    这个网址 和 www.bilibili.com/index_old.html 估计是一个东西,在 b 站旧版还能用的时候我一直用这个链接...后来不能用了,渐渐的也不怎么用 b 站了
    mostkia
        23
    mostkia  
    OP
       2020-04-29 14:48:14 +08:00
    @ipixeloldc 唉,真的,为啥会这样,搜索结果都指向 b 站,为什么地址有错有对?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2714 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 14:53 · PVG 22:53 · LAX 06:53 · JFK 09:53
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.