V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zythum
V2EX  ›  分享发现

google到底闹那样。敏〇词提示什么的。会让领导们很头疼的

  •  
  •   zythum · 2012-06-01 10:35:18 +08:00 · 12440 次点击
    这是一个创建于 4558 天前的主题,其中的信息可能已经有所发展或是发生改变。
    68 条回复    1970-01-01 08:00:00 +08:00
    kaka
        1
    kaka  
       2012-06-01 10:38:56 +08:00
    Channing
        2
    Channing  
       2012-06-01 10:43:32 +08:00
    看看是不是藏哪个js里了
    sdjl
        3
    sdjl  
       2012-06-01 10:44:49 +08:00
    真好玩
    raptium
        4
    raptium  
       2012-06-01 10:45:32 +08:00
    应该加密或者编码过了吧 如果轻易能抓到包 那这个包本身就导致重置了
    Channing
        5
    Channing  
       2012-06-01 10:52:57 +08:00
    刚证实了下,词库是一次性加载到本地的,非动态验证。断网后依然可用。应该就是藏在某个js里了。
    Weakdancer
        6
    Weakdancer  
       2012-06-01 11:07:13 +08:00
    zythum
        7
    zythum  
    OP
       2012-06-01 11:16:44 +08:00
    @Weakdancer 这个是输入联想的提示。
    tuoxie007
        8
    tuoxie007  
       2012-06-01 11:18:17 +08:00
    爲啥我這變黃了,缺没下拉提示呢
    slawdan
        9
    slawdan  
       2012-06-01 11:19:25 +08:00   ❤️ 5
    关键词在这里:

    http://www.google.com.hk/xjs/_/js/s/s,st,anim,bbd,c,sb_cn,hv,wta,cr,cdos,sk,pj,tbpr,tbui,rsn,ob,mb,lc,du,ada,bihu,lu,m,shb,tng,hsm,j,pcc,csitl/rt=j/ver=WOt9jzUXUPg.en_US./d=1/rs=AItRSTPUO8p2SlQ687OXCiLKYWsmG122mA

    搜索 getEncodedBlacklist 可以看到二维数组,由charcode组成,应该就是关键词列表了。

    如果猜的没错,那么

    qa:function setup$$56(a){for(var b=_.L.NF(),c=b.eH(),b=b.getKey(),f=[],g=0,i;i=c[g++]{for(var t=[],p=0;p<i.length;++p)t.push(window.String.fromCharCode(i[p]^
    b));f.push(t.join(""))}G=(0,window.RegExp)(f.join("|"),"gi");c=v.gb;c(_.UX.Ll,j);c(_.UX.Gh,h);c(_.UX.Rf,h);c(_.UX.Lf,h);c(_.UX.Es,d);w&&c(_.UX.Fh,k);R=!!a.Ta[240];o();B=_.L.Animation();B.ey(n,218)}

    是核心decode算法

    我还有文档要写,各位再努力努力……
    Vernsu
        10
    Vernsu  
       2012-06-01 11:20:58 +08:00
    @tuoxie007
    还是要点 搜索 后才能出现提示的。
    slawdan
        11
    slawdan  
       2012-06-01 11:21:00 +08:00
    在这个附近做调试,应该可以得到整个明文数组
    romoo
        12
    romoo  
       2012-06-01 11:28:16 +08:00   ❤️ 1
    raptium
        13
    raptium  
       2012-06-01 11:29:52 +08:00   ❤️ 2
    用 python 解码,words = 那个列表 a
    for line in words:
    decoded = ''.join(map(lambda x:unichr(30303^x), line))
    print decoded


    https://gist.github.com/2848464
    slawdan
        14
    slawdan  
       2012-06-01 11:39:07 +08:00
    @raptium


    decoded = ''.join(map(lambda x:unichr(30303^int(x)), line))
    yuanyiz
        15
    yuanyiz  
       2012-06-01 11:41:45 +08:00   ❤️ 2
    Console执行:

    b=_.L.NF().getKey()
    c= _.L.NF().eH()
    f=[]
    for(g=0; g<c.length; g++) {
    i=c[g];
    t=[];
    for(var t=[],p=0;p<i.length;++p) t.push(window.String.fromCharCode(i[p]^b));
    f.push(t);
    }

    结果就在f里,自己看,就不贴了
    fangzhzh
        16
    fangzhzh  
       2012-06-01 11:45:28 +08:00
    你们都是淫才
    zythum
        17
    zythum  
    OP
       2012-06-01 12:04:25 +08:00
    @yuanyiz
    @raptium

    thx 辛苦
    zythum
        18
    zythum  
    OP
       2012-06-01 12:10:30 +08:00

    还有正则表达式...
    zythum
        19
    zythum  
    OP
       2012-06-01 12:26:41 +08:00   ❤️ 1
    对 @yuanyiz 的结果做了下格式化。直接可见结果了
    ---

    var b=_.L.NF().getKey(),c= _.L.NF().eH(),f=[];
    for(var g=0,l=c.length,t=[],i; i=c[g],g<l; f.push(t.join('')),g++)
    for(t=[],p=0;p<i.length;++p)
    t.push(window.String.fromCharCode(i[p]^b));

    console.log(f.join('\n')+'\n总数:'+f.length+'个');

    ---
    chenshaoju
        20
    chenshaoju  
       2012-06-01 12:43:46 +08:00
    @raptium 请教一下这个列表:目前已知“麦当劳”是敏〇词( http://www.cnbeta.com/articles/190248.htm ),但是这个列表里就没有“麦当劳”三个字中的任何一个字。是否还有另一份隐藏的列表的可能性?
    zythum
        21
    zythum  
    OP
       2012-06-01 12:46:54 +08:00   ❤️ 1
    @chenshaoju 麦当劳在列表中
    zythum
        22
    zythum  
    OP
       2012-06-01 12:48:30 +08:00   ❤️ 1
    @chenshaoju @raptium酱的是不全的。
    试着在console下执行

    ---

    var b=_.L.NF().getKey(),c= _.L.NF().eH(),f=[];
    for(var g=0,l=c.length,t=[],i; i=c[g],g<l; f.push(t.join('')),g++)
    for(t=[],p=0;p<i.length;++p)
    t.push(window.String.fromCharCode(i[p]^b));
    console.log(f.join('\n')+'\n总数:'+f.length+'个');

    ---
    zythum
        23
    zythum  
    OP
       2012-06-01 12:50:53 +08:00   ❤️ 4
    算了我贴出来好了

    https://gist.github.com/2848881
    chenshaoju
        24
    chenshaoju  
       2012-06-01 12:52:09 +08:00
    @raptium 呃,重新运行了脚本实际看了一下,的确有麦当劳。
    不过github上的那个的确不完整,谢谢。
    chenshaoju
        25
    chenshaoju  
       2012-06-01 12:52:31 +08:00
    @zythum 谢谢,后来重新运行了脚本,有了。
    whbell
        26
    whbell  
       2012-06-01 13:18:55 +08:00
    把党国那点蛋疼的东东都被你们挖出来了~
    mopig
        27
    mopig  
       2012-06-01 13:19:51 +08:00
    google.com 版的也有过滤么?
    zola
        28
    zola  
       2012-06-01 13:20:27 +08:00
    每个关键字背后都有故事
    raptium
        29
    raptium  
       2012-06-01 13:28:19 +08:00
    @chenshaoju
    @zythum

    嗯,我的 code 有点问题,所以没有输出全
    zythum
        30
    zythum  
    OP
       2012-06-01 13:31:46 +08:00
    @mopig 都有
    @zola 以后可以开个系列节目了
    regent
        31
    regent  
       2012-06-01 13:32:20 +08:00
    @zythum 多谢,这个列表有意思
    sobigfish
        32
    sobigfish  
       2012-06-01 13:33:01 +08:00
    那个[玩ps
    玩photoshop]有啥故事,还要那个[女保镖]呢?
    Benisme
        33
    Benisme  
       2012-06-01 13:33:22 +08:00
    这个列表信息量好大-__,-
    Rice
        34
    Rice  
       2012-06-01 13:35:11 +08:00
    你们知道的太多了!
    Mutoo
        35
    Mutoo  
       2012-06-01 13:47:13 +08:00
    搞一个我最喜爱的google敏感词评选大赛吧
    slawdan
        36
    slawdan  
       2012-06-01 14:02:25 +08:00
    @mutoo 我喜欢“麦当劳”
    ro00
        37
    ro00  
       2012-06-01 14:04:09 +08:00
    google其实是想让大家都知道
    bloggerao
        38
    bloggerao  
       2012-06-01 14:04:26 +08:00
    搞一个我最喜爱的google敏感词评选大赛吧



    +10086
    raptium
        39
    raptium  
       2012-06-01 14:08:16 +08:00
    其实我一直有个问题,假如哪天一不小心把 html css href doctype 之类的词给弄上关键字列表了,是不是全中国都上不了外国网了呢……
    fline
        40
    fline  
       2012-06-01 14:30:56 +08:00   ❤️ 1
    天线宝宝………看来局子里的人很清楚我们的黑话嘛………
    ksky
        41
    ksky  
       2012-06-01 14:53:57 +08:00
    给这些词写个WIKI吧。。。
    peizh2006
        42
    peizh2006  
       2012-06-01 14:56:05 +08:00
    表示很多都不知道阿。
    还有,把这事分享给同事,同事居然得出结论说,看来google和政府妥协了。
    ISSAY
        43
    ISSAY  
       2012-06-01 14:56:18 +08:00
    @ksky good idea
    erlang
        44
    erlang  
       2012-06-01 15:05:15 +08:00
    提纯版,可在Chrome console执行源码:http://geeksh.com/p/47
    boillerk
        45
    boillerk  
       2012-06-01 15:19:47 +08:00
    Google这是想把GFW的黑名单给列出来么!
    nonozone
        46
    nonozone  
       2012-06-01 15:27:36 +08:00
    呃,天线宝宝我都不知道是啥意思...
    bitinn
        47
    bitinn  
       2012-06-01 16:40:16 +08:00
    无聊了,缩写到142字符,相信还能再缩……谁来帮下忙?

    javascript:document.write(_.L.NF().eH().map(function(a){return a.map(function(a){return String.fromCharCode(a^_.L.NF().getKey())}).join("")}))

    内容

    document.write(_.L.NF().eH().map(function(i){
    return i.map(function(j){
    return String.fromCharCode(j^_.L.NF().getKey());
    }).join('');
    }));
    Mutoo
        48
    Mutoo  
       2012-06-01 16:58:48 +08:00
    "玩photoshop" 是怎么回事
    FRHong
        49
    FRHong  
       2012-06-01 17:02:06 +08:00
    各位把CV贴上来吧,GFW的招聘部找你们找了很久了。
    chishagnjin
        50
    chishagnjin  
       2012-06-01 17:56:14 +08:00
    https://www.google.com/ 我访问这个域名,没有出现那种现象啊。
    shineG
        51
    shineG  
       2012-06-01 18:09:06 +08:00
    http://caiguanhao.wordpress.com/2012/06/01/google-gfw-blacklist 我就转个链接
    玩photoshop么,不是恶搞过官员视察么 -。-
    Joker_Qyou
        52
    Joker_Qyou  
       2012-06-01 19:30:31 +08:00
    https://gist.github.com/2850196
    我先看到了这个呃。
    redswallow
        53
    redswallow  
       2012-06-02 13:36:00 +08:00
    这个功能没了?
    csx163
        54
    csx163  
       2012-06-02 14:00:48 +08:00
    6月2日,这个功能没了
    dndx
        55
    dndx  
       2012-06-02 15:56:14 +08:00
    @csx163 @redswallow 昨天那个JS被GFW定点清除了,今天貌似谷歌也把功能下架了...
    lentrody
        56
    lentrody  
       2012-06-02 16:00:29 +08:00
    果然是儿童节礼物嘛
    9hills
        57
    9hills  
       2012-06-02 16:23:37 +08:00
    @dndx 没有吧,现在还在
    zythum
        58
    zythum  
    OP
       2012-06-02 16:23:50 +08:00
    真的没有了
    dndx
        59
    dndx  
       2012-06-02 16:37:20 +08:00
    @9hills 现在打开 http://www.google.com.hk/?esrch=SearchNotices::OptIn&q=%E9%95%BF%E6%B1%9F&hl=en 搜索也没有提示了(已翻墙)
    可见已经木有了。。。
    zx900930
        60
    zx900930  
       2012-06-02 17:00:52 +08:00
    这功能没了.果然很("▔□▔)
    fline
        61
    fline  
       2012-06-02 17:36:50 +08:00
    @nonozone wēn宝宝,说话语速慢,所以……
    9hills
        62
    9hills  
       2012-06-02 17:52:28 +08:00
    @dndx
    @zythum


    我这还有。。
    asousuo
        63
    asousuo  
       2012-06-02 18:06:38 +08:00
    @9hills 请问楼上怎么放图片进去的?
    csx163
        64
    csx163  
       2012-06-02 20:57:50 +08:00
    google的反击仅仅如此而已么,GG大神要给力啊
    zythum
        65
    zythum  
    OP
       2012-06-02 21:15:02 +08:00
    @asousuo 直接贴围脖图床的url就可以了。

    快捷的方法。 http://www.v2ex.com/t/36410#reply130
    90blog
        66
    90blog  
       2012-06-02 22:13:50 +08:00
    args
        67
    args  
       2012-06-02 22:46:30 +08:00
    @zythum 小心搞到github被墙。
    loddit
        68
    loddit  
       2012-06-14 14:32:41 +08:00
    google代码更新啦,压缩后变量名什么的就变了。

    大家只要看下js,里面一大坨数字的就是关键字列表。

    解码的方法就是 String.fromCharCode(keyword^30303); => keyword 就是列表里的关键字
    在console里遍历一遍就出来结果了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1291 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 17:56 · PVG 01:56 · LAX 09:56 · JFK 12:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.