V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  locoz  ›  全部回复第 18 页 / 共 323 页
回复总数  6446
1 ... 14  15  16  17  18  19  20  21  22  23 ... 323  
还有像前面 @drymonfidelia 说的采集上报各种传感器数据做识别这种做法,理解不了的话可以去看看字节跳动的产品,抓包会看到大量向 mcs.zijieapi.com/list 这个地址上报的数据,内容细致到可以跟录屏一样完全回放你在使用时的整个操作过程和你操作时应该看到的状态。

这种程度的数据用在防护上,想要精准识别出是人还是机器操作,又或者是直接只请求了特定接口搞事情,都是很容易做到的,就看想不想管而已。
你说的这种做法叫投毒/埋坑,属于早就被玩烂的操作了。

常见的操作有比如先获取一些浏览器环境中获取不到的信息,用于检测是否是真实浏览器,然后如果不正常就在生成的 sign 里打上特殊标记,或者是发个网络请求直接上报具体的环境信息,或者是打日志警告,或者是执行一些计算量超出正常水平的东西再执行原始逻辑之类的。玩法一堆,而且远比“删库”能恶心人。

“删库”这种极端操作的成功概率基本为 0 ,你也无法保证你不会影响到普通用户,再加上大点的安全厂商都会有做自动化的安全审计,检测到你搞骚操作就直接就给你标记风险了,毕竟谁知道你是想做防护还是想搞普通用户呢?

另外,你以为这种操作很无解,代码混淆了没人仔细分析就看不懂,但其实解析成 AST 之后处理一下冗余内容,代码结构是很清晰的。再加上现在的大语言模型上下文长度已经足够长了,能力完全够将清理后的逻辑部分代码还原出大致的原始状态,或者是直接按要求对代码进行自动化处理。无论是剥离出实际需要的部分,还是察觉出你整活,都极其简单,门槛极低。以前还得专门训练模型,现在花点小钱随便就能搞。

所以可以说在当下,在中低程度混淆处理的代码层面投毒/埋坑的意义已经不大了,代码层面的对抗主要还是在让别人无法正常分析代码上,比如几年前比较先进的技术是套一层“虚拟机”,逻辑完全按人家自己的来,后面发展出了基于 WASM 直接跑加壳后的编译后程序,再后面就是像楼上说的结合动态变化的处理方式高频更新。但是这些操作终究是前端代码层面做的事情,大不了别人完全虚拟一套环境搞,只要级别比你高,你代码里做再多操作也看不出毛病。

如果你平时有了解一些相关安全厂商做的事情的话,你会发现其实他们现在都在往行为风控方向发展。以前他们都会吹自己的验证码、WAF 之类的产品有多难被破解,代码加密、动态更新、高强度壳啥的。现在吹的都是通过识别客户端各方面的操作是否像真人发出的,然后进行分级风控,比如疑似风险客户端就必须要进行计算后才能走正常逻辑,通过大幅加高攻击方成本的方式来解决问题。
257 天前
回复了 capgrey 创建的主题 程序员 目前你体验最好的 AI 是哪个?
@wonderfulcxm #54 代码量大、逻辑复杂的情况下,吊打 GPT4 那点上下文长度...无论具体水平上如何,至少上下文长度上限充足,可以确保它不会瞎编内容然后越跑越偏。
257 天前
回复了 cairnechen 创建的主题 问与答 新版 Mac QQ 好用吗?
一般,主要一个问题是老版本更新需要迁移聊天数据,直接把我笔记本上的记录搞丢了一部分
258 天前
回复了 punu 创建的主题 生活 如何调整“开车骂行人,走路骂司机”的心态
不用调整,世界上本来就不缺傻逼,你在哪个角度都会碰到傻逼,这是很正常的现象。说白了,你骂的只是那个被你碰到的傻逼而已。
@matrix1010 #22 你把事情想复杂了,自己去搜索、根据搜索到的页面内容进行归纳总结和找到需要的信息、自己添加日志进行 debug 、自动调用命令行、自动通过特定方式部署程序等模拟人机交互的事情,都是只需要做好操作接口,并且在 prompt 中告诉语言模型可以这么做,就能轻松做到的事情,这方面反而是这整个产品中最简单、最没有门槛的。

因为做到这些事情的核心在于决策能力,而决策能力来源于语言模型,像 GPT4 、Claude2 这种头部级别的大语言模型本身就具备做出这种决策的能力,并且之前出现过的很多让 AI 进行自动化操作的产品都是这么做的,包括 ChatGPT 上的插件功能本质上也就是这么做的。
@matrix1010 #19 小公司没有任何 [自己训练一个能跟 GPT4 之类头部级别的模型 PK 的模型] 的可能性,所以为了效果好只能是基于 GPT4 或者 Claude2/3 这种头部的大模型来实现,否则模型的基础能力差会导致很多问题完全解决不了。

另外,新智元 介绍 Devin 的文章最后有提到:“CEO Wu 并没有详细说明他们的智能体背后使用的 AI 技术,只是笼统地解释说,团队找到了将大语言模型(例如 OpenAI 的 GPT-4 )与强化学习技术相结合的独特方法。”,很显然也只能是行业头部的大模型了。

效果方面我觉得没什么好对比的,根据官方的说法和演示视频中的效果来看,大概率是加了个提取关键信息的模型,代替了人提取关键信息给 AI 的步骤,做到在使用尽可能压缩上下文的情况下丰富信息量,自动化地让 AI 在输入信息密度极高的情况下输出东西,这效果当然会比上下文长度受限、可输入信息不全的情况下只能直接丢问题给 AI 的情况要好。

但其实随着像 Claude 3 这种支持更长上下文的模型进一步发展,未来完全可以在不需要那么精细地提取关键信息的情况下让 AI 得到所需的所有信息,哪些文件相关那就直接把文件都丢给 AI 就行了。在这个前提下,Devin 做的这种优化其实优势是会越来越小的。
@pixelbook #11 在决策层被 AI 取代之前,底下干活的早就被取代完了。决策层最核心的能力之一就是想法要具有前瞻性、能看透一个甚至多个行业找到最合适的路线,指望靠着以大众发布的内容为主的数据去训练出一个能站在更高的角度看问题的 AI ,在当下属于是做梦。当下这种训练方式能做到的 AI 仅限于把客观的信息概括出来,在没有人去引导的情况下是完全做不到跨多行业“思考”出能称得上是“决策”的东西的。
@matrix1010 #8 不至于的,都是依赖别人的模型实现的效果,在用的模型一致的情况下做不到多大的能力差距。
有些类型的问题,当下的语言模型搞不定就是搞不定,哪怕是人专门去精选输入内容和调整 prompt 都很难搞定,这是模型基本能力的问题,再优化也解决不了。
决策能力方面看起来是模型的问题,可以试试在用 Claude 3 的情况下能达到什么程度,我现在让 AI 改代码、加功能都是几个文件直接丢过去了,可工作的上下文长度长带来的效果极其明显。
飞书也有搞这些,还请人做了好多软广。但说到底这种功能实现起来都很简单,核心问题还是数据安全和隐私问题,解决不了这个问题就永远没法推广起来,这不是说不考虑就能不考虑的…
262 天前
回复了 nullo 创建的主题 宽带症候群 代理服务器
@nullo #9 那你可以选择用 v2ray 之类的解决问题
262 天前
回复了 yz346287786 创建的主题 分享发现 关于 XR 设备,你怎么看?
Apple Vision Pro 主要贵在更好的屏幕、更好的透镜、更好的芯片、更多的传感器,以及没多大实用意义的铝合金外壳、前屏幕模块这种东西。

市场目前主要是没有办法让人愿意日常使用,所以起不来。但后面一段时间会出来的比如 Immersed 搞的眼镜式头显,说是跟 Apple Vision Pro 一样的屏幕,如果它体验做得可以,那拿来日常办公还是很好的,外观好看、轻便、不强依赖电脑、该有的主要功能都有,完全能满足日常使用的需求。
@siweipancc #10 AI:我好委屈,你又没跟我说要这样,我怎么知道你要什么。
@mandex #7 语言模型对数字和一些抽象的东西没概念不代表它不能借助其他东西完成需求,像你这个需求只要允许它用代码先计算再把结果输出,它就能输出绝对正确的值。这种问题你就算给人做,人也得借助工具去计算一下才能确保结果没问题...

让语言模型写代码,完全可以只是把需求讲清楚,它写完程序自己再写测试,确保代码层面没问题、能满足需求之后直接把成品给人验证就行了,人是可以不需要去看代码的。当下无非就是成本问题不适合这么做而已,真要做的话还是可以做的。
@kingmo888 #29 主播不好看其实是普遍现象,尤其是这种搞户外直播的。不同的人看的东西不同,这种年轻人看会觉得很 low 、人不好看,但是中老年人很喜欢看,甚至人家还可以做到挺赚钱。
262 天前
回复了 nullo 创建的主题 宽带症候群 代理服务器
简单的代理用 tinyproxy 、squid 之类的都可以,简单配置一下就能用。复杂情况可以用常见用于翻墙那些东西,shadowsocks 、v2ray 之类的。
1 ... 14  15  16  17  18  19  20  21  22  23 ... 323  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1016 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 19:59 · PVG 03:59 · LAX 11:59 · JFK 14:59
Developed with CodeLauncher
♥ Do have faith in what you're doing.