V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sillydaddy  ›  全部回复第 6 页 / 共 148 页
回复总数  2951
1 ... 2  3  4  5  6  7  8  9  10  11 ... 148  
人说前门楼子,你说胯骨轴子。人说结构性失业,你说程序员自虐。确实是鸡同鸭讲。
2 月 26 日
回复了 constantine008 创建的主题 问与答 非常看好 AI,应该做什么
@6581 这个问题价值上百万,我不会白白告诉你。 :doge
能免费告诉的只有这些:可以试试列出现在 AI 还不擅长的,然后看看里面有哪些不容易低成本实践、获取数据、验证。这些就是近未来 AI 不擅长的人类高地。
2 月 26 日
回复了 shyrock2026 创建的主题 程序员 现阶段的 AI 你很难说它算一个员工。。。
AI 有些懒!这也许是训练导致的偏好。

我在做的一个 gtd 工具,让 AI 加啥就加啥,让它改啥就改啥。但一点主动性都没有。每次我都自己试用后,看缺哪些关键功能。后来,我灵机一动,让 AI 自己看还欠缺哪些核心功能,原 prompt 是这样的:

「你来总结一下这个项目,目前从功能上来说,还欠缺哪些功能?仔细看看,还有哪些影响基本可用性的。」

它吭哧吭哧列出 3 个大的功能缺失:任务删除、目标删除、目标编辑。然后我就让它修复掉,很丝滑。

所以,你需要另外一个 AI 或者另开一个对话,来监督和测试它,而不是指望它自己监督自己,AI 很懒。就你的情况来说,你只需要一句极其简短的提示词:“请针对这个功能执行冒烟测试,并将测试结果输出到 issues 中”
2 月 26 日
回复了 wienli 创建的主题 职场话题 34 岁大龄失业程序员的迷茫。。。。。。
分情况。需要集中注意力的任务,3 小时算是非常不错了!再长了,人受不了!除非精力超级旺盛。或者对任务感兴趣。我有过连续 1 天都在高强度思考和实践的,但毕竟是特殊情况。一般在工作中遇到的任务,不反感就不错了,即使是做自己的副业,也往往是只对目标很享受,但实践过程往往要经历意志的磨练,说白了就是过程比较痛苦。

因为之前确实遇到过畏难情绪导致的拖延,无论是公司的工作还是自己的项目。所以目前,我在尝试实践你所说的,也就是把这些不同类型的任务分开处理,具体就是,比较痛苦需要消耗注意力的主任务,放到一起处理(有 Youtube 博主说 5 点起床到 8 点);琐事杂事不得不做的任务放到一起处理(比如集中半小时来一起做);比较享受的任务可以放到一起;痛苦任务中可以安插一些短时的休息。
2 月 14 日
回复了 extrem 创建的主题 程序员 AI 编程后,我体会到了当 boss 的感觉
“领导半夜都在拉会,看起来精力无限是因为他们根本不用做执行,大脑决策的频率远低于牛马们”,说得太好了,确实是这么个理儿,领导只要结果,领导需要的脑力消耗比开发少太多了。
2 月 13 日
回复了 hotea 创建的主题 分享发现 蚁群算法模拟,在线体验
@ceilingyear 注意刀的位置,切莫搞错。看起来壕,其实就是 1 块钱,哈哈。这样有意思的分享,1 块打赏都有点少了。可惜 v 站持币几千人,舍得打赏的没有几个,至少我没怎么见过。
2 月 13 日
回复了 hotea 创建的主题 分享发现 蚁群算法模拟,在线体验
很有意思,感谢分享!

我观察了一段时间,发现有些蚂蚁会留下信息素,有些则不会。这似乎是 bug 。如果不是 bug 的话,这个特性也导致了很多时候,蚂蚁收敛不到走近路的状况。

不过还是非常有意思的一个创作!
2 月 13 日
回复了 livib 创建的主题 分享发现 Codex 5.3 Spark 速度达到了 1000tok+/s
Cursor 里面没看到,Spark 是什么型号?快速版吗?
2 月 12 日
回复了 SupDigitalOcean 创建的主题 分享创造 带你从头训练一个 LLM
这个思路很好。不过看了下,似乎透露的信息太少,不登录完全不知道内容是什么,至少把可视化的内容透露出来一些吧。
2 月 12 日
回复了 rayeaster 创建的主题 阅读 看到本有趣的书 准备过年的时候读一读
答案就在 OP 的头像里 :doge
同问。我也感觉现在自动化测试是 vibe coding 的核心关键,而限制自动化测试的就是成本。

我感觉只能等 token 价格下降了。刚试了这个帖子( /t/1192001 )的图片,125KB 左右的一个 jpeg 文件,问里面有几个小人儿,花费了 1 万多的输入 token (这里不排除有系统提示词之类的,但大体是 1 万 token ),说明截图还是很费 token 的,Sonnet4.5 的话大概两三毛钱。

有没有可能优化一下测试流程,尽量直接一步到位加载目标网页的数据,而不是逐步点击,也就是把测试也模块化,当然我没有做过测试,只是瞎猜。但 token 贵的话,只能人工优化测试流程了。
@94 付诸行动吗,有些难点:1 是我觉得它是水到渠成的事,到未来真假难辨时,其他商业实体自然会去做,我的主要兴趣也不在那里。2 是那个帖子本意是看个人有哪些**低成本**的相关机会,讨论下来感觉都是硬件、厂商这些基础设施的事,没有太多外溢给个人的机会。
@94 没有任何削弱,反而加强了——事实是空气,无论对人类还是对 AI 。因为它们最终都要活在现实世界中,如《黑客帝国》这部电影讲述的,有几个愿意活在 matrix 的世界里面呢?
2 月 12 日
回复了 buydip 创建的主题 问与答 咨询几个问题
自建节点有屏蔽功能,你是不是被屏蔽了: /t/1187999
你说的有 2 个层次:

1 是人类还需不需要从前端来获取信息。肯定需要啊,又没有进化成直接读取 token 和 html 代码。
2 是前端还需不需要人来参与创建。这个视情况吧:
2a. AI 实时的动态创建,你给 AI 一个请求,AI 把数据动态拼装起来,再动态生成前端页面展示给你。
2b. AI 动态拼装太复杂太慢,或者不精确,那么就由用户指令 AI 「培育」一个符合用户喜好的 UI 界面。当然这种培育出来的 UI 都在本地了,也不需要产品开发者去发布了。
2c. UI 比较具有普适性(每个人用法差不多),或者较为复杂,没有必要每个人用 AI 自己开发一套,费时费钱,那一套打磨好的通用 UI 可能会比较节省成本。每个用户的 AI 可以自己拿过来接手定制,甚至有不同 UI 的竞争。到时候一套 UI 的开发者就会利用这个 UI 的定制授权来盈利。
我是在 cursor 里面试的。感觉上面的成绩,跟 ARC-AGI 这个图形推理的测试成绩高度相关:

https://arcprize.org/leaderboard
有意思,试了几个模型:
Opus 4.5 thinking ,对了 0 个。

Opus 4.6 thinking ,对了 2 个( Bob 和 Adam )。

GPT 5.2 codex extra high thinking ,对了 3 个( Bob, Adm 和 Tommy )。

GPT 5.3 codex extra high thinking ,对了 5 个:
Bob:从 Bob 右侧线头出发,沿线向右后下弯,终点箭头指向中间黄绿色小人。
Jack:从 Jack 下方线头出发,走上方并行线中下方那条,终点箭头指向右上浅橙(偏米黄)小人。
Jimmy:从 Jimmy 下方线头出发,走上方并行线中上方那条长线,再沿右侧外圈下绕,终点箭头指向右中深蓝小人。
Tom:从 Tom 下方竖线出发,向下再左弯,终点箭头指向左下黄色小人。
Adam:从 Adam 左侧长线出发,沿底部向左再沿左侧上行,终点箭头指向左上粉红/玫红小人。


GPT codex 是用的编程工具处理的,尝试用 opencv 失败,后来用的 ffmpeg 。我还特意把线加粗了,不行的还是不行。
在 GPT 5.2 尝试过程中,里面冒出了这样一句: “我在校准裁剪参数,马上拿到上半部分的放大细节来确认 Jack/Jimmy 这两条最容易混淆的线”
1 ... 2  3  4  5  6  7  8  9  10  11 ... 148  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4136 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 52ms · UTC 04:12 · PVG 12:12 · LAX 21:12 · JFK 00:12
♥ Do have faith in what you're doing.