V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
alexapollo
V2EX  ›  程序员

MetaGPT:人人都可以成为老板,运营 GPT 公司

  •  5
     
  •   alexapollo ·
    geekan · 2023-06-30 18:38:12 +08:00 · 4129 次点击
    这是一个创建于 514 天前的主题,其中的信息可能已经有所发展或是发生改变。

    MetaGPT 刚刚发布,它是一个多智能体元编程框架,设计来协同解决复杂问题。欢迎点赞、试用、分享反馈

    例子

    以架构师输出为例,以下是完全由 MetaGPT 完成的设计,一个设计只需不到¥ 1 元

    设计一个支持 GPT-4 和其他 LLMs 的 MLOps/LLMOps 框架

    llmops data api design llmops seq flow

    设计一个类似今日头条的推荐系统

    toutiao data api design

    toutiao seq flow

    第 1 条附言  ·  2023-06-30 23:20:26 +08:00
    写的确实晦涩了点,有很多同学问功能:简而言之,这个工作包含了一个完整而高效的软件公司 SOP ,可以输入一句话需求,生产一个包含产品文档、架构设计、代码的完整 repo 。
    31 条回复    2023-07-01 23:18:44 +08:00
    ZSeptember
        1
    ZSeptember  
       2023-06-30 18:49:34 +08:00
    FileNotFoundError: [Errno 2] No such file or directory: 'MetaGPT/requirements.txt'
    mooniitt
        2
    mooniitt  
       2023-06-30 18:50:58 +08:00
    F 墙( base64 ) aHR0cHM6Ly9jaG5yb3V0ZS5jb20vYXV0aC9yZWdpc3Rlcj9jb2RlPUZUSzZJRQ==
    alexapollo
        3
    alexapollo  
    OP
       2023-06-30 18:52:04 +08:00
    @ZSeptember fixed
    alexapollo
        4
    alexapollo  
    OP
       2023-06-30 19:35:29 +08:00
    @mooniitt 这是?
    wxf666
        5
    wxf666  
       2023-06-30 19:48:45 +08:00
    做个 12306 出来看看?
    alexapollo
        6
    alexapollo  
    OP
       2023-06-30 19:58:32 +08:00
    @wxf666 能出架构,还出不了代码。自顶向下的 break down (分模块实现)在 todo list 里。
    hhjswf
        7
    hhjswf  
       2023-06-30 20:12:23 +08:00 via Android
    最多充当个脚手架?
    qx1988
        8
    qx1988  
       2023-06-30 20:17:12 +08:00
    看了下视频,牛逼,一句话完成竞品分析/产品文档,然后写架构和代码;感觉是 gpt-engineer 的升级版啊,这是要把失业潮从程序员蔓延到架构师、产品经理的节奏嘛~
    qx1988
        9
    qx1988  
       2023-06-30 20:19:00 +08:00
    话说,现在能解决多大规模的项目(看了 gpt-engineer ,还是偏小工程)?能不能/啥时候能进化到写中大型项目呢?(我了解下我还有多久会失业 T-T)
    alexapollo
        10
    alexapollo  
    OP
       2023-06-30 20:37:51 +08:00
    @hhjswf 目前是的。但是¥ 1 能出 PRD/设计,我觉得对大部分人而言已经有非常高的性价比了。我自己写设计经常会一写改好几天,并不是一次性可以写完的,而对于 MG 而言,就是 1 分钟到几分钟的工作。而且,还得考虑竞品分析成本,实际竞品分析往往比设计更久。

    即使我们按最低限度,把这个时间成本按照 ¥ 1 置换 1 人天 来计算,它的价值也非常高。
    wxf666
        11
    wxf666  
       2023-06-30 20:37:55 +08:00
    @alexapollo #6 加油!期待明年能见到你司的 Windows 、Office 、Oracle 、Matlab 、PhotoShop 、……
    thinkm
        12
    thinkm  
       2023-06-30 20:39:35 +08:00
    @wxf666 我也好奇 GPT 什么时候能写这种软件,甚至是“卡脖子的”EDA 芯片设计之类的软件
    alexapollo
        13
    alexapollo  
    OP
       2023-06-30 20:48:49 +08:00
    @wxf666 感谢加油,我感觉目前的水平在 1 年内应该比较容易突破到 2000 行代码级别的自动化

    比较现实的是写一个 image_resize
    alexapollo
        14
    alexapollo  
    OP
       2023-06-30 21:03:26 +08:00
    @qx1988 这是一个准确的评论。架构师和产品经理的工作确实也可以被 GPT 所完成,尤其是成本不低的 需求调研、用户故事、竞品分析、产品定位与数据结构、接口抽象、时序流程等过程,这些过程目前来看确实可以自动化。

    失业倒不至于,在一年之内,它还只是在局部优化,能做的大概率都是行数有限的小项目,没有办法真正做中大型项目。而且,要兼容已有的工作( repo )也需要花费大量的时间,里面还有大量复杂的问题

    总而言之,只能说拥有理论上的可行性,并且目前在局部 ROI 上比较明显,但还离全能框架有比较明显的距离。
    alexapollo
        15
    alexapollo  
    OP
       2023-06-30 21:05:06 +08:00
    @thinkm 据我所知,现在已经有人用 GPT-4 造出芯片了: https://www.36kr.com/p/2308612430474753

    这个本质也是 GPT-4 可以写代码,芯片代码确实也可以当成一个大型项目来逐级分解。
    qx1988
        16
    qx1988  
       2023-06-30 21:48:31 +08:00
    @alexapollo 眼前一亮,是个好思路,完整端到端要完成复杂逻辑确实还有不少的路要走。但单环节生成辅助的智能体看上去需求挺大的(低成本的将客户需求、竞品转化为初始产品文档/解决方案,用于讨论)。去研究下源代码,有疑问再来请教大佬~
    kerb15
        17
    kerb15  
       2023-07-01 00:19:37 +08:00
    盲猜一下,这个项目实际运行起来会不会各种报错
    alexapollo
        18
    alexapollo  
    OP
       2023-07-01 07:14:33 +08:00
    @kerb15 Sure 。GPT-4 本身也是一个概率工具,有 bug 是正常的
    jameskongawork
        19
    jameskongawork  
       2023-07-01 10:51:57 +08:00 via Android
    GPT 会做产品不等于能让你当老板吧
    alexapollo
        20
    alexapollo  
    OP
       2023-07-01 15:25:03 +08:00
    @qx1988 这几天会加不同的模式,并且将策略模块写完
    alexapollo
        21
    alexapollo  
    OP
       2023-07-01 15:27:05 +08:00
    @jameskongawork 这里还是更多讲的狭义的“软件公司老板”,而且,现在只是一个初版实现,大部分逻辑还可以往下加。比如销售、售前,不同角色都可以在多智能体框架下实现
    SenseHu
        22
    SenseHu  
       2023-07-01 15:34:10 +08:00
    以后我就用这个把我们老板 fire 了 ( 手动狗头
    alexapollo
        23
    alexapollo  
    OP
       2023-07-01 15:46:54 +08:00
    @SenseHu 那你得等我们写快点儿
    bluemustache
        24
    bluemustache  
       2023-07-01 19:36:01 +08:00
    试运行了一下,效果还可以,但有什么办法可以接管已有项目吗?
    qx1988
        25
    qx1988  
       2023-07-01 19:48:37 +08:00
    用 GPT3.5 比较如何,GPT4 API 还没有(感觉大部分人也没有,门槛有点高)
    qx1988
        26
    qx1988  
       2023-07-01 19:52:15 +08:00
    另外,看了下楼主代码,各个角色都预制了一些不错的逻辑链,但实际要落地还是要根据内部场景重写下;比如看了下产品经理角色,竞品调研单纯搜索。实际我这边估计还要出入用户访谈(大量 word/pdf 导入及读取技能)、需要结合内部历史公共服务啥的
    另外,这些预制逻辑链的过程,楼主是咋摸索的?或者有啥正确或错误的经验可以分享没?感觉这是新一代的编程范式,更像学这块~
    heytttt
        27
    heytttt  
       2023-07-01 23:02:10 +08:00
    FileNotFoundError: [Errno 2] No such file or directory: 'mmdc'
    另外,建议把重试次数加大点,经常梯子不稳定都直接错误了
    alexapollo
        28
    alexapollo  
    OP
       2023-07-01 23:11:42 +08:00
    @heytttt 这个是 npm 的一个包,默认在 setup.py 中使用 npm install -g 安装,但是这里安装似乎总是会出问题,我收到了几个人的不同反馈 —— 是否可以提供一下具体的环境信息?
    alexapollo
        29
    alexapollo  
    OP
       2023-07-01 23:12:29 +08:00
    @heytttt 如果有需要,可以向我的邮箱 [email protected] 发个邮件,我可以提供一个配置,调用比较稳定
    alexapollo
        30
    alexapollo  
    OP
       2023-07-01 23:13:29 +08:00
    @bluemustache 暂时没有办法。在 TODO LIST 上,需要等比较长的时间(这个工作量比想象中的大)
    alexapollo
        31
    alexapollo  
    OP
       2023-07-01 23:18:44 +08:00
    @qx1988 GPT-3.5 可以满足基础需求,但是比较难确保稳定的 follow-instruction ,这个版本提示词写的比较多,稳定的 follow-instruction 其实很不容易 —— 这也是为什么现在没有上任何复杂策略的原因。

    word/pdf 的使用可以参考 examples 其中的单角色(如销售)代码;历史的公共服务比较麻烦,虽然在 TODO LIST 里,但以 gorilla 提供的经验而言,或许必须要训练一个独立的代码库模型,才能比较好的兼容一个大型公共库

    至于预制的提示词,这些或许在之后的版本会庖丁解牛为更多的原子技能/动作。目前的抽象或许也会大幅度修改。只能说这是目前能跑的还比较好的的或许唯一的方法。

    AutoGPT / BabyAGI / LangChain 等代码现在都用了比较多的策略,这些策略都还未合入,合入之后或许效果能够更加惊艳;除此之外,多智能体的独特性还未完全体现,这块会在下一个版本中提供
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5725 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 02:50 · PVG 10:50 · LAX 18:50 · JFK 21:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.