V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
zmt2023
V2EX  ›  分享创造

做了一个自动总结股票评论的网站,可以快速了解一只股票的态势

  •  
  •   zmt2023 · 144 天前 · 1850 次点击
    这是一个创建于 144 天前的主题,其中的信息可能已经有所发展或是发生改变。

    引子

    作为一根佛系的大 A 韭菜,我买了四五只股票,但平时 996 没空关心股票的动向,只有到了周末会打开雪球翻一翻。一只比较热门的股票在雪球上每周能积攒七八百条讨论贴,而且里面很大部分是些莫名其妙的吹牛和情绪宣泄,真正有参考价值的帖子大概就占十分之一。我看一条帖子至少要 5 秒,如果要把帖子都翻完,每只股票要翻一个小时,对于我宝贵的周末时间来说这个成本是不可接受的,所以我经常是草草翻一遍了事,很难抓到一些有效信息。

    某天股票突然涨了几个点,我考虑要不要套现离场,这种重大决策值得我去好好翻一遍近段时间的帖子,看看其他人都在说什么,于是我花一两小时翻完了这支股票和关联股票的帖子,有价值的帖子或许有一两百条,但里面看多和看空的都有,双方对比不算悬殊,大概是 4:6 ,也可能是 6:4 ?我也没仔细点过,而且两边听起来都有点道理。结果我这一两个小时基本是白花了。

    正文

    上面写的就是我这个网站的 user story,也是我个人的亲身经历,为了解决这个需求,我开发了后湖这个网站。

    后湖 https://www.houhu.info

    总的来说,后湖会在各类财经平台上抓取评论贴,然后使用大模型对帖子进行分类过滤。首先会过滤掉没营养的帖子,然后对言之有物的帖子进行看多/看空的情绪判断,最后会归纳这些帖子的观点依据,比如是因为财务的原因还是产品的原因。这样用户能快速感知到这只股票近期的态势,是看涨的人多还是看空的人多,看涨里面又是因为什么原因看涨,不会再出现 user story 里狂翻两个小时什么结论也得不出的情况。

    现在主要的功能有三块:

    雷达图

    把帖子观点按照利好利空以及话题种类做了分类,这样能直观体现市场关注点。统计结果(不同话题下观点的数量)用雷达图做可视化对比,以这张图为例,可以看出普遍认为该公司的产品有优势,而利润营收(财务状况)不容乐观。

    radar_plot

    观点一览

    如果想看具体的观点,这里会提供每个观点的摘要( AI 生成)和原文链接,同时提供了发布时间与各种话题的分类筛选。 post_plot

    情绪走势

    最后是近段时间的情绪指数统计,同时在最下方提供了股价走势 K 线的对比,中间一排是计算情绪指数用到的样本量,样本量越高指数越可信,如果样本量不足 10 条,则当天的情绪指数可能参考价值不大。 sentiment_plot

    尾声

    后湖是个业余项目,现在还有许多的待优化点,欢迎大家吐槽批评,如果对网站的更多细节感兴趣,可以去网站https://www.houhu.info首页添加公众号,里面有比较详细的功能更新日志和说明。

    大概一个多月前,我在即刻上小小的宣传了一下网站,也收到了不少点赞转发,但到今天为止,依然没有多少留存的用户。我思考了一下,可能的原因有下面几点,不知道各位试用过程中有没有遇到:

    1. 没有覆盖到用户感兴趣的股票(当前因为成本原因只覆盖了热门的 50 多支,有需求可以留言)
    2. 觉得 AI 的总结和分类不靠谱
    3. 访问不方便(手机版页面适配不佳,网页打开速度太慢等)
    4. 平时不看社交平台的股票评论,不够可靠

    如果有,请留言告诉我,对我下一步的优化非常重要,万分感谢!

    11 条回复    2024-01-08 15:34:55 +08:00
    Beeium
        1
    Beeium  
       144 天前
    楼主我有个需求如下,你看看能做吗?合适的话留言我把联系方式给你,我们更深入的沟通下?

    朋友想专业进入币圈薅毛行业.

    基于总所周知的原因的,很多项目在早期阶段是隐私状态,但是进入到上 shi 或者交互阶段一般就会开始半公开或者小范围开放, 这个时候互联网上就会有蛛丝马迹出现,打算要做的 爬虫就是基于这个需求而提出的:

    从 x 或者币圈相关媒体中找到公开或半公开的项目
    从公众 hao/Tg/D 群组中找到相关公开或半公开项目

    根据关键词热度进行画图,参考 dapanyuntu,com 鼠标移动点击即进入到该项目详情页.
    后台(如果需要)有简单图形配置界面,方便管理。
    flmn
        2
    flmn  
       143 天前   ❤️ 1
    大概看了下,你爬的是雪球评论,只从文字分析,但是你不知道说这话的人水平如何,有没有私心,或者纯粹是水军。这样的话,得出的结论也是不太可靠的。
    zmt2023
        3
    zmt2023  
    OP
       143 天前
    @Beeium 这个想法挺有意思的,但我还有全职工作,时间排不过来,不好意思~
    zmt2023
        4
    zmt2023  
    OP
       143 天前
    @flmn 感谢指点,确实这些评论的可信度是个问题,后面我会考虑给帖子添加一些权重,比如点赞评论数,甚至去自动搜索涉及的消息来源。不过当前来说,我希望先把后湖搞成一个能快速获取全局视野和灵感的地方,这也是那些专业软件缺失的功能,严肃的交易决策做出前还是需要在专业软件上做验证。
    xinyana
        5
    xinyana  
       143 天前 via Android
    股市?你跟她讲技术技术,他跟你讲套路,劝君远离
    taofoo
        6
    taofoo  
       141 天前
    请教一下,这个 ai 是自己训练出来的么?有啥框架或者文章参考一下不
    zmt2023
        7
    zmt2023  
    OP
       141 天前
    @taofoo 现在是调的 ChatGPT 的 API ,不过之前试过开源的 ChatGLM2 ,效果也不会差太多
    zagfai
        8
    zagfai  
       141 天前
    功能单一 没啥用途,我感觉就是,这些评论的情绪完全没有意义,你做过统计的话,有没有相关性,能统计出来的,有效果的话你应该已经赚第一波钱了
    qm
        9
    qm  
       140 天前
    @Beeium 留个联系方式,我们聊聊看?
    zmt2023
        10
    zmt2023  
    OP
       140 天前
    @zagfai 其实大部分时候网上的情绪指数是跟着股价走的,所以直接靠情绪指数交易不太可行。不过有一些异常情况,比如股价和情绪指数几天内明显背离,值得注意并且人为深入分析下。后面会考虑把这种异常标识出来。
    husinhu
        11
    husinhu  
       139 天前
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2349 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 00:07 · PVG 08:07 · LAX 17:07 · JFK 20:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.