找回密码
 立即注册
搜索
查看: 3330|回复: 36

[科技] ai agenthermes和openclaw的相关问题,本地模型有必要吗?

[复制链接]
发表于 2026-6-12 13:19 | 显示全部楼层 |阅读模式
此帖将于2026-07-12 13:16自动关闭
在用hermes和openclaw做一个股票量化投资系统,有大量的策略,因子和回测要做,还兼顾一些图片和pdf的抓取

目前用deepseek负责编程和推理,千问用来做多模态,mimimax图像处理和生成。
token一天要用掉60块钱。觉得一个月1800有点厉害了。本地有必要配置一个24G显存的电脑吗,可以解决掉多少token的事情,换句话说,一天能省多少云模型的费用呢?
有可能回测,知识库索引,每日数据接口更新,和QMT的通信,还有些网络搜刮skill的使用都会用本地的云模型。
回复

使用道具 举报

     
发表于 2026-6-12 13:27 来自手机 | 显示全部楼层
本帖最后由 omnitoken 于 2026-6-12 13:30 编辑

你这个选择非常迷惑

ds推理又不强,他强的是上下文长度和便宜
然后minimax实际用途就是招笑模型,还是别用了

然后你的PDF和图片抓取本地弄个小模型都够了,集显都能跑

最后建议看下token plan



—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2026-6-12 13:28 | 显示全部楼层
一个月省的1800,就不怕投资策略出点差错亏个几百倍? 拿来量化投资怎么能还差这点成本

论坛助手,iPhone
回复

使用道具 举报

 楼主| 发表于 2026-6-12 13:34 | 显示全部楼层
推理不强就没有更便宜的了吖,哪个推理最强,国产的额?
我不太像用code,太贵了,code的国内中转站包月300的,我还在考虑,听说会掺一些开源模型的token
回复

使用道具 举报

     
发表于 2026-6-12 13:35 来自手机 | 显示全部楼层
hermes是干这个用的吗
回复

使用道具 举报

 楼主| 发表于 2026-6-12 13:38 | 显示全部楼层
hermes和claw交叉验证啊,我要接不同的模型,建立不通的知识库,skill也不一样。hermes做大脑,claw做执行,然后一起验证。

DeepSeek + Codex 互补分析
DeepSeek        Codex (OpenAI)
代码精度        中上,偶尔有逻辑错误        强,专门训练过代码生成
中文金融语境        强,理解 A 股/政策/术语        偏弱,偶尔用美股思维套 A 股
幻觉倾向        倾向于"自信地编造"数据        倾向于"过度简化"复杂逻辑
量化数学        中上        强,但不熟悉中国特色指标
API 成本        低        高
DeepSeek 擅长的地方 Codex 弱,Codex 擅长的地方 DeepSeek 可能翻车。交叉验证刚好互补。

优化后的 6 Profile 架构

┌─────────────────────────────────────────────────────┐
│              Kanban 调度中枢                          │
│       dispatcher 每 60s tick,一次派 1 个任务         │
└──┬──────┬──────┬──────┬──────┬──────┬───────────────┘
   │      │      │      │      │      │
   ▼      ▼      ▼      ▼      ▼      ▼
┌──────┐┌────┐┌────┐┌────┐┌────┐┌──────────┐
│default││数据││策略││风控││交叉││QMT 执行桥│
│      ││总管││引擎││守卫││校验││          │
│DS    ││DS  ││Codex││DS  ││Codex││Codex    │
└──────┘└────┘└────┘└────┘└────┘└──────────┘

DS = DeepSeek    Codex = OpenAI Codex
为什么这样配模型
Profile        模型        理由
策略引擎        Codex        回测代码逻辑不能出错,Codex 代码精度最高
风险守卫        DeepSeek        A 股风控需要理解政策/涨跌停/流动性,中文语境
交叉校验员        Codex        验证 DeepSeek 的风控结论——不同模型家族,盲区不重叠
数据总管        DeepSeek        Tushare/akshare/东财的 API 都是中文文档
QMT 执行桥        Codex        API 调用必须精确,不能搞错参数
核心设计:只有 Codex 在"输出",DeepSeek 在"验证"的环节,反过来 DeepSeek 输出时 Codex 验证。两个模型从不单独拍板。

策略引擎(Codex)
  → 生成信号:"轮动到 159915 创业板ETF,权重 40%"
  → 附带回测数据和置信区间

        ┌────────── 分叉验证 ──────────┐
        ▼                              ▼
  风控守卫(DeepSeek)              交叉校验员(Codex)
  "波动率偏高,建议降至30%"         "回测数据我重新算了一遍,
   "止损线设在-5%"                  信号逻辑没问题,
                                    但风控建议合理"
        │                              │
        └──────┬───────────────────────┘
               ▼
         结论一致?
         ├─ YES → QMT 执行
         └─ NO  → block 任务 + 标注分歧点 + 飞书告警
                    → 两个模型各写自己的理由
                    → 你来裁决
两个模型同时幻觉同一件事的概率 → 极低
出现分歧不盲动 → block + 我拍板
对比之前的方案,优化了什么
维度        之前        优化后
Profile 数量        7        6(market-monitor 并入 risk-guard)
模型策略        随意分配        DeepSeek 偏中文/风控,Codex 偏代码/校验
反幻觉        没有专门设计        关键环节双模型交叉 + 分歧自动 block
执行安全        QMT 自动下单        Codex 精确调用 + 飞书确认后放行
回复

使用道具 举报

     
发表于 2026-6-12 13:39 | 显示全部楼层
经典生活缝缝补补,股市挥金如土,真不如问问豆包
回复

使用道具 举报

 楼主| 发表于 2026-6-12 13:41 | 显示全部楼层
啊哈哈哈,主要是有点想法买台机器玩玩游戏,老的笔记本五年前的了
回复

使用道具 举报

     
发表于 2026-6-12 13:43 | 显示全部楼层
太搞了,我还以为你是大模型做回测或者写一个系统,结果是大模型做交易?正经都是自己做好策略训一个模型出来,股市本来就不可预测了,你还让更加不可控的模型来直接做交易
回复

使用道具 举报

 楼主| 发表于 2026-6-12 13:45 | 显示全部楼层
pwzzy 发表于 2026-6-12 13:43
太搞了,我还以为你是大模型做回测或者写一个系统,结果是大模型做交易?正经都是自己做好策略训一个模型出 ...

不是的,因子和策略都是自己训练和做的。不是自动生成或者是拷贝来的,要手搓,一步步验证的。属于自己的内容。
回复

使用道具 举报

     
发表于 2026-6-12 14:35 来自手机 | 显示全部楼层
自由之紫roy 发表于 2026-6-12 13:45
不是的,因子和策略都是自己训练和做的。不是自动生成或者是拷贝来的,要手搓,一步步验证的。属于自己的 ...

你这架构也非常搞笑,openclaw写的和💩一样也起不到交叉验证的作用

你还不如就用hermes

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

 楼主| 发表于 2026-6-12 14:53 | 显示全部楼层
omnitoken 发表于 2026-6-12 14:35
你这架构也非常搞笑,openclaw写的和💩一样也起不到交叉验证的作用

你还不如就用hermes

openclaw用的skill和知识库和hermes不同,另外会用不同的办法训练,基础股票数据来源也不同,也不想用一个agent的处理方式,肯定是不同的agent更合理一点。
profile越多,也越容易出现幻觉。
回复

使用道具 举报

     
发表于 2026-6-12 15:15 | 显示全部楼层
你构建实际要用的东西为什么要用龙虾和h呢,意思是让这些浪费token的东西构成这个系统吗
1600rmb你还不如去找A/和OAI的套餐+DS
回复

使用道具 举报

 楼主| 发表于 2026-6-12 15:38 | 显示全部楼层
因为我没有很强的程序基础啊,必须靠agent来实现和进化,毕竟有很多skill可以直接用
回复

使用道具 举报

     
发表于 2026-6-12 21:12 | 显示全部楼层
hermes用flash的话可以试试opencode go,便宜很多。
回复

使用道具 举报

     
发表于 2026-6-12 21:26 | 显示全部楼层
本地模型的话,说实话没必要,测算过,本地模型的价格相较于api价格还是高的
回复

使用道具 举报

     
发表于 2026-6-12 21:31 来自手机 | 显示全部楼层
玩量化还舍不得一个月1800吗。
一个好的接口就不止了吧,如果你用便宜接口那速度还玩什么量化

—— 来自 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-6-12 21:35 | 显示全部楼层
哥,做量化别用llm,只要出现一点幻觉都是巨大的偏差
回复

使用道具 举报

     
发表于 2026-6-12 21:39 | 显示全部楼层
还有进化,牛的
这两洋鬼token烂烧工具确实能搞点噱头,能不能搞个 mega 进化极巨化出来
技能这个东西又不是五号电池七号电池有物质硬件的不同,文本几行字,就不用存在一个文本约束规则其他 agent 用不了的
越读越感觉 lz 像伪人但是这迷惑的语句 AI 拼不出来
而且现在国外两订阅制的价格比你报的 1600~1800 要低,我首先质疑你的比价能力和信息获取能力    Re:Source

评分

参与人数 1战斗力 +1 收起 理由
AMekodoku + 1

查看全部评分

回复

使用道具 举报

     
发表于 2026-6-12 21:45 | 显示全部楼层
进化是指你不断加规则约束吗……
那不是只会进化出绕过规则的能力?
回复

使用道具 举报

     
发表于 2026-6-12 21:54 | 显示全部楼层
大模型做交易真的靠谱吗?对自己钱包好点吧

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-6-12 21:55 | 显示全部楼层
还有hermes所谓的skill进化真的只能当玩具,不咋能信的

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-6-12 23:06 来自手机 | 显示全部楼层
泥潭什么时候支持markdown格式

—— 来自 OPPO PLG110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

 楼主| 发表于 2026-6-13 07:11 | 显示全部楼层
能节约一点是一点,散财很快,编程和推理我肯定用云模型,其他交给本地小模型,这毫无问题啊,不然买48G 4090以及5090来做推理的又是哪些人呢
回复

使用道具 举报

     
发表于 2026-6-13 07:42 来自手机 | 显示全部楼层
自由之紫roy 发表于 2026-6-13 07:11
能节约一点是一点,散财很快,编程和推理我肯定用云模型,其他交给本地小模型,这毫无问题啊,不然买48G 40 ...

打游戏的人

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-14 17:27 | 显示全部楼层
本地模型你这个价位跑不动 能跑的都是弱智 字面意义上的
觉得价格贵可以把一些简单的任务切成更廉价的模型 但是需要注意廉价模型的失误率更高 你需要能接受把1.00写成100的错误成本
图像输出和修改的成本很高 特别是多轮对话会进入上下文 你每一次对话都会把之前的图片再发一遍 虽然会进入缓存累积下来还是很贵
你可以做个简单的测试 把输出图片改成输出网页 其他流程都不变 两个任务的消耗量差距 如果你比较依赖图片理解内容这个差距会非常大
回复

使用道具 举报

     
发表于 2026-6-14 17:58 | 显示全部楼层
48G 4090以及5090的价格足够你跑一年多的模型了
而且自建模型的速度你更是受不了,更别提性能了
回复

使用道具 举报

     
发表于 2026-6-14 18:04 来自手机 | 显示全部楼层
我虽然用hermes,但它那个所谓的进化我全当没有,根本就是炒作来的。
然后自己有显卡需求的情况下顺便跑跑大模型还凑合,专门为这个买显卡基本不划算。速度,电费,噪音,智商都是问题。
我只在需要无审核的情况下才用本地模型。

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha
回复

使用道具 举报

     
发表于 2026-6-14 22:41 | 显示全部楼层
是的呢,AI炒股十分靠谱。惊世大模型deepseek就是为了量化交易而研制出来的,用deepseek那准没错,完全是专业对口。
回复

使用道具 举报

     
发表于 2026-6-14 23:01 | 显示全部楼层
AMD的max395工作站有128GB显存,2万人民币一台。
192GB的max400也快出了。
老黄那边是ARM架构的NVIDIA DGX Spark,128GB显存3万人民币一台。
搞不好能跑满血deepseek咧。
回复

使用道具 举报

     
发表于 2026-6-15 08:14 来自手机 | 显示全部楼层
几万块钱的玩具就想能跑满血deepseek可还行
回复

使用道具 举报

     
发表于 2026-6-15 08:46 | 显示全部楼层
自由之紫roy 发表于 2026-6-13 07:11
能节约一点是一点,散财很快,编程和推理我肯定用云模型,其他交给本地小模型,这毫无问题啊,不然买48G 40 ...

当然除了打游戏就是用来NSFW生图的
LLM目前消费显卡能部署的东西只能图一乐,上下文不够还要硬塞到agent里用,几轮对话就爆了
回复

使用道具 举报

 楼主| 发表于 2026-6-15 13:08 | 显示全部楼层
128G显存30000的,速度是gddr7显存吗?
回复

使用道具 举报

发表于 2026-6-15 15:10 | 显示全部楼层
硬件加电费折算下来local llm肯定是不如调用mini/flash-lite级别的模型划算
回复

使用道具 举报

     
发表于 2026-6-15 15:37 | 显示全部楼层
哥们用错了模型
来错了地方问
回帖的格式也错了

——————————
我唯一能回答你的是,本地模型不适合用来做你这个规模的作业,本地模型最多帮你写写总结文字,看看新闻和论文之类
回复

使用道具 举报

 楼主| 发表于 2026-6-22 13:57 | 显示全部楼层
我已经安装过了,就用来控制家里的智能家居挺好的,其他就确实用不了。基本上是文生图和短视频确实可以用本地模型来做。
回复

使用道具 举报

     
发表于 2026-6-22 17:17 | 显示全部楼层
24G 显存跑的模型写代码漏洞百出,而且慢。比如分不清 33 和 36,分不清;和:。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-24 11:09 , Processed in 0.212598 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表