ai agenthermes和openclaw的相关问题，本地模型有必要吗？

自由之紫roy 发表于 2026-6-12 13:19

在用hermes和openclaw做一个股票量化投资系统，有大量的策略，因子和回测要做，还兼顾一些图片和pdf的抓取

目前用deepseek负责编程和推理，千问用来做多模态，mimimax图像处理和生成。
token一天要用掉60块钱。觉得一个月1800有点厉害了。本地有必要配置一个24G显存的电脑吗，可以解决掉多少token的事情，换句话说，一天能省多少云模型的费用呢？
有可能回测，知识库索引，每日数据接口更新，和QMT的通信，还有些网络搜刮skill的使用都会用本地的云模型。

omnitoken 发表于 2026-6-12 13:27

本帖最后由 omnitoken 于 2026-6-12 13:30 编辑

你这个选择非常迷惑

ds推理又不强，他强的是上下文长度和便宜
然后minimax实际用途就是招笑模型，还是别用了

然后你的PDF和图片抓取本地弄个小模型都够了，集显都能跑

最后建议看下token plan

—— 来自鹅球 v3.3.96

紧那罗 发表于 2026-6-12 13:28

一个月省的1800，就不怕投资策略出点差错亏个几百倍？拿来量化投资怎么能还差这点成本

论坛助手,iPhone

自由之紫roy 发表于 2026-6-12 13:34

推理不强就没有更便宜的了吖，哪个推理最强，国产的额？
我不太像用code，太贵了，code的国内中转站包月300的，我还在考虑，听说会掺一些开源模型的token

gammatau 发表于 2026-6-12 13:35

hermes是干这个用的吗

自由之紫roy 发表于 2026-6-12 13:38

hermes和claw交叉验证啊，我要接不同的模型，建立不通的知识库，skill也不一样。hermes做大脑，claw做执行，然后一起验证。

DeepSeek + Codex 互补分析
DeepSeek Codex (OpenAI)
代码精度中上，偶尔有逻辑错误强，专门训练过代码生成
中文金融语境强，理解 A 股/政策/术语偏弱，偶尔用美股思维套 A 股
幻觉倾向倾向于"自信地编造"数据倾向于"过度简化"复杂逻辑
量化数学中上强，但不熟悉中国特色指标
API 成本低高
DeepSeek 擅长的地方 Codex 弱，Codex 擅长的地方 DeepSeek 可能翻车。交叉验证刚好互补。

优化后的 6 Profile 架构

┌─────────────────────────────────────────────────────┐
│          Kanban 调度中枢                      │
│    dispatcher 每 60s tick，一次派 1 个任务       │
└──┬──────┬──────┬──────┬──────┬──────┬───────────────┘
│    │    │    │    │    │
▼    ▼    ▼    ▼    ▼    ▼
┌──────┐┌────┐┌────┐┌────┐┌────┐┌──────────┐
│default││数据││策略││风控││交叉││QMT 执行桥│
│    ││总管││引擎││守卫││校验││       │
│DS ││DS││Codex││DS││Codex││Codex │
└──────┘└────┘└────┘└────┘└────┘└──────────┘

DS = DeepSeek Codex = OpenAI Codex
为什么这样配模型
Profile 模型理由
策略引擎 Codex 回测代码逻辑不能出错，Codex 代码精度最高
风险守卫 DeepSeek A 股风控需要理解政策/涨跌停/流动性，中文语境
交叉校验员 Codex 验证 DeepSeek 的风控结论——不同模型家族，盲区不重叠
数据总管 DeepSeek Tushare/akshare/东财的 API 都是中文文档
QMT 执行桥 Codex API 调用必须精确，不能搞错参数
核心设计：只有 Codex 在"输出"，DeepSeek 在"验证"的环节，反过来 DeepSeek 输出时 Codex 验证。两个模型从不单独拍板。

策略引擎(Codex)
→ 生成信号："轮动到 159915 创业板ETF，权重 40%"
→ 附带回测数据和置信区间

   ┌────────── 分叉验证 ──────────┐
   ▼                            ▼
风控守卫(DeepSeek)          交叉校验员(Codex)
"波动率偏高，建议降至30%"       "回测数据我重新算了一遍，
"止损线设在-5%"                信号逻辑没问题，
                                 但风控建议合理"
   │                            │
   └──────┬───────────────────────┘
            ▼
      结论一致？
      ├─ YES → QMT 执行
      └─ NO→ block 任务 + 标注分歧点 + 飞书告警
               → 两个模型各写自己的理由
               → 你来裁决
两个模型同时幻觉同一件事的概率 → 极低
出现分歧不盲动 → block + 我拍板
对比之前的方案，优化了什么
维度之前优化后
Profile 数量 7 6（market-monitor 并入 risk-guard）
模型策略随意分配 DeepSeek 偏中文/风控，Codex 偏代码/校验
反幻觉没有专门设计关键环节双模型交叉 + 分歧自动 block
执行安全 QMT 自动下单 Codex 精确调用 + 飞书确认后放行

神必迷你龙 发表于 2026-6-12 13:39

经典生活缝缝补补，股市挥金如土，真不如问问豆包

自由之紫roy 发表于 2026-6-12 13:41

啊哈哈哈，主要是有点想法买台机器玩玩游戏，老的笔记本五年前的了

pwzzy 发表于 2026-6-12 13:43

太搞了，我还以为你是大模型做回测或者写一个系统，结果是大模型做交易？正经都是自己做好策略训一个模型出来，股市本来就不可预测了，你还让更加不可控的模型来直接做交易

自由之紫roy 发表于 2026-6-12 13:45

pwzzy 发表于 2026-6-12 13:43
太搞了，我还以为你是大模型做回测或者写一个系统，结果是大模型做交易？正经都是自己做好策略训一个模型出 ...

不是的，因子和策略都是自己训练和做的。不是自动生成或者是拷贝来的，要手搓，一步步验证的。属于自己的内容。

omnitoken 发表于 2026-6-12 14:35

自由之紫roy 发表于 2026-6-12 13:45
不是的，因子和策略都是自己训练和做的。不是自动生成或者是拷贝来的，要手搓，一步步验证的。属于自己的 ...

你这架构也非常搞笑，openclaw写的和💩一样也起不到交叉验证的作用

你还不如就用hermes

—— 来自鹅球 v3.3.96

自由之紫roy 发表于 2026-6-12 14:53

omnitoken 发表于 2026-6-12 14:35
你这架构也非常搞笑，openclaw写的和💩一样也起不到交叉验证的作用

你还不如就用hermes

openclaw用的skill和知识库和hermes不同，另外会用不同的办法训练，基础股票数据来源也不同，也不想用一个agent的处理方式，肯定是不同的agent更合理一点。
profile越多，也越容易出现幻觉。

Awanano 发表于 2026-6-12 15:15

你构建实际要用的东西为什么要用龙虾和h呢，意思是让这些浪费token的东西构成这个系统吗
1600rmb你还不如去找A/和OAI的套餐+DS

自由之紫roy 发表于 2026-6-12 15:38

因为我没有很强的程序基础啊，必须靠agent来实现和进化，毕竟有很多skill可以直接用

脸宽发表于 2026-6-12 21:12

hermes用flash的话可以试试opencode go，便宜很多。

蓝极北 发表于 2026-6-12 21:26

本地模型的话，说实话没必要，测算过，本地模型的价格相较于api价格还是高的

体制发表于 2026-6-12 21:31

玩量化还舍不得一个月1800吗。
一个好的接口就不止了吧，如果你用便宜接口那速度还玩什么量化

—— 来自鹅球 v3.5.99-alpha

Litccc 发表于 2026-6-12 21:35

哥，做量化别用llm，只要出现一点幻觉都是巨大的偏差

Awanano 发表于 2026-6-12 21:39

还有进化，牛的
这两洋鬼token烂烧工具确实能搞点噱头，能不能搞个 mega 进化极巨化出来
技能这个东西又不是五号电池七号电池有物质硬件的不同，文本几行字，就不用存在一个文本约束规则其他 agent 用不了的
越读越感觉 lz 像伪人但是这迷惑的语句 AI 拼不出来
而且现在国外两订阅制的价格比你报的 1600～1800 要低，我首先质疑你的比价能力和信息获取能力 Re:Source

真红之闪电 发表于 2026-6-12 21:45

进化是指你不断加规则约束吗……
那不是只会进化出绕过规则的能力？

梅林的三角裤 发表于 2026-6-12 21:54

大模型做交易真的靠谱吗？对自己钱包好点吧

论坛助手,iPhone

梅林的三角裤 发表于 2026-6-12 21:55

还有hermes所谓的skill进化真的只能当玩具，不咋能信的

论坛助手,iPhone

Hyst3r1a 发表于 2026-6-12 23:06

泥潭什么时候支持markdown格式

—— 来自 OPPO PLG110, Android 16, 鹅球 v3.5.99

自由之紫roy 发表于 2026-6-13 07:11

能节约一点是一点，散财很快，编程和推理我肯定用云模型，其他交给本地小模型，这毫无问题啊，不然买48G 4090以及5090来做推理的又是哪些人呢

半江瑟瑟半江红 发表于 2026-6-13 07:42

自由之紫roy 发表于 2026-6-13 07:11
能节约一点是一点，散财很快，编程和推理我肯定用云模型，其他交给本地小模型，这毫无问题啊，不然买48G 40 ...

打游戏的人

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

ZBY901026 发表于 2026-6-14 17:27

本地模型你这个价位跑不动能跑的都是弱智字面意义上的
觉得价格贵可以把一些简单的任务切成更廉价的模型但是需要注意廉价模型的失误率更高你需要能接受把1.00写成100的错误成本
图像输出和修改的成本很高特别是多轮对话会进入上下文你每一次对话都会把之前的图片再发一遍虽然会进入缓存累积下来还是很贵
你可以做个简单的测试把输出图片改成输出网页其他流程都不变两个任务的消耗量差距如果你比较依赖图片理解内容这个差距会非常大

火炎龍 发表于 2026-6-14 17:58

48G 4090以及5090的价格足够你跑一年多的模型了
而且自建模型的速度你更是受不了，更别提性能了

noneoneone 发表于 2026-6-14 18:04

我虽然用hermes，但它那个所谓的进化我全当没有，根本就是炒作来的。
然后自己有显卡需求的情况下顺便跑跑大模型还凑合，专门为这个买显卡基本不划算。速度，电费，噪音，智商都是问题。
我只在需要无审核的情况下才用本地模型。

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v4.0-alpha

玉米黍 发表于 2026-6-14 22:41

是的呢，AI炒股十分靠谱。惊世大模型deepseek就是为了量化交易而研制出来的，用deepseek那准没错，完全是专业对口。

naclken. 发表于 2026-6-14 23:01

AMD的max395工作站有128GB显存，2万人民币一台。
192GB的max400也快出了。
老黄那边是ARM架构的NVIDIA DGX Spark，128GB显存3万人民币一台。
搞不好能跑满血deepseek咧。

26458 发表于 2026-6-15 08:14

几万块钱的玩具就想能跑满血deepseek可还行

流缨发表于 2026-6-15 08:46

自由之紫roy 发表于 2026-6-13 07:11
能节约一点是一点，散财很快，编程和推理我肯定用云模型，其他交给本地小模型，这毫无问题啊，不然买48G 40 ...
当然除了打游戏就是用来NSFW生图的
LLM目前消费显卡能部署的东西只能图一乐，上下文不够还要硬塞到agent里用，几轮对话就爆了

自由之紫roy 发表于 2026-6-15 13:08

128G显存30000的，速度是gddr7显存吗？

Anarkia 发表于 2026-6-15 15:10

硬件加电费折算下来local llm肯定是不如调用mini/flash-lite级别的模型划算

xing7673 发表于 2026-6-15 15:37

哥们用错了模型
来错了地方问
回帖的格式也错了

——————————
我唯一能回答你的是，本地模型不适合用来做你这个规模的作业，本地模型最多帮你写写总结文字，看看新闻和论文之类

自由之紫roy 发表于 2026-6-22 13:57

我已经安装过了，就用来控制家里的智能家居挺好的，其他就确实用不了。基本上是文生图和短视频确实可以用本地模型来做。

zktz 发表于 2026-6-22 17:17

24G 显存跑的模型写代码漏洞百出，而且慢。比如分不清 33 和 36，分不清；和：。

自由之紫roy 发表于 2026-6-29 13:56

本帖最后由自由之紫roy 于 2026-6-29 13:57 编辑

我现在连上了qmt，可以实时get信息，本地模型处理后post，6个profile，3个子agent，两套数据源，已经开始模拟仓操作了。其实ai量化，无非就是要找到合适的策略和因子，在每一年度的跟踪目标的年化阿尔法和夏普比率都在一个稳定的水平上，那就是有效的量化策略系统，需要一个非常完整的体系，门槛非常高的，我们现在拿到的所有策略和因子，都是按年度衰减有效性。我已经找到适配的策略和因子和跟踪目标池了。六月份token消耗量2000元人民币，但我觉得非常值得。自己熟悉了整个架构和体系建设，各种细节都参与把握，也更有利于后期迭代和升级，比请个人来做真是好太多了。
太太太太太牛逼了！

hyde_caesar 发表于 2026-6-29 14:44

应该也是相对专业的量化大哥了，你就算是线上的大厂的codingplan也是只适合做策略啊，你难不成让他去做交易执行吗本地模型你有财力整个h200上个glm5.1也没用的

chaoswing 发表于 2026-6-29 15:12

我自己搭了一个投研辅助系统，可以根据实时和历史数据生成个股的深度研报，hermes手动触发/cron，编排层用的langgraph，结构有点儿像github上的tradingagents
我也不是码农，从三月开始陆陆续续在尝试不同的harness和不同的模型，不同的编排层，最终用langgraph是因为这个确定性最高
不过我的系统只是辅助投研，只在报告最后一个部分给了决策矩阵和交易日情景分析，对T+1市场来说勉强够用了，最终还是得靠人

页: [1] 2

Stage1st's Archiver

ai agenthermes和openclaw的相关问题，本地模型有必要吗？