勿徊哉 发表于 2025-12-21 00:20

2025年快结束了,深觉自己大模型Token消耗得太少,有什么改善建议吗?

本帖最后由 勿徊哉 于 2025-12-21 08:01 编辑

主要是API用得太少,年初充值的Deepseek,年底一看没用多少。API之外的AI使用得倒是挺多的,订阅了ChatGPT 20美元档,然而编程写代码还是AI Studio用得顺手。

我最近琢磨出来的烧Token的活是把收藏微博自动提取后,用大模型分类和打Tag后存入Obsidian,然后对比增补我的几份行动指南笔记。
更新:上面这个一年撑死烧2元,用量还是太小。昨晚跑了半年来收藏的1200条微博,早上起来一看才烧了8毛钱。我记得DS现在没有半夜优惠活动了?


我以下列出的这俩能实现吗?

[*]是否有对R18完全不禁止、又便宜大碗的多模态模型?只要求能输入图片不要求输出,可以遍历本地硬盘中的涩图(二次元三次元都有,大概1个TB的量)。我专门有个文件夹存我特别喜欢的涩图用来当壁纸,祂能否根据这个文件夹内容判断我的性癖、或者喜欢的画的主题以及画师风格,来挑出剩余图片中我可能会特别喜欢的图片?
[*]是否有APP或者设备能支持一天录音并记录出行地点?最好是apple watch,我手机也不一定一直随身。可以自动转文字后输入大模型,结合出行地点生成日记

我知道CLI能快速烧Token,这个也打算体验一下。


所以还有哪些能自动化的工作能用来烧Token?

zypyong 发表于 2025-12-21 00:26

自己做agent。

Quelaan 发表于 2025-12-21 00:53

你不如拿这问题直接去问gemini

勿徊哉 发表于 2025-12-21 01:08

Quelaan 发表于 2025-12-21 00:53
你不如拿这问题直接去问gemini

两个AI我都问了,回答的都没什么启发性

论坛助手,iPhone

Fuuki 发表于 2025-12-21 01:27

模型不可能一次读太多图片,所以不能总结你的xp
但你可以把图片的tag都整理出来,做统计,再去匹配新图片tag的相关度

nnknnk 发表于 2025-12-21 01:36

agent智商受底模影响挺严重的,siliconflow里面VL能用的感觉只有Qwen3-32B和235BA22B这两个版本。
不过即使如此,我努力了半天还是没能让模型学会区分推特色图里的福利姬究竟有没有吊

顺便让Gemini3pro写了个油猴插件,把网页端api化了一下,感觉要搞agent又没api的话可以看看这个思路。

米德 发表于 2025-12-21 01:42

放qq群当bot 烧token速度一流

张元英 发表于 2025-12-21 02:27

如果只是为了烧token而烧token, 我用过PDF翻译项目, 一天烧五千万token, 半个月烧了六亿


勿徊哉 发表于 2025-12-21 07:49

本帖最后由 勿徊哉 于 2025-12-21 08:12 编辑

Fuuki 发表于 2025-12-21 01:27
模型不可能一次读太多图片,所以不能总结你的xp
但你可以把图片的tag都整理出来,做统计,再去匹配新图片ta ...
所以现在的 LLM 发展得还远远不够。

祂们已经能读入上百万字,在长文本里判断下一段话是否和前文一致;
但依然做不到读入一千张我中意的涩图,然后可靠地判断接下来这张图是否仍然精准踩中我的XP。

对人类来说,看一千张涩图并不比阅读上百万字更花费时间。在LLM能做到前者之前,我认为AI不存在泡沫

勿徊哉 发表于 2025-12-21 07:54

张元英 发表于 2025-12-21 02:27
如果只是为了烧token而烧token, 我用过PDF翻译项目, 一天烧五千万token, 半个月烧了六亿




总不能为烧而烧,还是要有需求
我现在都不怎么读文献了,没有批量pdf翻译需求。偶尔的阅读需求我是直接塞gpt和gemini里。

我想想我的类似需求,一是特定英文网站网页一打开就自动总结为中文;二是我推刷得多,要是推特客户端对每条推特使用api自动总结就好了。

毕竟英文长文我做不到一目十行,先总结一下判断值不值得看还是挺有必要的。

勿徊哉 发表于 2025-12-21 08:05



结果微博整理这个需求一年撑死烧2元,用量还是太小。昨晚跑了半年来收藏的1200条微博,早上起来一看才烧了8毛钱。我记得DS现在没有半夜优惠活动了?昨天晚上看了用量,以为是更新不及时。结果早上起来看还是这么点。

感觉对普通人来说,真正的烧Token需求还是要来自于多模态模型,图片、视频啥的。不知道还要几年LLM才能一次读入一千张涩图。

77BBC 发表于 2025-12-21 08:15

这倒是提醒我了,该翻点黄油把每天免费额度用了,不然不是血亏

—— 来自 S1Fun

鸳鸳相抱 发表于 2025-12-21 08:27

勿徊哉 发表于 2025-12-21 08:05
结果微博整理这个需求一年撑死烧2元,用量还是太小。昨晚跑了半年来收藏的1200条微博,早上起来一看才烧 ...

为啥要整理收藏的微博,不应该整理X上你感兴趣的领域所有人的推文吗?

勿徊哉 发表于 2025-12-21 08:47

鸳鸳相抱 发表于 2025-12-21 08:27
为啥要整理收藏的微博,不应该整理X上你感兴趣的领域所有人的推文吗?

X上我绝大多数关注的是是二次元和涩涩,这些已经实现了自动化收集流程。我点赞的图会自动下载到nas归档。所以我迫切需要一个能读取所有色图的llm

剩下的主要都是一些资讯类消息,反而很少遇到过有收藏想法的推。有收藏必要的基本都是长文博客,我会直接导入obsidian。

Fake_news 发表于 2025-12-21 08:55

啊🤔,这个我就想到了骑砍2的AI效应mod,一堆人说token根本不够用,一玩起来一下酒用光了

鸳鸳相抱 发表于 2025-12-21 09:51

勿徊哉 发表于 2025-12-21 08:47
X上我绝大多数关注的是是二次元和涩涩,这些已经实现了自动化收集流程。我点赞的图会自动下载到nas归档。 ...

我的意思是为啥要自己翻到再LLM去精炼,既然目的是烧,不应该尝试LLM精炼了然后你再去其中翻你感兴趣的内容吗?

勿徊哉 发表于 2025-12-21 10:13

本帖最后由 勿徊哉 于 2025-12-21 10:15 编辑

鸳鸳相抱 发表于 2025-12-21 09:51
我的意思是为啥要自己翻到再LLM去精炼,既然目的是烧,不应该尝试LLM精炼了然后你再去其中翻你感兴趣的内 ...
哦哦,就是类似于推特提供的For you、但是个人维护的一版的为你推荐功能。

我想了想,目前我微博和推特关注已经足够精简,这些都是我自己愿意每天看的,没必要用LLM精炼了。毕竟除了信息收集,还有娱乐意义。而且我认为只用我目前攒的知识库作为资料,不够覆盖我所有感兴趣的内容,会漏掉很多有趣的事。

我关注的账号之外的消息,倒是可以用LLM精炼一些推给我。但是目前我觉得没这个必要。一是要利用现有所有笔记搞RAG,我目前不会弄;二是这样就会在当前刷微博刷推的基础上增加更多的阅读时间,和我节省时间的目的相反,得不偿失。

秦南心 发表于 2025-12-21 10:24

勿徊哉 发表于 2025-12-21 08:05
结果微博整理这个需求一年撑死烧2元,用量还是太小。昨晚跑了半年来收藏的1200条微博,早上起来一看才烧 ...

用酒馆玩,一天随随便便用你十倍的量

蜇灵 发表于 2025-12-21 10:37

你下一个vsc或者别的IDE,开一个编程项目,用agent模式,自动批准全开,一天烧几千万都是小意思

Litccc 发表于 2025-12-21 10:39

多玩玩酒馆,token根本不够用

勿徊哉 发表于 2025-12-21 10:40

秦南心 发表于 2025-12-21 10:24
用酒馆玩,一天随随便便用你十倍的量

没有这个需求

紧那罗 发表于 2025-12-21 19:18

怎么还有感慨token用少了的。我之前充了50刀claude,酒馆半小时就没了。
你说的这几个都能做啊,输入图片生成xp tag又不需要一次性全生成完,一张图一张图生成有什么问题。
录音的话随便拿个耳机就行了,想负担轻就买耳夹耳机

论坛助手,iPhone

狭义文具爱好者 发表于 2025-12-21 20:19

勿徊哉 发表于 2025-12-21 08:05
结果微博整理这个需求一年撑死烧2元,用量还是太小。昨晚跑了半年来收藏的1200条微博,早上起来一看才烧 ...

说是用了稀疏注意力,现在ds3.2就是满尺寸模型百万输入2块百万输出3块,相当便宜了

小野賢章 发表于 2025-12-21 21:22

Vibe Coding 应该是消耗量最大的想用AI做什么事情的时候,用 Vibe Coding 开发一个 App 来做这件事。

Asakiz 发表于 2025-12-21 22:58

今年一年都在搞某个remote work海量消耗token 每天的工作就是研究api成本怎么跑赢base payment

宵神乐 发表于 2025-12-22 00:18

**不懂?

xing7673 发表于 2025-12-22 00:35

会写代码的话就烧的多了
现在的llm确实代码的需求很大

mooerfoes 发表于 2025-12-22 00:58

前面人提到的翻译是个好路子,我觉得你要是某类作品的爱好者那一定有那种有兴趣但没有翻译的作品,比如小说,或者中文翻译不尽人意的一些偏专业书籍,ZLIB能找到pdf的话让AI翻译一版留着看也是好办法。

wpwing 发表于 2025-12-22 02:02

接了个小项目,要写一个小程序商城项目,用Java,用ai可以快速交付么

88316756 发表于 2025-12-22 02:02

下个ainiee,去安娜的档案下载书籍翻译,翻译润色之类的消耗都挺大,以前好多冷门的轻小说之类的我用gemini3.0二次润色后和专业译者的看不出太大差别了

还有一些黄油啥的以前汉化组都要几年功夫磨才能完工,现在自己多开几个线程几十分钟哐哐就翻译好了。

RookieTnT 发表于 2025-12-22 02:32

wpwing 发表于 2025-12-22 02:02
接了个小项目,要写一个小程序商城项目,用Java,用ai可以快速交付么

这种直接找MIT协议的开源项目改不就好了嘛. 何必折磨自己

wpwing 发表于 2025-12-22 02:37

RookieTnT 发表于 2025-12-22 02:32
这种直接找MIT协议的开源项目改不就好了嘛. 何必折磨自己

库表设计的原型都是别人给的,找开源项目基本都要大改了,至少我找的几个商用要么太大部署特别复杂,要么功能太简单,没有移动端

RookieTnT 发表于 2025-12-22 02:53

wpwing 发表于 2025-12-22 02:37
库表设计的原型都是别人给的,找开源项目基本都要大改了,至少我找的几个商用要么太大部署特别复杂,要么 ...

看业务复杂不. 一般用ai搓是没啥问题的.

不过要先写好需求. 写好规划.

记住别写原生小程序, 拿uni-app 搓. 原生各种意义上的反人类. 特别状态管理和包管理很傻逼.

2sunur 发表于 2025-12-22 02:56

想问下要是白嫖的学生gemini的gcp被封了还有救吗,用DeepSeek写的小作文申诉了三次了也没动静,我想用api啊,我大概搜了下这玩意好像无解?

—— 来自 鹅球 v3.5.99

4396777 发表于 2025-12-22 08:45

该让楼主整点数学题了,这个思考过程估计会烧不少token

黑哥啥时改密码 发表于 2025-12-22 09:35

我是用来做小黄油翻译

wpwing 发表于 2025-12-22 18:43

RookieTnT 发表于 2025-12-22 02:53
看业务复杂不. 一般用ai搓是没啥问题的.

不过要先写好需求. 写好规划.

大致看了下表和原型,基本复杂的不多,最复杂也就支付那块了,我先生成单表crud,那哥们设计的表居然加了外键,好久没看到了
页: [1]
查看完整版本: 2025年快结束了,深觉自己大模型Token消耗得太少,有什么改善建议吗?