diohanmilton 发表于 2025-4-28 00:29

讨论用来ai编程的国产模型

这段时间开始,用ai写一些Python小工具来提高工作效率。我在代码上基本是零基础,学了一点Python的安装和部署。

原来是通过和网页版对谈进行编辑。但是需要修改时因为不是我写的不知道上下文,所以找起来很麻烦。

目前能提供免费API的就是一个vscode最新自带的github copilot 有限流,可以用claude和gpt多个模型。然后最新版软件也支持自动写代码而不是仅仅是问答和补全。

然后就是cline也很热门,但是需要自己提供API否则就要买claude的。
目前国内火山注册送了一堆API的50万token。然后参加协作计划,把自己的内容给字节训练还能继续送(5月底结束,不知道还续不续)。
火山能提供deepseek 豆包 月之暗面(kimi家的)三种。deepseek r1我用的多,不过在cline里长思考会很啰嗦,我实际使用中会出现无限循环卡死的现象,最近我看别人说v3效果也不错今天试了确实,生成快,对于简单编程准确性也不错。豆包自家的用了个1.5 pro 256k,感觉和r1差不多,很啰嗦,速度不如v3,也会循环卡死。

精钢魔像 发表于 2025-4-28 00:34

deepseek v3 0324比vscode自带的强很多。你装个豆包的插件,在里面选0324,然后和ai聊天也行,写好函数名在注释里写好思路按tab生成也行,都很不错。
因为效果很好,我怀疑可能不会长久免费。

ArthurFyc 发表于 2025-4-28 00:53

字节的协作计划是不是新号已经没法加入了?上次找了半天也没找到入口

—— 来自 鹅球 v3.3.96

moekyo 发表于 2025-4-28 01:10

现在都在说 DS 要更新了,说得言之凿凿的

afer 发表于 2025-4-28 01:13

diohanmilton 发表于 2025-4-28 07:29

另外还有一个,想用ai写Python还行,写cpp稍微复杂一点就不好用。

—— 来自 鹅球 v3.3.96-alpha

無始無終 发表于 2025-4-28 08:23

国内写代码还是DPSK V3比较好,Kimi现在似乎也不错,其它的算了

—— 来自 Xiaomi 23054RA19C, Android 14, 鹅球 v3.5.99

紧那罗 发表于 2025-4-28 08:36

ds官方的api响应太慢了 火山的速度怎么样?

子虚乌有 发表于 2025-4-28 09:05

我弄了cursor ai自带的模型感觉不如chatgpt网页里给我写的好。
其实不是程序写的好,我主要还得靠聊天开拓思路不单纯是写代码,这个chatgpt强一些

nexus1 发表于 2025-4-28 09:46

写代码最好的是ds没问题,但清华那个大模型意外地比kimi好

琉璃苑軒風 发表于 2025-4-28 09:53

不要惯性迷信R1,新的v3写代码比他好

trentswd 发表于 2025-4-28 10:21

不限制国产的话,现在编程都喜欢白嫖gemini,免费账号每天25条每项目,多注册几个账号轮询

Amami_Haruka_ 发表于 2025-4-28 11:06

阿里的通义,在vscode有插件,可以选deepseek

Misasasasasaka 发表于 2025-4-28 11:19

gemini 2.5 pro 和 claude3.7,目前在用这两个,效果不错

有的时候开了thinking效果不如没开

精钢魔像 发表于 2025-4-28 12:29

diohanmilton 发表于 2025-4-28 07:29
另外还有一个,想用ai写Python还行,写cpp稍微复杂一点就不好用。

—— 来自 鹅球 v3.3.96-alpha ...

想要整个项目让ai一键生成目前还不行,单个函数是没问题的。我让0324 写过c# 复杂的linq+泛型,效果不错,通不过测试你把正确结果告诉它它也能修改

diohanmilton 发表于 2025-4-28 16:49

trentswd 发表于 2025-4-28 10:21
不限制国产的话,现在编程都喜欢白嫖gemini,免费账号每天25条每项目,多注册几个账号轮询 ...

主要目前免费的API就火山接入的那几个。

—— 来自 鹅球 v3.3.96-alpha

不让用大写 发表于 2025-4-28 17:27

我是个门外汉,用cursor的免费claude3.7,写一些python小工具和jsx脚本很方便,反应比较快,还是全文修改,不像deepseek只给修改的部分,还要再看粘贴到哪个位置,出现错误我还不知道咋回事
Trea的免费要排队,有点慢

b0207191 发表于 2025-4-28 17:52

现在有没有对大项目吃透的编程模型,比如linux内核代码,完全吃透, 我经常在开发linux驱动,希望有这样的工具

dangoron 发表于 2025-4-28 18:30

用来写JSON解析类已经很不错了,能解决很多体力活

—— 来自 S1Fun

elxy 发表于 2025-4-28 18:58

b0207191 发表于 2025-4-28 17:52
现在有没有对大项目吃透的编程模型,比如linux内核代码,完全吃透, 我经常在开发linux驱动,希望有这样的 ...

试下devin?https://devin.ai/

—— 来自 鹅球 v3.5.99

Misono_Mayu 发表于 2025-4-28 19:13

脚本类的生成还行,java或者复杂的几百行sql优化就不行了,经常口胡

moekyo 发表于 2025-4-28 19:18

Qwen 3 这星期要来了,推理和常规二合一

橋白 发表于 2025-4-29 09:20

moekyo 发表于 2025-4-28 19:18
Qwen 3 这星期要来了,推理和常规二合一

来了 感觉等一个月大众大规模测试就能知道好用不好用了

论坛助手,iPhone

harry3 发表于 2025-4-29 14:11

试了下官方demo,qwen3应该是近期最烂的了,一条刷分臭狗

JWchze 发表于 2025-4-29 14:29

qwen3确实感觉很烂...

子虚乌有 发表于 2025-4-30 09:45

本帖最后由 子虚乌有 于 2025-4-30 10:23 编辑





突然发现trae和腾讯那个codebuddy都可以

bixinhaner 发表于 2025-4-30 10:03

目前最便宜大碗的还是v3 0324, 介于Claude 3.5和3.7之间,性价比强无敌

無始無終 发表于 2025-4-30 10:25

b0207191 发表于 2025-4-28 17:52
现在有没有对大项目吃透的编程模型,比如linux内核代码,完全吃透, 我经常在开发linux驱动,希望有这样的 ...

你这个要用RAG吧,不是单靠模型本身就能解决的

—— 来自 Xiaomi 23054RA19C, Android 14, 鹅球 v3.5.99

泰坦失足 发表于 2025-4-30 10:29

Qwen3这么不行的吗. 我看了下官方文档, 说Vllm还不兼容, 以及不提供4bit量化. 就放弃了本地部署235B的心思了.倒是动了充10美元用openrouter每日1000条的心思

overflowal 发表于 2025-4-30 14:35

泰坦失足 发表于 2025-4-30 10:29
Qwen3这么不行的吗. 我看了下官方文档, 说Vllm还不兼容, 以及不提供4bit量化. 就放弃了本地部署235B的心思 ...

你都用openrouter了,用上面免费的deepseek v3就行。
qwen3目前看来就是有点问题,世界知识相比它的体量来说很匮乏。怀疑是支持的语言太多了。
好的地方是针对agent流程优化过,用来本地驱动各种工具可能不错

—— 来自 鹅球 v3.4.97

darktide 发表于 2025-4-30 16:04

DeepSeek挺好的,我已经用它在项目开发中落地实装,如果自己有架构和设计能力,完善输入,对输出进行指导反馈,它给出的东西令人惊喜。Claude也用了,优点是全面,给出的代码很完整,但是创造力和理解力还是差点意思。可以结合起来用。

moekyo 发表于 2025-4-30 17:06

DeepSeek 发了一个 https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B,不过应该给一般人用,用来解决数学问题的

费雷拉 发表于 2025-4-30 17:16

diohanmilton 发表于 2025-4-28 07:29
另外还有一个,想用ai写Python还行,写cpp稍微复杂一点就不好用。

—— 来自 鹅球 v3.3.96-alpha ...

我现在就是用ai写cpp,还行。主要是必须自己过一遍。编译器过一遍,最好让它写测试用例再过一遍。
直接把各种错误反馈回去让他自己改就行。
肯定没脚本语言那么容易一次成功,但也能大幅度提升效率了。
最提升效率的场合就是需要调用一个之前没用过的库/设备sdk,把文档一扔,自己描述一下想要一个什么要的类,或者把自己的外层代码也扔进去,得到的结果一般都很不错。
总之局限到生成类这个场合我觉得是完全够用且大幅度提升效率的

overflowal 发表于 2025-4-30 17:24

moekyo 发表于 2025-4-30 17:06
DeepSeek 发了一个 https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B,不过应该给一般人用,用 ...

有点过分了,prover 1.5是一个7B的模型,prover v2直接上671B的。。。真的是非常自由

—— 来自 鹅球 v3.4.97

moekyo 发表于 2025-4-30 20:09

overflowal 发表于 2025-4-30 17:24
有点过分了,prover 1.5是一个7B的模型,prover v2直接上671B的。。。真的是非常自由

—— 来自 鹅球 v3 ...

我想看 V4 有多大

overflowal 发表于 2025-4-30 20:44

moekyo 发表于 2025-4-30 20:09
我想看 V4 有多大

肯定更大。而且几乎可以肯定是多模态的。怀疑在1T以上,按照deepseek的风格,他们会把之前论文发的各种创新用起来。全新的注意力机制,janus的多模态能力,新的强化学习方法,还有prover v2可能用的新方法。

—— 来自 鹅球 v3.4.97

neptunehs 发表于 2025-4-30 22:11

本帖最后由 neptunehs 于 2025-4-30 22:18 编辑

overflowal 发表于 2025-4-30 17:24
有点过分了,prover 1.5是一个7B的模型,prover v2直接上671B的。。。真的是非常自由

—— 来自 鹅球 v3 ...

我是觉得ds应该是判断小模型没用 不做了
之前的r1qwen只是为了证明他们的路子有效

这次qwen3也让我对小模型的能力产生了一定疑问 以后估计最多用用12b当玩具了 32b这样的感觉没啥前途

但愿我是错的 毕竟按照现在这趋势可能单机小模型多模态并不现实 这很不好

7do 发表于 2025-5-1 00:31

今天算是碰到ai的局限性 ds反反复复地给我一个没用的解决方案,怎么给他反馈都没用
现在ai一个缺点是当一个问题他解决不了的时候他就在那给你绕,说的像真的一样
虽然最后还是靠ds解决了问题

— from S1 Next Goose v3.5.99

larry1 发表于 2025-5-1 02:07

有没有帮着分析现有代码的模型啊。
我这有一堆别人写的代码小找他分析。主要是想改改,但我不想看他写的一大堆垃圾。
这个AI能做到吗?

Rainwedell 发表于 2025-5-1 05:37

larry1 发表于 2025-5-1 02:07
有没有帮着分析现有代码的模型啊。
我这有一堆别人写的代码小找他分析。主要是想改改,但我不想看他写的一 ...

claude,确实很好用

—— 来自 Xiaomi 22041211AC, Android 14, 鹅球 v3.5.99-alpha
页: [1] 2
查看完整版本: 讨论用来ai编程的国产模型