讨论用来ai编程的国产模型

diohanmilton 发表于 2025-4-28 00:29

这段时间开始，用ai写一些Python小工具来提高工作效率。我在代码上基本是零基础，学了一点Python的安装和部署。

原来是通过和网页版对谈进行编辑。但是需要修改时因为不是我写的不知道上下文，所以找起来很麻烦。

目前能提供免费API的就是一个vscode最新自带的github copilot 有限流，可以用claude和gpt多个模型。然后最新版软件也支持自动写代码而不是仅仅是问答和补全。

然后就是cline也很热门，但是需要自己提供API否则就要买claude的。
目前国内火山注册送了一堆API的50万token。然后参加协作计划，把自己的内容给字节训练还能继续送（5月底结束，不知道还续不续）。
火山能提供deepseek 豆包月之暗面（kimi家的）三种。deepseek r1我用的多，不过在cline里长思考会很啰嗦，我实际使用中会出现无限循环卡死的现象，最近我看别人说v3效果也不错今天试了确实，生成快，对于简单编程准确性也不错。豆包自家的用了个1.5 pro 256k，感觉和r1差不多，很啰嗦，速度不如v3，也会循环卡死。

精钢魔像 发表于 2025-4-28 00:34

deepseek v3 0324比vscode自带的强很多。你装个豆包的插件，在里面选0324，然后和ai聊天也行，写好函数名在注释里写好思路按tab生成也行，都很不错。
因为效果很好，我怀疑可能不会长久免费。

ArthurFyc 发表于 2025-4-28 00:53

字节的协作计划是不是新号已经没法加入了？上次找了半天也没找到入口

—— 来自鹅球 v3.3.96

moekyo 发表于 2025-4-28 01:10

现在都在说 DS 要更新了，说得言之凿凿的

afer 发表于 2025-4-28 01:13

diohanmilton 发表于 2025-4-28 07:29

另外还有一个，想用ai写Python还行，写cpp稍微复杂一点就不好用。

—— 来自鹅球 v3.3.96-alpha

無始無終 发表于 2025-4-28 08:23

国内写代码还是DPSK V3比较好，Kimi现在似乎也不错，其它的算了

—— 来自 Xiaomi 23054RA19C, Android 14, 鹅球 v3.5.99

紧那罗 发表于 2025-4-28 08:36

ds官方的api响应太慢了火山的速度怎么样?

子虚乌有 发表于 2025-4-28 09:05

我弄了cursor ai自带的模型感觉不如chatgpt网页里给我写的好。
其实不是程序写的好，我主要还得靠聊天开拓思路不单纯是写代码，这个chatgpt强一些

nexus1 发表于 2025-4-28 09:46

写代码最好的是ds没问题，但清华那个大模型意外地比kimi好

琉璃苑軒風 发表于 2025-4-28 09:53

不要惯性迷信R1,新的v3写代码比他好

trentswd 发表于 2025-4-28 10:21

不限制国产的话，现在编程都喜欢白嫖gemini，免费账号每天25条每项目，多注册几个账号轮询

Amami_Haruka_ 发表于 2025-4-28 11:06

阿里的通义，在vscode有插件，可以选deepseek

Misasasasasaka 发表于 2025-4-28 11:19

gemini 2.5 pro 和 claude3.7，目前在用这两个，效果不错

有的时候开了thinking效果不如没开

精钢魔像 发表于 2025-4-28 12:29

diohanmilton 发表于 2025-4-28 07:29
另外还有一个，想用ai写Python还行，写cpp稍微复杂一点就不好用。

—— 来自鹅球 v3.3.96-alpha ...

想要整个项目让ai一键生成目前还不行，单个函数是没问题的。我让0324 写过c# 复杂的linq+泛型，效果不错，通不过测试你把正确结果告诉它它也能修改

diohanmilton 发表于 2025-4-28 16:49

trentswd 发表于 2025-4-28 10:21
不限制国产的话，现在编程都喜欢白嫖gemini，免费账号每天25条每项目，多注册几个账号轮询 ...

主要目前免费的API就火山接入的那几个。

—— 来自鹅球 v3.3.96-alpha

不让用大写 发表于 2025-4-28 17:27

我是个门外汉，用cursor的免费claude3.7，写一些python小工具和jsx脚本很方便，反应比较快，还是全文修改，不像deepseek只给修改的部分，还要再看粘贴到哪个位置，出现错误我还不知道咋回事
Trea的免费要排队，有点慢

b0207191 发表于 2025-4-28 17:52

现在有没有对大项目吃透的编程模型，比如linux内核代码，完全吃透，我经常在开发linux驱动，希望有这样的工具

dangoron 发表于 2025-4-28 18:30

用来写JSON解析类已经很不错了，能解决很多体力活

—— 来自 S1Fun

elxy 发表于 2025-4-28 18:58

b0207191 发表于 2025-4-28 17:52
现在有没有对大项目吃透的编程模型，比如linux内核代码，完全吃透，我经常在开发linux驱动，希望有这样的 ...

试下devin？https://devin.ai/

—— 来自鹅球 v3.5.99

Misono_Mayu 发表于 2025-4-28 19:13

moekyo 发表于 2025-4-28 19:18

Qwen 3 这星期要来了，推理和常规二合一

橋白发表于 2025-4-29 09:20

moekyo 发表于 2025-4-28 19:18
Qwen 3 这星期要来了，推理和常规二合一

来了感觉等一个月大众大规模测试就能知道好用不好用了

论坛助手,iPhone

harry3 发表于 2025-4-29 14:11

试了下官方demo，qwen3应该是近期最烂的了，一条刷分臭狗

JWchze 发表于 2025-4-29 14:29

qwen3确实感觉很烂...

子虚乌有 发表于 2025-4-30 09:45

本帖最后由子虚乌有于 2025-4-30 10:23 编辑

突然发现trae和腾讯那个codebuddy都可以

bixinhaner 发表于 2025-4-30 10:03

目前最便宜大碗的还是v3 0324, 介于Claude 3.5和3.7之间，性价比强无敌

無始無終 发表于 2025-4-30 10:25

b0207191 发表于 2025-4-28 17:52
现在有没有对大项目吃透的编程模型，比如linux内核代码，完全吃透，我经常在开发linux驱动，希望有这样的 ...

你这个要用RAG吧，不是单靠模型本身就能解决的

—— 来自 Xiaomi 23054RA19C, Android 14, 鹅球 v3.5.99

泰坦失足 发表于 2025-4-30 10:29

Qwen3这么不行的吗. 我看了下官方文档, 说Vllm还不兼容, 以及不提供4bit量化. 就放弃了本地部署235B的心思了.倒是动了充10美元用openrouter每日1000条的心思

overflowal 发表于 2025-4-30 14:35

泰坦失足发表于 2025-4-30 10:29
Qwen3这么不行的吗. 我看了下官方文档, 说Vllm还不兼容, 以及不提供4bit量化. 就放弃了本地部署235B的心思 ...

你都用openrouter了，用上面免费的deepseek v3就行。
qwen3目前看来就是有点问题，世界知识相比它的体量来说很匮乏。怀疑是支持的语言太多了。
好的地方是针对agent流程优化过，用来本地驱动各种工具可能不错

—— 来自鹅球 v3.4.97

darktide 发表于 2025-4-30 16:04

DeepSeek挺好的，我已经用它在项目开发中落地实装，如果自己有架构和设计能力，完善输入，对输出进行指导反馈，它给出的东西令人惊喜。Claude也用了，优点是全面，给出的代码很完整，但是创造力和理解力还是差点意思。可以结合起来用。

moekyo 发表于 2025-4-30 17:06

DeepSeek 发了一个 https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B，不过应该给一般人用，用来解决数学问题的

费雷拉 发表于 2025-4-30 17:16

diohanmilton 发表于 2025-4-28 07:29
另外还有一个，想用ai写Python还行，写cpp稍微复杂一点就不好用。

—— 来自鹅球 v3.3.96-alpha ...

我现在就是用ai写cpp，还行。主要是必须自己过一遍。编译器过一遍，最好让它写测试用例再过一遍。
直接把各种错误反馈回去让他自己改就行。
肯定没脚本语言那么容易一次成功，但也能大幅度提升效率了。
最提升效率的场合就是需要调用一个之前没用过的库/设备sdk，把文档一扔，自己描述一下想要一个什么要的类，或者把自己的外层代码也扔进去，得到的结果一般都很不错。
总之局限到生成类这个场合我觉得是完全够用且大幅度提升效率的

overflowal 发表于 2025-4-30 17:24

moekyo 发表于 2025-4-30 17:06
DeepSeek 发了一个 https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B，不过应该给一般人用，用 ...

有点过分了，prover 1.5是一个7B的模型，prover v2直接上671B的。。。真的是非常自由

—— 来自鹅球 v3.4.97

moekyo 发表于 2025-4-30 20:09

overflowal 发表于 2025-4-30 17:24
有点过分了，prover 1.5是一个7B的模型，prover v2直接上671B的。。。真的是非常自由

—— 来自鹅球 v3 ...

我想看 V4 有多大

overflowal 发表于 2025-4-30 20:44

moekyo 发表于 2025-4-30 20:09
我想看 V4 有多大

肯定更大。而且几乎可以肯定是多模态的。怀疑在1T以上，按照deepseek的风格，他们会把之前论文发的各种创新用起来。全新的注意力机制，janus的多模态能力，新的强化学习方法，还有prover v2可能用的新方法。

—— 来自鹅球 v3.4.97

neptunehs 发表于 2025-4-30 22:11

本帖最后由 neptunehs 于 2025-4-30 22:18 编辑

overflowal 发表于 2025-4-30 17:24
有点过分了，prover 1.5是一个7B的模型，prover v2直接上671B的。。。真的是非常自由

—— 来自鹅球 v3 ...

我是觉得ds应该是判断小模型没用不做了
之前的r1qwen只是为了证明他们的路子有效

这次qwen3也让我对小模型的能力产生了一定疑问以后估计最多用用12b当玩具了 32b这样的感觉没啥前途

但愿我是错的毕竟按照现在这趋势可能单机小模型多模态并不现实这很不好

7do 发表于 2025-5-1 00:31

今天算是碰到ai的局限性 ds反反复复地给我一个没用的解决方案，怎么给他反馈都没用
现在ai一个缺点是当一个问题他解决不了的时候他就在那给你绕，说的像真的一样
虽然最后还是靠ds解决了问题

— from S1 Next Goose v3.5.99

larry1 发表于 2025-5-1 02:07

Rainwedell 发表于 2025-5-1 05:37

larry1 发表于 2025-5-1 02:07
有没有帮着分析现有代码的模型啊。
我这有一堆别人写的代码小找他分析。主要是想改改，但我不想看他写的一 ...

claude，确实很好用

—— 来自 Xiaomi 22041211AC, Android 14, 鹅球 v3.5.99-alpha

页: [1] 2

Stage1st's Archiver

讨论用来ai编程的国产模型