
最近玩智能体啊实在太消耗token了。所以我们今天要来讨论说啊,哪里能搞到便宜的,甚至是免费的大模型token呢。首先我们来看一下啊,如果正常使用token大概是个什么价格呢?像我们日常最常用的这个网页版的聊天机器人啊,类似于豆包jaminina这些网页的服务。一问一答,大概每一次呢会消耗几千到几万的token,一个月下来呢大概可能就是300万的token数量,也就是几块钱。但agent就完全不一样了。他要自己规划,自己执行自己反思一个任务跑下来呢,可能会调用几十上百次的模型。
像我们最常使用的cloud code openen code, openen cloud这些智能体啊,每一次跑起来都要消耗几万甚至上百万数量级的token。我也翻了一下我自己的使用日志啊,然后大概估算了一下,我每个月的使用量呢大概是3亿个token左右。然后我们来算比账啊。如果你使用的是cloud4.5这个模型,它的价格呢大概是每100万的token输入呢是3美元,输出呢是15美元。考虑上一些这个缓存啊,折扣啊,平均价格呢,你可以认为是每100万的token5美元左右。那这么一算啊,其实你跑一个。每个月其实要烧掉1500美元左右,就算是换成便宜的多的国产模型啊,一个月也要用到200到300美元。这个价格呢我觉得还是蛮离谱的。
所以这些视频啊我就来跟大家聊聊,怎么才能搞到便宜的,甚至是免费的大模型接口。先说好,本文是没有任何的广告的,全是我自己实测实际使用的经验。在正式开始之前啊,我想先给你一个这个思考框架。省钱这件事情呢,本质上其实就在做三个维度的取舍。价格稳定性模型的能力。你不可能三个都要。如果你想要最强的模型。并且稳定,那肯定就会稍微贵一点。如果你想要便宜,那肯定就要牺牲一些模型的能力或者是稳定性。
我们带着这个框架呢,然后再来逐个看各家的方案。先来说这个cloud买套餐到底能省多少钱呢?官方没有公布套餐的实际使用量。但有人测过了,数据呢放在这个网址里面。我给大家总结了一下。如果你订阅100刀的这个套餐。用到极限的话,就能用掉价值1350刀的这个额度,相当于打了不到一折,换成人民币算的话,差不多就是0.5元的人民币,就能买到一美元的这个使用量,但cloud官方有两个大坑啊,大家也都知道。第一呢就是国内的用户特别容易封号。第二个呢就是不允许介入其他第三方的服务。你只能在这个cloud code这些官方应用里面使用,没有办法呢它去接入open cloud或者是其他第三方的这个智能体。
如果你又想要这个按量付费的这个灵活性,又想要这个套餐的折扣价。那怎么办呢?我觉得唯一的选择啊就是中转站。中转站呢你可以把它理解成为这个零售商,就他们会去批量的向cloud code官方购买这个套餐。然后呢在中间加一些价格再卖给你。0.5元的人民币兑换1美元的这个使用量,这是他们的成本价。零售价呢可能都要在1元人民币兑换1美元以上。市面上有上百家的这个中转站,那怎么挑呢?有人做了一个中转站稳定性的监测,大家想要购买,想要具体了解的,其实可以看这个网站,上面呢监控了几家比较大的这个中转站的稳定性。不过说实话,这个中转站呢基本上还是一门比较灰色地带的生意,所以呢建议大家每次别冲太多。
然后我们来说第二家那个GBT相比较那个cloud code动不动就封号。然后不让接其他的这个工具open eye呢其实就大方了很多。它不仅能接自家的这个codeex,还允许你去接open code,允许你去接open cloud这些第三方的项目,而且额度啊要比cloud要给的多,大概是0.3元人民币就能买到1美元的使用量。更香的是open eye的活动特别多。比如说像那个GPT开通团队套餐,首页免费。你可以去某一搜这个team拼车几块钱呢就能用上价值25到一个月的会员。如果你拿这个会员去跑codeex啊,token相当于说完全白嫖codeex缺点呢。就是他写代码的速度啊会相对来说比较慢一点。不过呢你可以开多个agent,让它并行去跑,用数量去换取速度。
然后下面一个是这个谷歌jaminjaminite系列模型,写代码的综合能力啊,普遍来说稍微比这个cloud和GPT弱一点。但有个骚操作啊,就是可以通过教育活动拿到免费一年的谷歌AI会员,然后用这个谷歌的编程IDE antigra来跑这个cloud模型。然后还有一个更狠一点的玩法,就是用这个项目clo proy APII它可以把N gravity里面cloud模型转接出来给open cloud这些工具取用。因为谷歌会员啊几乎都能白嫖,所以它对应的这个token啊也约等于免费。不过这么玩的人啊太多了,谷歌最近呢在频繁调整这个antticgrav的额度,所以这个方法我也不是太推荐,因为它可能之后就不太稳定了。
聊完了预2026加之后啊,我们来聊一聊国产的这些模型。国产的模型呢本来零售价就只有海外模型的1到2折。购买套餐之后呢就会更便宜了。在国产模型里面,我觉得当下最强的可能就是最近推出的这个kimiK2.5,我实际用下来它的能力其实跟cloud4.5几乎没有什么差别。有兴趣的朋友啊可以去kiimmi的海外版看一看,有个首月0.99美元的活动,能拿到原价99元的套餐,还可以支持这个接入第三方的clo codeopen cloud。国内版kimi的活动呢就稍微差点意思。每周大概5元左右。但是kimi我觉得最大的问题啊,就是套餐额度给的比较抠,控制台里呢只显示了使用的百分比,看不到具体的token使用量。我实际测下来呢比下面两家我要介绍的这个国产模型啊,给的量都要少得多。
GLM呢应该是国内3家里面我觉得最大方的,然后套餐的额度给的非常的足,最低档的套餐呢是每个月20元,每年240元,但价格是真的香,我自己也买了接口方面呢也很开放,可以支持接入各种的工具。缺点呢就是现在GLM4.7啊,它的模型效果暂时不如kimi,而且高峰时间段呢因为过气套餐卖的太多了。token的土字呢我觉得巨慢。另外一个minimax呢,我觉得它的套餐跟GLM很像。然后这里也不跟大家重复了。
还有一家呢,大家可能没想到就比较小众,就是英伟达英伟达呢其实它也提供这个完全免费额度不限的这个开源模型,包括前面说的kimiK2.5,然后GRM4.7min maxM2.1。但是呢因为可能门槛太低了,然后用的人实在太多,热门模型的速度呢慢的离谱。所以这个呢我就更不推荐了,只是跟大家介绍一下英伟达它其实也有这个免费的接口。最后啊来再帮大家整理一下思路。如果你想追求最强的效果。cloud的中转站呢是目前性价比最高的选择。如果你的预算有限啊,那国产模型里面GRM的套餐最实惠。kimiK2.5的效果最好。但是有传闻的。说2026会有大批的这个模型会推出新一代的模型。到时候呢我再跟大家更新。如果你有更好的渠道,欢迎在评论区补充,大家一起交流。