白嫖Gemini当API用?这个开源项目让你零成本跑大模型

痛点
搞开发的朋友应该都有体会,调OpenAI的API那个账单跑起来真的心疼。哪怕就是用Gemini官方的API,绑信用卡、查额度、算token,一套流程下来头都大了。特别是做个人项目或者写毕设的时候,还没开始赚钱呢就先掏了一笔API费用,怎么想怎么别扭。
最近逛GitHub发现了一个挺有意思的项目——gemini-web2api,思路很野:直接模拟浏览器行为去访问Gemini网页端,然后把对话结果转成标准的OpenAI API格式返回。说白了就是,你不需要任何API key,不绑信用卡,不用担心额度,只要有个Gemini账号就能白嫖。
部署
这东西最让我意外的地方在于,它整个项目就一个Python文件,而且用的是纯标准库,连pip install都不需要。clone下来直接python跑就完事了。
配置方面也很省心,api_keys那个字段留空就是完全免密模式,谁都能调。如果你想加点权限控制,填上自定义key就行。模型名后面还能加@think=0到@think=4的后缀来控制思考深度,这个设计满巧妙的,省得再单独写参数了。
兼容性
很多人可能会问,转出来的API格式到底行不行?实测下来,OpenAI的SDK可以直接对接,Codex CLI和Gemini CLI这两套生态也都能用。流式输出SSE、Function Calling、联网搜索这些高级功能都支持,不是那种只能简单对话的阉割版。
有个比较惊喜的点是Flash Thinking模式,能输出两万多字的超长回复,拿来做长文档分析或者写长文完全够用。我自己拿来跑了几个测试,响映速度跟直接用网页端差不多,没有明显的额外延迟。
聊聊缺点
首先图片上传目前是不支持的,只能处理纯文本。其次如果你用的是Pro模型,cookie过期之后不会自动回落的Flash模型,需要手动去更新cookie。再就是高频调用可能会被Google风控逮到,毕竟本质上是在模拟浏览器访问,太猛了账号可能会被临时限制。
说实话这类工具都有的问题它也有——稳定性完全取决于Google那边会不会改网页结构。一旦前端更新了接口,这项目就得跟着更新。拿来长期做生产环境肯定不靠普,但个人学习、做做原型、跑跑测试,那确实够用。
小结
如果你就是想在本地搞个小工具、做个demo,或者纯粹不想为API花冤枉钱,这东西值得试试。零成本入门大模型开发,门槛压到了最低。但要是想拿来搞正经生产服务,建议还是老老实实买官方API,别在关键链路上省这点钱。
下载地址放下面了,感兴趣的自取。
下载地址:https://pan.quark.cn/s/823d93a86108