MingLi-Bench开源:160道算命大赛真题评测AI命理水平

AI 到底会不会算命?MingLi-Bench 用一种很硬核的方式回答这个问题——把全球算命师大赛 2022 到 2025 年的真题整理成 160 道选择题,覆盖事业、健康、婚姻、子女、财运、学业、官非、灾劫十二大类人生事件,全都是真实赛题不是闭门造车编的。

设计上把排盘和推理解耦:通过 iztro 库预先算好八字和紫微命盘,模型直接拿到命盘信息去推流年事件,避免”排盘排错了后面全白给”。当然也可以关掉这个测模型自己排盘准不准。选项顺序能打乱防止模型只选某个固定位置。

支持 GPT-4o、Claude、Gemini、DeepSeek-R1、豆包等主流模型,走 OpenRouter 一个 key 覆盖大部分。评分标准简单粗暴:跟标准答案完全一致才算对,没有”部分得分”的模糊空间。跑完在 logs 目录吐三类文件:详细 JSON、摘要 TXT、每道题的模型原始回复——翻回去看 AI 到底胡说了啥特别有意思。

项目下载:https://pan.quark.cn/s/918ecb5f022c

GitHub 项目地址:github.com/DestinyLinker/MingLi-Bench


52软件资源库 » MingLi-Bench开源:160道算命大赛真题评测AI命理水平

发表回复