当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
印度为什么一定要和中国作对?
为什么成功人士的精力都非常旺盛?
有个漂亮女朋友是种怎样的体验?
如何评价b站数码区up主 “大狸子切切里”?
山姆超市是怎么在中国火起来的?
中了一个亿 你会做什么?
J***a 除了 Spring 还有什么?
慈禧为什么要反对戊戌变法?
大厂后端开发需要掌握docker和k8s吗?
前端如何设计网页?
为什么用 electron 开发的桌面应用那么多?
网传前小米总监冯德兵婚内出轨,200 多份「包养合同」,这是真的吗?具体是怎么回事?
你见过最垃圾的国企是什么样的?
为什么这么多人讨厌中国移动?
是什么原因导致HDR无法推行?
有没有宝塔平替的服务器管理面板,现在宝塔越来越贵了,也太臃肿了?
为什么今年的雷霆会惹众怒?
和异性最疯狂有多疯狂?
小乌龟最喜欢什么样的水质?
一个母亲对儿女说,这世上除了爸妈没人真心希望你们好。请问你怎么看?
为什么微信不向telegram学习?
央行行长潘功胜首次在公开场合谈及稳定币,稳定币是什么?有何深意?
网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?
手机的运行内存真的有必要上16GB吗?
用PHP写了个小框架,怎么才能得到大佬们的指点?
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
健身为什么要多练腿?
《西虹市首富》里面想花完钱却越花越多的情况,现实里面会发生吗?
你最真实(很少吐露)的择偶标准是什么?