两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
代码:
在山上挖一座不放鱼的池塘,再过100年时间,里面会慢慢有鱼吗?
中小学英语教学为什么不直接***用《新概念英语》?
买到烂尾楼到底该有多绝望?
做网页开发时,允许用户输入url图片地址来作为自己的头像有什么风险?
如何证明散片 CPU 比盒装 CPU 差?
你在出租房屋发现过什么前租客留下的“宝藏”?
如何看待网上说的:凡是有阿里、华为经历的一律不要?
k8s最稳定的是那个版本?
为什么 mac mini 的 m4 版本价格这么低呢?
实体店为什么生意越来越难做了?
为什么没有人在意iPad Pro 2024标准版仅搭载的8GB内存(RAM)?
2025年现在开发php项目选择lar***el框架好还是thinkphp框架好?
为什么有的人喜欢带着 MacBook 去咖啡店或者书店上网,而不是 ThinkPad 之类的?
太空中没有氧气,为什么太阳还在燃烧?
鱼缸里的水经常要换,怎么办?
你们是怎样看待警察这一职业的?
MacOS的哪个设计让你非常恼火?
现有经济体系下,贵州是不是特别吃亏?
docker有哪些有趣的用途?
golang总体上有什么缺陷?
男女对立会在 10后里缓和吗?
为什么现在吹Rust的人这么多?
鱼缸的硝酸盐含量为多少比较合适?
为什么程序员独爱用Mac进行编程?
go 有哪些成熟点的后台管理框架?
如何让 Apple 停止对副厂输入法的「妖魔化」?
Windows有哪些神级软件?
有哪些事,是社会底层人认识不到的?
把贵州省撤销,设立一个超大型国家自然公园,是不是一个好的提法?
为什么抖音上的姑娘都那么好看,现实中我怎么一个也见不着?