核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
代码:
雷军为什么不愿意用性价比打法进军NAS?
为什么微信不向telegram学习?
我毕业想成为前端工程师,可是前端技术太多,越学越多,可是我想成为技术强的人,又很无助,怎么办?
买到烂尾楼到底该有多绝望?
cloudflare的1.1.1.1和warp有什么区别?
想知道这个女孩是谁?
当初中俄为什么不摧毁朝鲜的核设施,让朝鲜拥有了自己的核武器?
成都目前存在的最大的问题在哪里?
什么时候你意识到做技术永无出路?
人民币如果国际化,最好的锚定物是什么呢?
Rust 的设计缺陷是什么?
LCD党真的只是少部分人吗?
obsidian用一两年后会有多大?全文搜索还快吗?
为啥小姐姐们都不想做主播了?
Flutter集成rust到底有多好?
预测一下,下一次阅兵会出现什么武器震惊世界?
为什么不建议在 Docker 中跑 MySQL?
如何看待盲人UP主蒙眼炒鸡蛋在成都各大医院都买不到胰岛素,最后进抢救室?
太空中没有氧气,为什么太阳还在燃烧?
如何评价首个女性友好的编程语言HerCode?
路由器被隔空刷成校园网节点了,这在技术上是怎么实现的?
如何评价陈楚生?
NAS明明没那么好用,为什么还有那么多人坚持选择使用?
golang总体上有什么缺陷?
5070ti什么时候才能回归正常价格?
怎么看待B站舞蹈区和某些风格比较暴露的up?
外网测试同样的性能下的掌机安装steam os系统的性能比安装微软系统的帧率更强,原因是什么?