核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
写CUDA到底难在哪?
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
现在个人博客不能备案了吗?
《碟中谍 8》都有哪些槽点?
为什么日本经济下降,大学排名跌至谷底,还有那么多人挤破脑袋去日本留学?
Rust开发Web后端效率如何?
为什么这么多人说 Gmail 好用?Gmail 和 QQ 邮箱相比到底好在哪里?
发生了什么导致你从此再不吃某样食物?
如何评价前端框架 Solid?
iOS开发新手入门应该学OC还是swift?
电话:
座机:
邮箱:
地址: