核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
超小团队选择Django还是Flask?
独立开发者都使用了哪些技术栈?
有谁现在正在使用苹果mac mini 吗?能分享一下使用感受不?
韩红痛斥歌手耳机里都是提示音,反映了行业的哪些问题?提示音是歌手表演的必要辅助吗?
小朋友到底应不应该购买SWitch?
Node.js是谁发明的?
哪个瞬间让你觉得编程只是一门技术?
为什么 Bun 选择了 Zig 以及 JSCore?
慢跑 5 公里用 40 分钟是不是很丢人?
能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
电话:
座机:
邮箱:
地址: