核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
MySQL不香吗,为啥还要Elasticsearch?
苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
如何看待亮亮丽君夫妇中的女主又怀孕?
如果让你设计攻打台湾地区,你会有什么好的想法和打法?
能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
为什么有的女生喜欢穿紧身牛仔裤?
UI图标与ICON图标的区别?
5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何?
2025年了 Rust前景如何?
如何看待罗帅宇爸爸新浪微博6月16日放出的录音材料?
电话:
座机:
邮箱:
地址: