DeepSeek-R1-Distill-Qwen-7B 模型测试如下:
前面是思考过程,可以看到非常有逻辑性,最后的代码也是正确的。特别的,它还通过设置标志位,提前终止没必要的循环,提升了效率。
代码正确。
思考过程和最后的证明都是正确的。
再用 DeepSeek-R1-Distill-Qwen-1.5B 测试了下,第1问和第3问也都回答正确,第2问代码有些问题。
最后说下我的观察:
通过大模型蒸馏出小模型加上推理能力,小的模型也有非常强大的泛化能力。 目前模型所谓的推理能力,我觉得是通过增加模型回忆相关问题上下文的能力,这样就能更好地发挥已有的知识储备,减少幻觉。
目前大模型可以很好地解决用语言描述的问题,已经有了依葫芦画瓢的能力。但是我用小学三年级的数学周长问题(需要视觉分析)喂给图像理解模型,发现模型并不能真正理解,视觉的问题大模型还有待新的创新和突破。
欢迎关注我的微信公众号[数学345]:长按"识别图中二维码";或打开微信扫一扫。