
文章来源: 更新时间:2024-10-11 07:50:08
这里的“推理”指的是reasoning,而不是inference: 希望模型生成结果的时候不要快出答案, 而是经过多步思考以后再出结果. 最近很受关注的OpenAI O1模型就是这种方法训练出来的模型, 在post-train阶段训练模型如何经过复杂推理以后再出答案. 这种方法不仅对解决需要逻辑推理的问题 ( 例如解数学题) 很有效, 对其它看上去不太需要太多“推理“的问题的解决也会有帮助. 但理想很丰满 (“推理”服务确实能更好地解决问题), 现实很骨…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: