12月15日,OpenAI在官网公布了最新研究文章和开源项目——如何用小模型监督大模型,实现更好的新型对齐方法,大模型的主流对齐方法是RLHF,研究人员在NLP等测试任务中进行了。
更新时间:2024-01-11 13:07:20