美东时间6月27日周四,OpenAI公布,研究人员训练了一个基于GPT-4的模型名为CriticGPT,用于捕捉ChatGPT代码输出中的错误。据介绍,CriticGPT旨在使用“从人类反馈中强化学习(RLHF)”的技术来训练、改进GPT-4的回答,以协助人类AI训练员完成工作。