CHATGPT-openai.com

ChatGPT 是InstructGPT的兄弟模型 ,它经过训练可以遵循提示中的指令并提供详细的响应。

CHATGPT-openai.com

网站地址:https://openai.com/blog/chatgpt

网站名称:CHATGPT-openai.com

收录时间:2024-02-17

浏览次数:150

出站次数:132

分类标签: Ai网站

网站介绍: 我们使用人类反馈强化学习 (RLHF) 来训练该模型,使用与 InstructGPT相同的方法,但数据收集设置略有不同。我们使用监督微调训练了一个初始模型:人类人工智能培训师提供对话,他们在对话中扮演双方——用户和人工智能助理。我们为培训师提供了模型编写的建议,以帮助他们撰写答案。我们将这个新的对话数据集与 InstructGPT 数据集混合,并将其转换为对话格式。 为了创建强化学习的奖励模型,我们需要收集比较数据,其中包括按质量排名的两个或多个模型响应。为了收集这些数据,我们记录了人工智能培训师与聊天机器人的对话。我们随机选择了一条模型编写的消息,抽取了几种替代的完成方式,并让人工智能培训师对它们进行了排名。使用这些奖励模型,我们可以使用近端策略优化来微调模型 。我们对这个过程进行了多次迭代。

0

呆错网址导航系统免费下载
免责申明

1、本文数据来源于CHATGPT-openai.com(openai.com)。

2、本站收录CHATGPT-openai.com时该网站内容都正常,如遇失效、请联系网站管理员修复。

3、本站仅提供CHATGPT-openai.com的信息展示,不承担相关法律责任。

4、本站不接受任何违法信息提交,如有违法内容,请立即举报。

5、本文地址 http://wxkou.com/dhinfo/CHATGPT.html,复制请保留版权链接。