在面对挑战时,复旦MOSS团队公开表示了抱歉,解释了计算资源不足、缺少相关工程经验等问题。尽管MOSS尚有改进的空间,但这一创新表明国内科研团队在开发ChatGPT类产品时有着克服技术挑战的实力。团队计划在MOSS初步验证后,将其经验、代码、模型参数开源,供他人参考。MOSS展示了回答问题、生成文本、编写代码等能力,但在中文方面仍有提升空间。由于其模型基座学习的英文远多于中文,导致在理解和生成中文文本时表现欠佳,这也让其在应对中文网页上的干扰信息时面临难题。
复旦大学自然语言处理实验室正在努力推进中文语料的清洗工作,以提高MOSS在中文语言技能上的表现。由于缺乏高质量数据、计算资源和模型容量,MOSS仍然远远落后于ChatGPT,并可能生成包含误导性或虚假信息的内容。团队承诺将根据有价值的用户反馈不断改进模型,使MOSS拥有更加可访问的界面。
MOSS的内测申请流程需要邀请码,团队也因服务器瘫痪问题向用户致歉。MOSS的开发包括两个阶段:自然语言模型基座训练和理解人类意图的对话能力训练。团队采用独特的技术路线,通过MOSS和人类、其他对话模型的互动提升学习效率,加快了对话能力训练的进程。
复旦MOSS团队在GitHub页面列出了MOSS和ChatGPT之间的三个区别:MOSS的参数数量较少、通过与人类和其他AI模型对话学习、与ChatGPT使用人类反馈强化学习进行训练。MOSS的开源将有助于未来的发展。
标签: 复旦大学、 服务器、 服务器、 IBM、本文地址: https://yihaiquanyi.com/article/6d653db30d69042d724f.html
上一篇:续章探索第二章继续探索吧...