站长之家(ChinaZ.com)12月4日信息: 近期微软的钻研成绩展现了经过「提醒工程」成功将GPT-4转化为医学专家的威力。在医学专业畛域,GPT-4经常使用提醒战略Medprompt在MultiMedQA九个测试集中取得了超越90%的准确率,逾越其余高度微调的模型,如BioGPT和Med-PaLM。
Medprompt是一个由灵活少样本选用、自生成思想链和选项洗牌集成等多种提醒战略组成的综合体,使GPT-4能够在医学畛域体现出色,同时也具备通用性,可以推行到电气工程、机器学习、法律等专业中。
文章地址:https://arxiv.org/pdf/2311.16452.pdf
自生成思想链经过要求GPT-4经常使用特定提醒生成思想链,成功了逐渐思索和推理,从而提高了模型的细粒度逻辑。选项洗牌集成处置了在选用题中或者存在的位置偏向疑问,经过打乱选项顺序并启动多轮预测,最终选用最分歧、正确的选项。
在测试中,GPT-4联合Medprompt在MultiMedQA九个基准数据集中体现出色,优于其余微调方法。消融试验进一步验证了Medprompt各组件对全体性能的奉献,其中智能生成思想链步骤对性能优化的奉献。
此外,钻研人员还探求了Medprompt的跨域泛化才干,发现其在不同畛域的数据集上雷同取得了清楚的优化。这一钻研成绩引发了宽泛关注,被以为是一项能够扭转行业的技术。目前咱们仍未触及提醒的极限,也未到达微调的极限,为未来钻研和开展提供了更多的探求空间。
(揭发)
标签: 4、 GPT、本文地址: https://yihaiquanyi.com/article/be3314399ce71fa92799.html
上一篇:AI电商时代是什么AI电商时代有多少人的工作...