您的位置：首页 >原创 >

“西湖”西湖大学成立5周年，施一公：做创新的守护者是使命也是未来 “考生”下半年自考即将开始省考试院发出温馨提示 “铜陵”化工厂爆炸？两名造谣者被查处 “尔森”用心倾听大自然的神秘邀约 “小行星”我国2030年前后实现载人登月 “在我”忆来只把旧书读 “儿子”妈妈将50余万“读书钱”存儿子名下，19岁儿子取出转给女友，妈妈无奈起诉追回 “父亲”父亲的眼神杀 “爷爷”爷爷的石榴树 “考生”硕士统考发布报名提醒考生需及时自查，抓紧时间修改 “都是”A股的觉醒之年！ “科博会”芜湖科博会集中展示大国重器 “力学”王博已任大连理工大学副校长 “这是”自内耗到自洽 “陈老”高山仰止，景行行止 ——读春桃老师所著《国医》 “合肥市”“柿柿如意，柿如破竹”…… 高三学子“花式解压” “孩子”一生的功课 “诗人”带着大海散步的人 “说了”云朵的话语，心灵的方剂 ——读周实《有些话语好像云朵》 “大桥”G3铜陵长江公铁大桥先导索过江 “超新星”云南天文台发现Ia型超新星前身星候选体 “某甲”父亲被羁押继母要离婚，未成年女儿谁来抚养？法官多方努力，难题解决了！ “知网”中国知网用户委员会两名成员公开亮相 “肌肉”磁铁刺激疗法可“对齐”肌肉纤维 “益康”倍益康上市几个月收入净利都大减市值仅几亿创始人张文有啥办法？ “宁德”宁德时代三季报：业绩增速放缓、海外市场份额扩大 “科幻”和成都和教育，一起遇见未来！两份重要“科幻教育”名单公布 “亚马逊”哪些以色列芯片公司已被美国企业收购？ “宜宾”近2万人参加！2023宜宾长江马拉松开跑：埃塞俄比亚选手包揽全马组男女前三名 “低价”第15个双11：电商巨头争夺“最低价”、取消预售、开放生态 “科幻”嘉宾共话科幻的未来：被视为“珍贵市场”，中国科幻正青春 “新材料”信金控股完成新一期人民币基金首关 “红星”梁静茹南京演唱会再现“柱子票” 主办方：临时布置追光灯，正与观众沟通 “结构”结核杆菌致病机制获揭示 “鲁南”鲁南制药集团建厂55周年：“向新向未来” “犯罪嫌疑人”湖南新化砍伤一对夫妇的犯罪嫌疑人落网，4人涉嫌窝藏罪被批捕 “灯会”红星观察｜自贡灯会走出“春节舒适区”：首次试水中秋国庆主题灯会火出圈背后 “同比增长”失守3000点后，A股市场的危与机｜智氪 “导盲犬”视障女子自曝带导盲犬进公园遭保安阻拦公园方：天色较晚不知其实情，沟通后已放行 “装修”装修公司老板明知公司亏损仍吸引客户签合同，骗取上百人700余万，被判11年 “小行星”首次！我国计划实施近地小行星防御任务 “射电”穿越80亿光年的快速射电暴源于一场“星系交通事故” “民谣”玉林民谣，从成都走向深圳 “中国移动”中移动市场详情：合作伙伴大会重要发言及发布、反诈、5G应用获奖 “华为”新麒麟全面替代！曝华为正在清理骁龙机型库存：掀起全线新品的“洪流” “商务部”商务部：达成共识！ “肿瘤”科学家揭示肿瘤免疫逃逸新机制，鉴定三个癌症生存相关因子，为肿瘤免疫治疗注入新动力 “必胜客”必胜客最黑暗的料理来了 “亿元”爱仕达董事长陈合林做铁锅起家公司已连续亏损两年多他有啥招术？ “血液”简单的血液检查调整可使重症监护治疗更安全

“模型”一次通过率73％，开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型

2023-08-27 13:05:12来源：机器之心Pro

今天，很高兴为大家分享来自机器之心Pro的一次通过率73％，开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型，如果您对一次通过率73％，开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型感兴趣，请往下看。

在开源这件事上，Meta 不愧是业界良心。

这几天，代码大模型领域又热闹了起来！

先是 Meta 开源代码专用大模型 Code Llama，且免费商用。效果也非常好，Code Llama 在 HumanEval 和 MBPP 代码数据集上的一次生成通过率（pass@1）轻松超越 GPT-3.5，其中「Unnatural」版本的 pass@1 逼近了原始 GPT-4（OpenAI 在今年 3 月 GPT-4 技术报告中的数据）。

Code Llama 发布仅一天，来自 Phind 组织的研究人员用微调的 Code Llama-34B 在 HumanEval 评估中击败了 GPT-4。他们的两个模型 Phind-CodeLlama-34B-v1 以及 Phind-CodeLlama-34B-Python-v1 在 HumanEval 分别实现 67.6% 和 69.5% 的 pass@1，显然都超越了原始 GPT-4 的 67%。

不过，仅仅又过了一天，Phind 微调版 Code Llama 又迎来了一个强劲的对手。这次是 WizardLM 团队的编程专用大模型 WizardCoder。

该团队推出了基于 Code Llama 的最新版本模型 WizardCoder 34B，它利用 Evol-Instruct 进行微调而成。

结果显示，它在 HumanEval 上的 pass@1 达到了惊人的 73.2%，超越了原始 GPT-4、ChatGPT-3.5 以及 Claude 2、Bard。此外，WizardCoder 13B 和 7B 版本也将很快到来。

GitHub 地址：https://github.com/nlpxucan/WizardLM/tree/main/WizardCoder

Huggingface：https://huggingface.co/WizardLM/WizardCoder-Python-34B-V1.0

此次具体版本是 WizardCoder-Python-34B-V1.0，下图是与主流闭源和开源模型的 HumanEval pass@1 比较。除了最新 API 的 GPT-4（该团队测试后得到的结果是 82.0%），该模型超越了所有闭源和开源模型，包括最新 API 的 ChatGPT（72.5%）和原始 GPT-4（67%）。

因此，WizardCoder-Python-34B-V1.0 成为了最新的 SOTA 开源代码大模型。

WizardLM 团队还表示，WizardCoder-Python-34B-V1.0 的性能百分之百是可以复现的。

想要体验 WizardCoder-Python-34B-V1.0 的小伙伴可以尝试以下 demo。

demo 地址：http://47.103.63.15:50085/

有人表示，在试了 demo 后发现，提供准确代码之前似乎有 COT（思维链）在起作用，这非常棒。

还有人表示，WizardCoder-Python-34B-V1.0 要比 GPT-4 犯的错更少。

不过运行 WizardCoder-Python-34B-V1.0 需要 32GB 以上的 mac。

WizardLM 团队会带来更多惊喜

WizardCoder 在成为代码家族一员已经不是新鲜事，但是 WizardLM 团队每次都会给大家带来不一样的惊喜。

斯坦福发布的大语言模型排行榜 AlpacaEval 是一种基于 LLM 的全自动评估基准，且更加快速和可靠。很多著名的模型如 GPT-4、ChatGPT 等都在其上刷榜单。在这其中，WizardLM 13B V1.2 依旧在第六位。

WizardLM 是由 Can Xu 等人在 2023 年 4 月提出的一个能够根据复杂指令生成文本的大型语言模型。它使用了一个名为 Evol-Instruct 的算法来生成和改写指令数据，从而提高了指令的复杂度和多样性。 WizardLM 共有三个版本：7B、13B 和 30B。

WizardLM 推出的指令微调代码大模型 ——WizardCoder，更是打破了闭源模型的垄断地位，在 HumanEval 和 HumanEval + 上优于 Anthropic 的 Claude 和 Google 的 Bard。

更值得一提的是，WizardCoder 还大幅度地提升了开源模型的 SOTA 水平，创造了惊人的进步，提高了 22.3% 的性能，成为了开源领域的新晋「领头羊」。

以下为 WizardLM 团队在 GitHub 上发布的诸多模型，这些模型是该团队不断创新、改进的足迹。

WizardLM 团队在 WizardLM 与 WizardCoder 之后，还在今年八月中旬公布了 WizardMath。该团队还发推文表示，自己一直在致力于解决各个学科复杂的问题。

那么未来 WizardLM 团队还会带给我们怎样的惊喜，让我们拭目以待。

好了，关于一次通过率73％，开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型就讲到这。

返回科技金融网首页 >>

版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“科技金融网”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场，如有侵权，请联系我们删除。

相关文章

精彩推荐

“大桥”G3铜陵长江公铁大桥先导索过江

“某甲”父亲被羁押继母要离婚，未成年女儿谁来抚养？法官多方努

“亚马逊”哪些以色列芯片公司已被美国企业收购？

“装修”装修公司老板明知公司亏损仍吸引客户签合同，骗取上百人

“必胜客”必胜客最黑暗的料理来了

“运营商”运营商本周行业动态：电信年度优秀领导及上半年重点工

最新文章

“在我”忆来只把旧书读

“科博会”芜湖科博会集中展示大国重器

“诗人”带着大海散步的人

“宁德”宁德时代三季报：业绩增速放缓、海

“新材料”信金控股完成新一期人民币基金首

“同比增长”失守3000点后，A股市场的危与

“商务部”商务部：达成共识！

“基金”又一家基金公司换董事长，年内公募

图文欣赏

“儿子”妈妈将50余万“读书钱”存儿子名下，19岁儿子取出转给女友，妈妈无奈起诉追回

“儿子”妈妈将50余万“读书钱”存儿子名

“说了”云朵的话语，心灵的方剂 ——读周实《有些话语好像云朵》

“说了”云朵的话语，心灵的方剂 ——

“科幻”和成都和教育，一起遇见未来！两份重要“科幻教育”名单公布

“科幻”和成都和教育，一起遇见未来！两

“红星”梁静茹南京演唱会再现“柱子票” 主办方：临时布置追光灯，正与观众沟通

“红星”梁静茹南京演唱会再现“柱子票”

热门文章

“数据”有博主曝光特斯拉潮州事故EDR数据

技术的妇女的百分比仍然低于16％，10年来少

“冻土”东北大尺度高分辨率多年冻土制图取

MOT Office将应用程序与CA Technologies界面扩展

“热销”“热销脱毛仪评测”购买指南看这篇

vonage，在其Nexmo收购的背面，尝试做一个二折

“音乐节”今年首场演出风波冲上热搜：澳门

“航天员”安装舱外助力手柄精心规划回舱