UIUC发布StarCoder2-15B-Instruct代码大模型

品玩5月16日讯，据 Huggingface 页面显示，UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型。

StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略，整个训练流程公开透明，且完全自主可控。通过自我生成数千个指令-响应对，直接对StarCoder-15B基座模型进行微调，无需依赖昂贵的人工标注数据，也无需从商业大模型中获取数据，避免了潜在的版权问题。

在HumanEval测试中，StarCoder2-15B-Instruct以72.6%的Pass@1成绩脱颖而出，较CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench数据集的评估中，这一自对齐模型的表现甚至超越了基于GPT-4生成数据训练的同类模型，证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白

发表看法

{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":306456879141008,"tweetId":"306456879141008","gmtCreate":1715828107000,"gmtModify":1715829040511,"author":{"id":3585895914412071,"idStr":"3585895914412071","authorId":3585895914412071,"authorIdStr":"3585895914412071","name":"品玩","avatar":"https://static.tigerbbs.com/b172a08e9f14d6bb2f35c135c87f473e","vip":6,"userType":6,"introduction":"有品好玩的科技，一切与你有关","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":458,"starInvestorFlag":false},"themes":[],"images":[],"coverImages":[],"title":"UIUC发布StarCoder2-15B-Instruct代码大模型","html":"<html><head></head><body>品玩5月16日讯，据 Huggingface 页面显示，UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型。\nStarCoder2-15B-Instruct的独特之处在于其纯自对齐策略，整个训练流程公开透明，且完全自主可控。通过自我生成数千个指令-响应对，直接对StarCoder-15B基座模型进行微调，无需依赖昂贵的人工标注数据，也无需从商业大模型中获取数据，避免了潜在的版权问题。\n在HumanEval测试中，StarCoder2-15B-Instruct以72.6%的Pass@1成绩脱颖而出，较CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench数据集的评估中，这一自对齐模型的表现甚至超越了基于GPT-4生成数据训练的同类模型，证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。\n</body></html>","htmlText":"<html><head></head><body>品玩5月16日讯，据 Huggingface 页面显示，UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型。\nStarCoder2-15B-Instruct的独特之处在于其纯自对齐策略，整个训练流程公开透明，且完全自主可控。通过自我生成数千个指令-响应对，直接对StarCoder-15B基座模型进行微调，无需依赖昂贵的人工标注数据，也无需从商业大模型中获取数据，避免了潜在的版权问题。\n在HumanEval测试中，StarCoder2-15B-Instruct以72.6%的Pass@1成绩脱颖而出，较CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench数据集的评估中，这一自对齐模型的表现甚至超越了基于GPT-4生成数据训练的同类模型，证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。\n</body></html>","text":"品玩5月16日讯，据 Huggingface 页面显示，UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型。 StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略，整个训练流程公开透明，且完全自主可控。通过自我生成数千个指令-响应对，直接对StarCoder-15B基座模型进行微调，无需依赖昂贵的人工标注数据，也无需从商业大模型中获取数据，避免了潜在的版权问题。 在HumanEval测试中，StarCoder2-15B-Instruct以72.6%的Pass@1成绩脱颖而出，较CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench数据集的评估中，这一自对齐模型的表现甚至超越了基于GPT-4生成数据训练的同类模型，证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。","highlighted":1,"essential":1,"paper":2,"likeSize":0,"commentSize":0,"repostSize":1,"favoriteSize":0,"link":"https://laohu8.com/post/306456879141008","repostId":0,"isVote":1,"tweetType":1,"viewCount":849,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":606,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/306456879141008"}