#腾讯公布大语言模型训练专利# 可提高模型的准确性

天眼查App显示，2月7日，腾讯科技（深圳）有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利公布。

摘要显示，在该方法中，通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本，为模型训练提供了更多可学习信息，同时由于第一摘要文本和第二摘要文本包含的信息量不同，且第一摘要文本中包含正确语句和错误语句，通过对同一样本文本的两个不同摘要文本进行对比学习，并区分学习第一摘要文本中的正确语句和错误语句，避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题，不仅提高了模型的泛化性能，还提高了模型的准确性。

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白

发表看法

{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":401412612641216,"tweetId":"401412612641216","gmtCreate":1739008819065,"gmtModify":1739008826286,"author":{"id":3531310196121418,"idStr":"3531310196121418","authorId":3531310196121418,"authorIdStr":"3531310196121418","name":"熔财经","avatar":"https://static.tigerbbs.com/8ccdbe6c0d416bb4a64b5f02dc616d20","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":65,"starInvestorFlag":false},"themes":[],"images":[{"img":"https://static.tigerbbs.com/eacb937014d32d7c6c4a956812c8a939","width":"859","height":"880"},{"img":"https://static.tigerbbs.com/98813cfe950faf80cded7564ad1042c0","width":"864","height":"867"}],"coverImages":[{"img":"https://static.tigerbbs.com/eacb937014d32d7c6c4a956812c8a939","width":"859","height":"880"}],"title":"#腾讯公布大语言模型训练专利# 可提高模型的准确性","html":"<html><head></head><body>天眼查App显示，2月7日，腾讯科技（深圳）有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利公布。\n<img src=\"https://static.tigerbbs.com/eacb937014d32d7c6c4a956812c8a939\" tg-width=\"859\" tg-height=\"880\">\n<img src=\"https://static.tigerbbs.com/98813cfe950faf80cded7564ad1042c0\" tg-width=\"864\" tg-height=\"867\">\n摘要显示，在该方法中，通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本，为模型训练提供了更多可学习信息，同时由于第一摘要文本和第二摘要文本包含的信息量不同，且第一摘要文本中包含正确语句和错误语句，通过对同一样本文本的两个不同摘要文本进行对比学习，并区分学习第一摘要文本中的正确语句和错误语句，避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题，不仅提高了模型的泛化性能，还提高了模型的准确性。</body></html>","htmlText":"<html><head></head><body>天眼查App显示，2月7日，腾讯科技（深圳）有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利公布。\n<img src=\"https://static.tigerbbs.com/eacb937014d32d7c6c4a956812c8a939\" tg-width=\"859\" tg-height=\"880\">\n<img src=\"https://static.tigerbbs.com/98813cfe950faf80cded7564ad1042c0\" tg-width=\"864\" tg-height=\"867\">\n摘要显示，在该方法中，通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本，为模型训练提供了更多可学习信息，同时由于第一摘要文本和第二摘要文本包含的信息量不同，且第一摘要文本中包含正确语句和错误语句，通过对同一样本文本的两个不同摘要文本进行对比学习，并区分学习第一摘要文本中的正确语句和错误语句，避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题，不仅提高了模型的泛化性能，还提高了模型的准确性。</body></html>","text":"天眼查App显示，2月7日，腾讯科技（深圳）有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利公布。 摘要显示，在该方法中，通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本，为模型训练提供了更多可学习信息，同时由于第一摘要文本和第二摘要文本包含的信息量不同，且第一摘要文本中包含正确语句和错误语句，通过对同一样本文本的两个不同摘要文本进行对比学习，并区分学习第一摘要文本中的正确语句和错误语句，避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题，不仅提高了模型的泛化性能，还提高了模型的准确性。","highlighted":1,"essential":1,"paper":2,"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/401412612641216","repostId":0,"isVote":1,"tweetType":1,"viewCount":306,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":["TCEHY"],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":505,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/401412612641216"}