在手游行业,数据的准确性和检索效率一直是决定玩家体验和攻略质量的关键因素,随着游戏内容的日益丰富和复杂化,玩家对于攻略数据的依赖程度也在不断加深,浪潮信息发布的新嵌入模型“源”Yuan-EB(Yuan-embedding-1.0)在C-MTEB榜单上刷新了大模型RAG(检索增强生成)技术的检索精度纪录,为手游公司提供了前所未有的数据检索解决方案,将重塑手游攻略数据的获取和应用方式。
“源”Yuan-EB是专为增强中文文本检索能力而设计的嵌入模型,基于浪潮信息的“源2.0”模型进行创新,该模型在C-MTEB榜单的检索任务中以78.41的平均精度夺得第一名,这一突破性成果不仅刷新了RAG检索技术的最高成绩,更为手游公司提供了高效、精准的数据检索工具,在手游领域,这意味着玩家可以更快地找到最准确、最全面的攻略数据,从而提升游戏体验,而手游公司也能通过这一技术优化攻略数据的生成和管理,提高用户满意度。

对于手游公司而言,攻略数据的准确性和时效性至关重要,传统的数据检索方法往往存在检索速度慢、准确性不高、无法处理大规模数据等问题,难以满足手游公司对于攻略数据的高效检索需求,而“源”Yuan-EB模型则通过创新的数据重写与合成技术,以及索引技术、样本排序等方法,构建了高质量的微调数据集,有效提升了RAG系统的检索精度和效率。
在数据准备方面,“源”Yuan-EB采取了清洗和筛选“源2.0”微调阶段的问答数据,构建出Question与Corpus数据集,通过“源2.0-M32”大模型对C-MTEB的训练数据进行重写与合成,利用索引技术与排序模型提取出高效率的负样本,形成了大规模的高质量微调数据集,这一过程确保了模型能够在海量文本数据中迅速检索与给定查询最为相关的信息,为手游公司提供了丰富的攻略数据来源。
在微调方法上,“源”Yuan-EB采用了分阶段的训练策略,模型在不同领域(如医疗、新闻、长文本、娱乐等)进行对比学习,通过这一阶段的训练,模型能够学习到不同领域文本的特征和规律,为后续的微调打下坚实基础,再通过“源2.0-M32”生成的合成数据进行进一步微调,这一过程使得模型在处理实际应用中的各种复杂场景时能够展现出出色的表现。
“源”Yuan-EB模型的推出,使得手游公司能够更高效地利用攻略数据,提升用户体验,在手游攻略数据的生成和管理方面,该模型能够显著提高数据检索的准确性和效率,帮助手游公司快速找到最准确、最全面的攻略信息,该模型还支持处理大规模数据,能够应对手游领域日益增长的数据量需求。
“源”Yuan-EB模型还具备强大的泛化能力,由于该模型在训练过程中采用了多个领域的文本数据集进行训练,因此能够很好地适应不同手游的攻略数据需求,无论是角色扮演类游戏、策略类游戏还是射击类游戏,“源”Yuan-EB模型都能够提供准确、高效的攻略数据检索服务。
对于手游玩家而言,“源”Yuan-EB模型的推出同样具有重要意义,玩家可以通过该模型快速找到最准确、最全面的攻略信息,提升自己的游戏技能和体验,该模型还支持多种查询方式,如关键词查询、语义查询等,使得玩家能够根据自己的需求选择最合适的查询方式。
值得一提的是,浪潮信息的元脑企智EPAI平台已经集成了“源”Yuan-EB模型,为手游公司提供了更加便捷、高效的数据检索服务,用户可以在元脑企智EPAI平台中快速使用“源”Yuan-EB模型,并结合EPAI自研的多阶段RAG技术,零代码、低成本地基于企业数据构建大模型知识库应用,这一平台不仅提供了数据准备、模型训练、知识检索等一系列工具,还支持调度多元算力和多模算法,使得手游公司能够在管理、解析和检索攻略数据等方面获得显著的效果提升。
随着“源”Yuan-EB模型的广泛应用,手游行业将迎来一场数据检索技术的革命,手游公司将能够更高效地利用攻略数据,提升用户体验和竞争力;而玩家也将能够享受到更加便捷、准确的游戏攻略服务,我们期待“源”Yuan-EB模型能够在手游领域发挥更大的作用,推动手游行业的持续发展和创新。
参考来源:搜狐网、网易、百家号