星辰语义大模型开源盛典
中国电信于1月10日宣布开源星辰语义大模型TeleChat-7B版本,并慷慨开放1T清洗数据集。即将于1月20日开源12B版本,展示了对开源生态系统的热切渴望。
星辰语义大模型亮点
这一由中电信人工智能科技有限公司打造的大语言模型,经过1.5万亿Tokens的中英文语料训练。其独创的解决方案包括关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力,成功降低了AI大模型的幻觉率40%。
内部应用与外部业务
星辰语义大模型在中国电信内部广泛应用,包括行文写作、代码编程、网络故障分析、经营分析等场景。在外部客户业务中,用于企业经营分析、政务公开咨询、民生诉求接待等,表现出色,多轮理解准确率达到90%。
模型开发与适配
星辰语义大模型已与华为昇腾AI基础软硬件完成适配,支持Atlas 300I pro推理卡和Atlas训练服务器。用户可使用昇思MindSpore和PyTorch框架进行模型训练和推理,展现了其开放、兼容性强的一面。