虽然小米公司并未曾公布参加 AI 大模型赛道中,不过该公司的 AI 大模型 MiLM-6B 现在已经默默在 C-Eval、CMMLU 大模型评测上榜,截止现在,小米大模型在 C-Eval 总榜单位列第10、同参数量级位居首位。
GitHub 项目页显示小米公司研发的 MiLM-6B 是一个拥有 64亿参数的大型预训练语言模型。
从 C-Eval 的信息来看,MiLM-6B 模型在各科目的具体表现中,在 STEM 领域的全部20个科目中,包括计量师、物理、化学、生物等多个项目中都展现出较高的准确率。
MiLM-6B 模型在许多文科科目中已经显示出相对良好的准确性,然而在法学、数学、编程、概率论、离散数学等需要运用「抽象思维」方面的科目中,还存在一些改进的空间。
10个社会科学测试数据显示,该模型除教育学和地理外的其他8个科目中在准确率方面取得较好成绩。 在人文科学领域的11个科目中,MiLM-6B 模型在「历史与法律」方面的准确率表现也十分出色。
AI 大模型 MiLM-6B 虽然首次现身,但其成熟度已非常高,在未来该模型可能会被用于小米旗下「小爱同学」等虚拟助理服务中。
赞 (0)
打赏
微信扫一扫