登顶C-Eval和CMMLU两大榜单 夸克大模型打造下一代搜索技术新底座
2024-05-31 【 字体:大 中 小 】
近期,互联网公司及手机厂商接连发布自研大模型,权威榜单显示,国产大模型的各项性能再攀高峰。11月16日,记者在C-Eval和CMMLU两大权威评测榜单中发现,夸克大模型成为双榜第一,进一步展现国产大模型在数据精调及模型框架上的能力提升。
作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU 是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,包含67个主题,专门用于评估语言模型在中文语境下的知识和推理能力。
在CMMLU榜单评测中,夸克大模型以平均77.08分的成绩位列总成绩第一,并占据社会科学和其他两个类目的首位。在C-Eval榜单中,夸克大模型平均分达到89分,稳居行业第一,同时在社会科学、人文科学和其他三个类目中位列榜首。
11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型。据介绍,凭借数据、行业、知识正确性、平台等四大优势,夸克大模型应用会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。
据悉,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。夸克将借助自研大模型全面升级,为年轻人工作、学习、生活提供更全面的服务。
(责任编辑:张晓波 )
猜你喜欢
机器人概念股批量涨停!猪肉板块迎久违反弹,放量普涨后这一风险或需留意
466
晨光新材(605399SH):截至2023年12月29日,股东总户数为20635户
1624
俄方沙特阿联酋同时行动,抗美援巴掷地有声,戳中美国软肋不手软
8450
华光新材(688379SH)累计回购128%股份 耗资149943万元
1275
汇丰:印度经济活动强劲,制造业和服务业双双改善
1905
股票百倍杠杆交易平台:高风险、高回报的双刃剑?
328
兴业银锡(000426SZ)控股子公司博盛矿业发生一起安全事故
2356
华龙证券:掘金资本市场的专业指南
9953
嘉兴市区2024年度计划供地64354公顷 其中住宅用地1789公顷
8988
新能源汽车下乡如何从热潮走向高潮?
2116
2025年5月5日全国主要批发市场芒果(红象牙9号)价格行情
金地商置公布将没收仍未领取的2018年度末期股息
转型之年,疫情之后,共探保险产业发展新路口 ——2020(第八届)中国保险产业国际峰会
地方银行哪家强?长三角赚得多,山东后劲足,信贷投放有何侧重
中兴通讯申请通信方法等专利, 提升通信过程中的数据传输效率
余杭十二时令全域户外挑战赛周六百丈首跑_活动_溪口村_登山
内控问题严重, 业绩堪忧, 桂林银行出路在哪里
阳光财险农民工服务案例入选人民网“建设金融强国创新实践案例库”
【新机】vivo史上最强Y系列?Y300GT预热59开售_Pro_机型_官网
为商业卫星量产发动机 国内首条商用电推进智能制造产线投产_成都公司_科技_企业
2025年5月5日全国主要批发市场芒果(红象牙9号)价格行情

金地商置公布将没收仍未领取的2018年度末期股息

转型之年,疫情之后,共探保险产业发展新路口 ——2020(第八届)中国保险产业国际峰会

地方银行哪家强?长三角赚得多,山东后劲足,信贷投放有何侧重

中兴通讯申请通信方法等专利, 提升通信过程中的数据传输效率

余杭十二时令全域户外挑战赛周六百丈首跑_活动_溪口村_登山

内控问题严重, 业绩堪忧, 桂林银行出路在哪里

阳光财险农民工服务案例入选人民网“建设金融强国创新实践案例库”

【新机】vivo史上最强Y系列?Y300GT预热59开售_Pro_机型_官网

为商业卫星量产发动机 国内首条商用电推进智能制造产线投产_成都公司_科技_企业

