登顶C-Eval和CMMLU两大榜单 夸克大模型打造下一代搜索技术新底座
2024-05-31 【 字体:大 中 小 】
近期,互联网公司及手机厂商接连发布自研大模型,权威榜单显示,国产大模型的各项性能再攀高峰。11月16日,记者在C-Eval和CMMLU两大权威评测榜单中发现,夸克大模型成为双榜第一,进一步展现国产大模型在数据精调及模型框架上的能力提升。
作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU 是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,包含67个主题,专门用于评估语言模型在中文语境下的知识和推理能力。
在CMMLU榜单评测中,夸克大模型以平均77.08分的成绩位列总成绩第一,并占据社会科学和其他两个类目的首位。在C-Eval榜单中,夸克大模型平均分达到89分,稳居行业第一,同时在社会科学、人文科学和其他三个类目中位列榜首。
11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型。据介绍,凭借数据、行业、知识正确性、平台等四大优势,夸克大模型应用会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。
据悉,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。夸克将借助自研大模型全面升级,为年轻人工作、学习、生活提供更全面的服务。
(责任编辑:张晓波 )


猜你喜欢

世行:今明两年中东北非地区经济增速回升 地区冲突带来不确定性


库尔德斯坦石油协会否认同意恢复库尔德出口


股票投资哪家可信赖?


7月26日美市支撑阻力:金银原油+美元指数等六大货币对


315汽车消费调查 已还3期贷款却无法提车,运通旗下多家4S店被投诉延迟交付新车


长和(00001)就意大利批发流动及批发固网通讯服务终止成立潜在新公司


AI应用概念强势拉升,鸿博股份4连板,创意信息等涨停


金界传奇:黄金2500先多,反弹2518再空!


配资炒股首选平台:慧眼识珠,稳中求胜!


中国游客刚到马拉西亚第一天,就损失2万多元


【新机】vivo史上最强Y系列?Y300GT预热59开售_Pro_机型_官网


为商业卫星量产发动机 国内首条商用电推进智能制造产线投产_成都公司_科技_企业


黄金时间:2025年 金银铂钯的价格会怎么走?


香港将实施公营医疗服务收费改革:对市民的健康承担不变不减,明白“能者共付”原则


AI应用概念强势拉升,鸿博股份4连板,创意信息等涨停


财经早报:“适时降准降息”中央政治局会议八大看点一次看全,长和出售海外港口,国家市场监管总局表态


利比里亚2024年人均GDP达866452美元


浪潮信息:4月30日获融资买入380亿元,占当日流入资金比例为1888%


促进重点群体就业


邦达亚洲 疲软非农影响发酵 美元指数刷新9周低位

【新机】vivo史上最强Y系列?Y300GT预热59开售_Pro_机型_官网

为商业卫星量产发动机 国内首条商用电推进智能制造产线投产_成都公司_科技_企业

黄金时间:2025年 金银铂钯的价格会怎么走?

香港将实施公营医疗服务收费改革:对市民的健康承担不变不减,明白“能者共付”原则

AI应用概念强势拉升,鸿博股份4连板,创意信息等涨停

财经早报:“适时降准降息”中央政治局会议八大看点一次看全,长和出售海外港口,国家市场监管总局表态

利比里亚2024年人均GDP达866452美元

浪潮信息:4月30日获融资买入380亿元,占当日流入资金比例为1888%

促进重点群体就业

邦达亚洲 疲软非农影响发酵 美元指数刷新9周低位
