4月23日消息,由清华大学基础模型研究中心最新发布的2024年3月版《SuperBench大模型综合能力评测报告》中,共涵盖了14个具有海内外影响力的模型。
在此次评测中,文心4.0的表现令人瞩目,其性能接近国际顶级模型,且与顶尖模型的差距正在逐步缩小,堪称国内领先模型。
清华权威报告:文心一言4.0多项指标遥遥领先
例如,在人类对齐能力的评测中,文心4.0以卓越的表现位居国内首位。
在中文推理和中文语言的评测中,文心4.0遥遥领先,与其他模型相比,差距明显。在中文理解上,文心4.0的领先优势尤其突出,比第二名的GLM-4高出0.41分。
在语义理解的数学能力评测中,文心4.0与Claude-3并列全球第一,而GPT-4系列模型则位列第四和第五,其他模型的得分主要集中在55分左右,显著落后于领先群体。
在阅读理解能力的评测中,文心4.0超越了GPT-4 Turbo、Claude-3以及GLM-4,取得了最高的成绩。
在企业最关注的安全性评测中,文心4.0同样表现出色,力压国际一流的GPT-4系列模型和Claude-3,获得了最高分(89.1分),而Claude-3仅位列第四。
数据还显示,自去年3月16日文心一言首次亮相以来,用户数量已经突破了2亿,每天的API调用量也超过了2亿次。
免责声明:凡本网注明“来源:XXX(非本网)”的作品均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。
4月23日消息,由清华大学基础模型研究中心最新发布的2024年3月版《SuperBench大模型综合...
2024年3月19日,2024智能家居UP峰会CSHIA智能家居开年盛典成功举行。小度科技智能生态业...
在举办的第六届世界声博会暨2023科大讯飞全球1024开发者节上,科大讯飞宣布,基于昇腾生态的“飞星...
10月9日消息,目前,国内有多家科技大厂陆续发布自家大模型,被业内看作为AI大模型百“模”大战已经打...
最近,“百模大战”迎来了第一次专业会考,可以看作是各个大模型实力检验的“期中考试”。权威IT市场研究...
6月26日,据CNMO了解,百度创始人、董事长兼首席执行官李彦宏在“世界互联网大会数字文明尼山对话”...
本周已有 568 人提交加盟信息
互联互通美好愿景如何实现 ——智能家居市场质量观察系列报道之二
万佳安携多款智能产品亮相2024深圳国际礼品展
盛装启程 | 夜色空间·桐乡店邀卿共赴一场声光影之旅
Smart PLC案例 | 广州天河智谷第一实验学校:智能校园真正需要智能的是什么?
浙江华为全屋智能产业峰会圆满落幕,全力推进居家AI康养、智能化与数字化的未来家体验!
犀云官网2.0版本亮相,展现前沿创新与服务升级
王力30亿 坚朗78亿 顶固12亿 萤石48亿 ……2023哪家门业、 智能锁相关企业财报最亮眼?
迈睿科技新一代PIR移动传感器,支持高空/低空安装
【方案•定制影院+KTV】英嘉尼总部7.2.4全景声影院+4.1KTV影音室展厅全面升级!
米家多品全新升级上市,引领舒适照明新开始
智家网客服中心竭诚为您服务