idc发布2024大模型评估报告:百度唯一一家7大维度入选优势厂商-pg电子官方网址入口

编辑:三茅网 2024-06-13 10:16 184 阅读

6月12日,国际数据公司idc发布《中国大模型市场主流产品评估,2024》,从基础能力到应用能力7大维度对11家大模型厂商的16款市场主流产品进行实测。

结果显示,百度位于第一梯队,是唯一一家在7大维度上均为优势厂商的企业。

百度旗下生成式产品文心一言和文心一格在问答理解类、推理类、创作表达类、数学类、代码类的基础能力,toc通用场景类、tob特定行业类的应用能力等7大维度均具备领先优势。其他评测厂商中,阿里获6项优势维度,openai gpt-4和商汤分获5项。

idc此次采取实测的方式,成立产品测试团队,通过多个维度对基础大模型及相关产品进行评测,并邀请外部专家团队深入分析各个产品答案准确性、合理性等,在审核委员会的监督下,最终得出各厂商的评估结果,供用户选型参考。

百度、openai、阿里、商汤、科大讯飞、百川、智谱、昆仑万维等11家大模型厂商参与了本次评估。

在基础能力评测中,大模型产品在问答理解类、推理类和创作表达类的成熟度较高。百度文心大模型在当前关注度高的多模态、安全、文本风格迁移等细类评估中表现出色,体现出强大的基础模型能力。在数学类和代码类等考验模型逻辑、推理等能力的评测中,百度文心大模型同样表现优异,体现出强大的体系化思维、逻辑思维和抽象思维能力。在代码类所有6个细分维度中,百度均入围优势厂商。据了解,基于文心大模型百度研制了智能代码助手comate,目前整体采纳率已达46%,新增代码中生成比例已达27%。

应用能力评测主要评估大模型产品在办公工具、生活助手等toc通用场景类和tob特定行业类的表现。评测结果显示,百度文心大模型在搜索、写邮件、文生图表等办公场景和衣食住行、生活服务、闲聊创意等生活助手场景中都具备优势。此外,文心大模型已经在能源、金融、媒体、医疗、通信、制造、交通、互联网等行业形成广泛的落地应用生态,通过大模型解决诸多场景的实际问题。

公开资料显示,2023年10月,文心大模型4.0正式发布,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上明显提升。截至目前,文心一言累计用户规模已达2亿,日均调用量也达到了2亿。

此外报告显示,在行业落地上,百度智能云推出千帆大模型平台,以一站式企业级大模型开发及服务运行平台服务大众。2024年5月底,百度宣布文心大模型的两款主力模型ernie speed、ernie lite免费。截至目前,包括国家电网、浦发银行、中国航天、吉利、长安汽车、泰康保险、tcl、上海辞书出版社、荣耀、三星、蔚来汽车、南方电网、山东港、汽车之家、毕马威等都成为百度文心大模型的用户和pg电子官方网址入口的合作伙伴。文心大模型已经拥有中国最广泛的产业落地规模。

idc认为,从2024年二季度开始,中国市场迎来了一波基础大模型及产品的更新升级,新一轮的“百模大战”一触即发。idc中国大模型产品测试团队表示,2024年产业界更加关注大模型和生成式ai的落地,技术供应商需持续优化生成质量,提高生成速度并降低大模型使用成本,加快大模型技术的应用与普及。

(本文来源快科技,如有侵权请联系删除)

赞同
收藏
考勤/绩效/工资/社保(680份带公式的excel模板),拿走不谢
讲真,很多职场人用了那么多年的excel,依然停留在简单的表格绘制和公式运用上。可能有小伙伴会说,“excel很简单啊,不就是输入数字,然后加减乘除嘛,这是计算器都能完成的工作啊。”这么想就错了!excel里真正...
2024-06-12 14:30
下载app
扫码下载app
三茅公众号
扫码添加公众号
在线咨询
扫码在线咨询
消息
关注
粉丝
正在加载中
猜你感兴趣
换一批
评论和点赞
59452
企业的pg电子最新网站入口的人才理念应该和整体的用人理念有所区别,因为人才和普通劳动力,本身就身就存在质量身就存在质量存在质量
评论和点赞
59452
企业的pg电子最新网站入口的人才理念应该和整体的用人理念有所区别,因为人才和普通劳动力,本身就身就存在质量身就存在质量存在质量
评论和点赞
59452
企业的pg电子最新网站入口的人才理念应该和整体的用人理念有所区别,因为人才和普通劳动力,本身就身就存在质量身就存在质量存在质量
评论和点赞
59452
企业的pg电子最新网站入口的人才理念应该和整体的用人理念有所区别,因为人才和普通劳动力,本身就身就存在质量身就存在质量存在质量
评论和点赞
59452
企业的pg电子最新网站入口的人才理念应该和整体的用人理念有所区别,因为人才和普通劳动力,本身就身就存在质量身就存在质量存在质量
更多
消息免打扰
拉黑
不再接受ta的消息
举报
返回消息中心
暂无权限
成为三茅认证用户,即可使用群发功能~
返回消息中心
群发消息本周还可群发  次
文字消息
图片消息
群发须知:
(1)  一周内可向关注您的人群发2次消息;
(2)  创建群发后,工作人员审核通过后的72小时内,您的粉丝若有登录三茅网页或app,即可接收消息;
(3)  审核过程将冻结1条群发数,通过后正式消耗,未通过审核会自动退回;
(4)  为维护绿色、健康的网络环境,请勿发送骚扰、广告等不良信息,创建申请即代表您同意《发布协议》
本周群发次数不足~
群发记录
暂无记录
多多分享,帮助他人成长,提高自身价值
群发记录
群发文字消息
0/300
群发
取消
提交成功,消息将在审核通过后发送
我知道了
赞同
收藏
您可以向我询问有关该内容的任何信息,或者点击以下选项之一:
三茅网出品,免费使用
复制
全选
总结
解释一下
延展问题
自由提问
2024-06-13 10:16
184 阅读

6月12日,国际数据公司idc发布《中国大模型市场主流产品评估,2024》,从基础能力到应用能力7大维度对11家大模型厂商的16款市场主流产品进行实测。

结果显示,百度位于第一梯队,是唯一一家在7大维度上均为优势厂商的企业。

百度旗下生成式ai产品文心一言和文心一格在问答理解类、推理类、创作表达类、数学类、代码类的基础能力,toc通用场景类、tob特定行业类的应用能力等7大维度均具备领先优势。其他评测厂商中,阿里获6项优势维度,openai gpt-4和商汤分获5项。

idc此次采取实测的方式,成立产品测试团队,通过多个维度对基础大模型及相关产品进行评测,并邀请外部专家团队深入分析各个产品答案准确性、合理性等,在审核委员会的监督下,最终得出各厂商的评估结果,供用户选型参考。

百度、openai、阿里、商汤、科大讯飞、百川、智谱、昆仑万维等11家大模型厂商参与了本次评估。

在基础能力评测中,大模型产品在问答理解类、推理类和创作表达类的成熟度较高。百度文心大模型在当前关注度高的多模态、安全、文本风格迁移等细类评估中表现出色,体现出强大的基础模型能力。在数学类和代码类等考验模型逻辑、推理等能力的评测中,百度文心大模型同样表现优异,体现出强大的体系化思维、逻辑思维和抽象思维能力。在代码类所有6个细分维度中,百度均入围优势厂商。据了解,基于文心大模型百度研制了智能代码助手comate,目前整体采纳率已达46%,新增代码中生成比例已达27%。

应用能力评测主要评估大模型产品在办公工具、生活助手等toc通用场景类和tob特定行业类的表现。评测结果显示,百度文心大模型在搜索、写邮件、文生图表等办公场景和衣食住行、生活服务、闲聊创意等生活助手场景中都具备优势。此外,文心大模型已经在能源、金融、媒体、医疗、通信、制造、交通、互联网等行业形成广泛的落地应用生态,通过大模型解决诸多场景的实际问题。

公开资料显示,2023年10月,文心大模型4.0正式发布,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上明显提升。截至目前,文心一言累计用户规模已达2亿,日均调用量也达到了2亿。

此外报告显示,在行业落地上,百度智能云推出千帆大模型平台,以一站式企业级大模型开发及服务运行平台服务大众。2024年5月底,百度宣布文心大模型的两款主力模型ernie speed、ernie lite免费。截至目前,包括国家电网、浦发银行、中国航天、吉利、长安汽车、泰康保险、tcl、上海辞书出版社、荣耀、三星、蔚来汽车、南方电网、山东港、汽车之家、毕马威等都成为百度文心大模型的用户和pg电子官方网址入口的合作伙伴。文心大模型已经拥有中国最广泛的产业落地规模。

idc认为,从2024年二季度开始,中国市场迎来了一波基础大模型及产品的更新升级,新一轮的“百模大战”一触即发。idc中国大模型产品测试团队表示,2024年产业界更加关注大模型和生成式ai的落地,技术供应商需持续优化生成质量,提高生成速度并降低大模型使用成本,加快大模型技术的应用与普及。

(本文来源快科技,如有侵权请联系删除)

展开全文
顶部
ai赋能,让您的工作更高效
您可以向我询问有关该内容的任何信息,或者点击以下选项之一:
{{item}}
{{copymenutxt}}
您可以向我询问有关该内容的任何信息,或者点击以下选项之一:
{{item}}
{{copymenutxt}}
三茅网出品,免费使用
复制
全选
总结
解释一下
延展问题
自由提问
pg电子官方网址入口
联系pg电子最新网站入口(工作日 09:00-19:00 )
网站地图