新闻资讯

你的位置:欧洲杯下单平台(官方)APP下载IOS/安卓通用版/手机版 > 新闻资讯 > 多位资深分析师实测16家大模子:用AI写研报,曾做贸易汤日日新最佳用!

多位资深分析师实测16家大模子:用AI写研报,曾做贸易汤日日新最佳用!

发布日期:2024-09-03 11:05    点击次数:94

日前,巨擘推敲机构弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)邻推敲豹推敲院发布《2024年中国大模子行研智商年中评测》,死一火涌现:在16个主流大模子中,商汤“日日新”以8.923分(总分)再度位列榜首,并在陈述撰写和基础智商两大子榜中名递次一。

相较于《2023年中国大模子行研智商评测陈述》,这次参与评测的主流大模子从12家增至16家,在保合手三大智商维度(陈述撰写、行业贯通、基础智商)的基础上,测试题目从1800谈增至3540谈,商汤“日日新“在蝉联第一的同期,总分从7.73擢升到8.923。

20+资深分析师参与打分:泛泛使用大模子办公,也曾日日新撰写陈述最佳用

值得小心的是,本次大模子行研智商测试遮掩了3540谈题目,由20位资深推敲分析师和10个中外裁判大模子共同参与评测。

这些分析师大多领有跨越16个月的使用大模子进行泛泛办公的劝诫,在评测中,陈述撰写这一中枢智商维度就遮掩了20篇不同业业陈述撰写,涵盖分析师长久追踪陈述问题累积超3000谈题。

在“陈述撰写”智商(遮掩8个子智商模块)中,商汤“日日新”名递次一,充分体现办公内容诳骗场景中的最初性。

沙利文及头豹行企推敲的8-D模块化大模子发问框架已滚动为一个评估器用,通过对十六个模子的定向发问,深入考试并评估模子陈述的撰写质料与有用性。

图:大模子陈述撰写智商评测总榜TOP5

沙利文合计,位列第一的商汤“日日新”在推敲陈述内容质料空洞产出优秀,大模子具备从基础信息中索要出深层逻辑干系的开阔智商。

其中,商汤“日日新”在逻辑推理层的三个细分维度中发扬最为越过:

产业链分析:行动高阶难度撰写模块,成绩于其优秀的学问储备智商以及逻辑推理归纳智商,“日日新”在这一模块发扬优秀;

特征分析:这一模块挑战在于空洞贬责海量数据、索要具有深度的代表性见识以及展现独创性,“日日新”在此模块中发扬优异;

竞争式样:这是最具挑战性的模块之一,挑战在于准确筛选行业参与者,并归纳推演阛阓竞争态势的酿成原因及过去趋势,“日日新”在企业筛选以及过去变化推演智商较强。

商汤“日日新”加合手基础智商,为千行百业推敲注入“新质坐蓐力”

同期,大模子优秀的基础智商简略显耀擢升分析师在研报撰写流程中使用模子的畅达性,并增多其使用粘性。

在“行研基础”智商板块的发扬中,商汤“日日新”空洞发扬第一。

图:大模子基础智商评测总榜TOP5

这成绩于商汤“日日新”大模子体系的合手续迭代和智商维度的长久栽培。自前年4月初度发布,商汤“日日新SenseNova”大模子体系已郑重推出多个大版块迭代。在本年7月“日日新5.5”体系迎来多项升级,空洞性能较“日日新5.0”平均擢升30%,在数学推理、英文智商和教唆奴才等智商较着增强,交互遵循和多项中枢盘算已毕对标GPT-4o。

通过握住地试验与落地,商汤“日日新”也对九行八业中进行了深入的行业积存,这为其提供了行业深度细察与贯通智商。在沙利文陈述中,商汤“日日新”在“行业贯通”智商也发扬越过。

商汤“日日新”在靠近各行业下的趋势研判、信息归纳和阛阓通晓方面发扬了较强的智商,其中在电商零卖业、电信业、泛文娱业、房地产业、西宾业、输送业、制造业这些短处规模名递次一。

办公与内容创作是当下大模子最火热的诳骗场景,何况亦然简略凯旋体现大模子坐蓐力水平的智商,商汤“日日新”这次蝉联第一,恰是为行研规模提供“新质坐蓐力”。过去,商汤科技还将握住把大模子的智商调度为在九行八业的内容落地,鼓舞生成式AI的规模化诳骗。