评测结果,研究院,评测,结果,研究,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

中关村科金1+N新品系列亮相，为企业打造大模型强人工智能应用

...的强劲动力。11月23日，在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的“重构未来产业智能跃迁”2023大模型产业前沿论坛上，中关村科金正式发布...……更多

2023-11-24 09:56:00中关,中关村,人工智能,人工,模型,新品

百度与优必选合作，人形机器人“大脑”有了AI大模型

...首个商业化双足真人尺寸人形机器人。根据2023年人民网研究院发布的《人形机器人技术专利分析报告》统计，优必选在人形机器人有效专利数量上全球第一。优必选表示，AI大模型与人形机器人的结合，不仅能有效推动人形机器...……更多

2024-04-02 11:23:00人形,机器人,大脑,模型,机器,合作

安兔兔评测pc版正式发布，欢迎大家下载体验

兔友们，全新的安兔兔评测PC版已经正式发布了，目前已经在安兔兔官网以及各大渠道上线，欢迎大家下载体验。与Android版本测试流程相似，安兔兔评测PC版测试项目同样包括了CPU、GPU、Memroy（内存和存储）和UX（用户体验）四...……更多

2024-10-04 00:33:00评测,体验,测试,模型,处理,电脑

Bengio团队提出多模态新基准，直指Claude 3.5和

...一致时，就会推翻 “假设”，重新尝试新的假设。人类评测结果人类在 VCR 任务下的水平如何呢？下图中展示了母语者或各语言的流利使用者在英 / 中两种语言的简单 / 困难设定下的准确度：如果考虑包含时间、地名、人名的...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

多样任务真实数据，大模型在线购物基准Shopping MML

谁是在线购物领域最强大模型？也有评测基准了。基于真实在线购物数据，电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的...……更多

2024-11-21 09:45:00在线购物,基准,模型,任务,购物,数据

科大讯飞：打造自主创新的大模型底座，为全球产业链提供更多选择

...于大模型的评测报告——《人工智能大模型体验报告3.0》评测结果显示，由科大讯飞研发的讯飞星火认知大模型获得1775最高分蝉联冠军，并获得基础能力指数、智商指数、工具提效指数三项评测指标第一。在通用人工智能全球...……更多

2023-11-29 10:23:00讯飞,底座,产业链,模型,选择,产业

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品｜搜狐科技作者｜郑松毅2024年已过半，大模型之争热度不减，通往AGI的路究竟该怎么走？近日，清华大学计算机系讲席教授、人工智能研究院基础模...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

2023 CCF国际AIOps挑战赛决赛成功举办

...办；华为技术有限公司、国网宁夏电力有限公司电力科学研究院、软通动力信息技术（集团）股份有限公司特别赞助支持。CCF国际AIOps挑战赛由CCF、清华大学和南开大学自2018年联合发起，旨在借助社区力量，运用人工智能算法解...……更多

2023-12-20 13:45:00挑战赛,决赛,成功,国际,模型,南开大学

人工智能也能“察言观色”

...到位于合肥市高新区的合肥综合性国家科学中心人工智能研究院，在这里人工智能不仅“能听会说”，还能“察言观色”。“当目标人物从镜头前经过，智能心理监护系统V3.0就能通过无感智能情绪识别、生理信号识别、行为动...……更多

2024-01-16 02:05:00人工智能,人工,智能,人工智能,智能,人工

从AI搜索到语音陪练，腾讯元宝全面评测来了！大模型C端玩家谁

《科创板日报》5月31日讯（记者朱凌）直至五月尾声，AI应用市场的火热态势依旧不减。30日，基于混元大模型的AI助手App“腾讯元宝”上线，标志着BAT终于在AI消费C端应用领域聚首。据介绍，自2023年9月首次亮相以来，腾讯混...……更多

2024-05-31 18:07:00腾讯,陪练,元宝,语音,模型,评测

字节开源全栈AI编程基准，不小心曝光豆包代码大模型

...即可轻松部署SandboxFusion，也可直接在GitHub上进行体验。评测结果：解决难题，闭源模型仍优于开源模型发布评测基准及沙盒的同时，研究团队也基于FullStack Bench测评了全球20余款代码大模型及语言大模型的编程表现。模型包括Qwe...……更多

2024-12-06 09:50:00豆包,基准,字节,模型,编程,代码

科学家建立新评价基准，助力评估大模型数据分析能力

...集。虽然这类数据的生成成本较低、人力需求不高，但是评测方法的开发却需要他们逐一校验，因为数据分析的结果并不仅仅依赖于执行的一致性。例如，在生成分类器的问题上，即便参考代码的执行结果和预测代码的结果不一...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

海信电视U8公开评测，这才是高端Mini LED电视该有的画

...细腻。（图片来源：杰夫视点）经中国电子技术标准化研究院赛西实验室评测，海信电视U8系列产品在模拟用户真实的环境光条件下，对比度、峰值亮度、色彩等维度，皆展现了无惧各类光线的出色表现，是目前Mini LED高端电视...……更多

2023-11-29 11:44:00海信,电视,画质,高端,评测,海信

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...OpenAI表示， o1模型在推理能力上相比GPT-4o显著进步。综合评测显示，在绝大多数需要深入思考和复杂推理的任务中，新模型都展现出了明显优于GPT-4o的表现，并在多个细分测试上超过90%。在启用视觉感知能力的情况下，o1模型在M...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

...平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v，仅次于 GPT-4o（69.9）和 Clau...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

享老新举措四川首创省级银发经济产品服务联盟

...，推动银发经济创新发展。同时，西南交大国际老龄科学研究院代表专委会向社会各界发布了《四川省银发经济蓝皮书暨全省适老化产品需求调查结果》，该蓝皮书是全国首个省级银发经济蓝皮书。华西医疗机器人研究院项目总...……更多

2024-07-25 15:12:00银发,四川,产品服务,举措,省级,经济

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

...，另一方面能够直观体现国产大模型的最新发展进程。评测结果显示，文心一言app在智能体能力方面表现突出。在用户创建智能体功能方面，文心一言app支持用户通过上传图片或拍照的方式制作智能体形象，同时支持用户通过...……更多

2024-03-14 17:06:00数据发布,评测报告,中国,评测,智能,报告

AI潮起共筑数智之基

...0+项评测指标、200+项评测场景、100多万专属评测数据集，评测结果客观性跻身国内外主流基准第一阵营。依托自研大模型评测智能体，支持评测数据自学习、用例自编排、执行自适应，同比评测周期缩短90%以上，已服务政府部委...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

阿维塔11荣获IVISTA中国智能汽车指数五星智能评价

...智能星级评价。阿维塔科技供图华龙网发中国汽车工程研究院股份有限公司（简称“中国汽研”）IVISTA中国智能汽车指数评价涵盖智能行车、智能安全、智能泊车、智能交互、智能能效五大评测项目，围绕用户日常用车场景及...……更多

2023-10-26 21:05:00五星,阿维,智能,中国,指数,评价

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...视角视频，时长在20到120分钟之间，涉及77种日常活动。评测结果表示，人类专家水平显著优于目前长上下文多模态模型中最厉害的Gemini Pro 1.5（85.0%对37.3%）。在多模态能力上，大模型们还任重而道远。HourVideo如何炼成？之所以...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

多家券商最新研判：海螺AI爆火，MiniMax商业化进展迅速

...贯性、流畅性等多维度均处于领先地位。中金公司研究部评测结果显示，MiniMax视频模型在长复杂指令遵循、动作物理逻辑及人物表情刻画方面表现亮眼，“在长复杂指令遵循方面，海螺 AI 能够精准地捕捉到逐个关键信息，并按...……更多

2024-11-15 09:59:00海螺,券商,多家,进展,商业,海螺

智谱AI CEO张鹏：智谱AI的GLM-130B是达到世界靠

...至比他们更严重，非常类似。GLM-130B唯一来自亚洲被列入评测的对象张鹏说，2022年我们在训练自己的千亿模型的时候，我们的研发团队、我们的算法工程师甚至是7*24小时的盯着我们的GPU集群，凌晨三点多的故障，我们可以在5分...……更多

2024-03-15 09:40:00张鹏,自主研发,水平,世界,产品,模型

人工智能人才抢夺战一触即发，大模型开发岗位年薪接近百万元

...这样的薪酬水平在IT开发领域是比较靠前的。猎聘大数据研究院发布的《2024年一季度就业大数据洞察报告》显示，一季度AIGC（生成式人工智能）相关职位数同比暴增321.7%，且各年薪段的AIGC相关职位都出现了较大幅度的增长，其...……更多

2024-08-21 09:50:00人工智能,年薪,人工,模型,岗位,智能

自带副驾屏的腾势N7，座舱智能化体验如何？

...和连续对话方面，仍有提升空间。结合基础项体验与体系评测结果来看，腾势N7基础项完成度为75.74%。负责运行腾势Link车机系统的芯片为紫光展锐A7870，非冷启动状态下，系统流畅性、核心应用启动速度、目的地搜索速度和投屏...……更多

2024-05-27 13:50:00座舱,体验,智能,座舱,智能,空调

to B要挣钱、to C要谨慎，李开复的大模型坚持

...依靠他们来实现盈利，短期来看是不切实际的，"瑞达恒研究院经理王清霖告诉北京商报记者，"B端市场为了提高效率、跟上时代步伐、吸引投资人的注意力，可能有一些是相对刚需的购买意愿。如真的能够切入某一类或者某一个...……更多

2024-10-17 09:58:00李开复,模型,模型,李开复,万物,时间差

“全球城市文创指数”发布

...都11月11日电 (曹旭帆)9日，由中国人民大学创意产业技术研究院、文化品牌评测技术文化和旅游部重点实验室联合新华社《中国名牌》杂志社共同研究编制的“全球城市文创指数”(以下简称“指数”)，在第十届成都创意设计周...……更多

2023-11-11 21:08:00指数,城市,全球,创意,城市,文化

RTX3090可跑，360AI团队开源视频模型FancyVi

...置。论文还在 UCF-101 和 MSR-VTT Benchmark 上进行了 Zero-shot 的评测，在衡量生成视频丰富性的 IS 指标和文本一致性的 CLIPSIM 指标均取得了 SOTA 结果。此外，论文还基于 FancyVideo 模型的 T2V 和 I2V 能力分别和前人方法……更多

2024-08-27 09:52:00红衣,大叔,模型,团队,视频,生成

2023年元宇宙创新探索论坛成功召开

...与大数据研究所所长何宝宏公布了元宇宙、内容科技产品评测结果；中国信息通信研究院云计算与大数据研究所内容科技部副主任石霖（主持工作）发布了虚拟时空平台、全景生成平台等元宇宙典型产品评估规范；相关企业代表...……更多

2023-01-17 16:10:00宇宙,成功,论坛,宇宙,研究,中国

AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带

...带宽和更激进的价格才行。下面是最新发布的 MLPerf 基准评测结果：英伟达的 MLPerf 基准评测结果来自英伟达自身，其中也包括使用 Llama 2 70B 模型在单台 Blackwell B200 SXM 上的结果，详情可访问这篇博客：https://blogs.nvidia.com/b……更多

2024-09-05 09:49:00英伟,模型,英伟,内存,推理,性能