• 我的订阅
  • 头条热搜
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
...的强劲动力。11月23日,在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的“重构未来 产业智能跃迁”2023大模型产业前沿论坛上,中关村科金正式发布...……更多
百度与优必选合作,人形机器人“大脑”有了AI大模型
...首个商业化双足真人尺寸人形机器人。根据2023年人民网研究院发布的《人形机器人技术专利分析报告》统计,优必选在人形机器人有效专利数量上全球第一。优必选表示,AI大模型与人形机器人的结合,不仅能有效推动人形机器...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
兔友们,全新的安兔兔评测PC版已经正式发布了,目前已经在安兔兔官网以及各大渠道上线,欢迎大家下载体验。与Android版本测试流程相似,安兔兔评测PC版测试项目同样包括了CPU、GPU、Memroy(内存和存储)和UX(用户体验)四...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...一致时,就会推翻 “假设”,重新尝试新的假设。 人类评测结果人类在 VCR 任务下的水平如何呢?下图中展示了母语者或各语言的流利使用者在英 / 中两种语言的简单 / 困难设定下的准确度:如果考虑包含时间、地名、人名的...……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
谁是在线购物领域最强大模型?也有评测基准了。基于真实在线购物数据,电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的...……更多
科大讯飞:打造自主创新的大模型底座,为全球产业链提供更多选择
...于大模型的评测报告——《人工智能大模型体验报告3.0》评测结果显示,由科大讯飞研发的讯飞星火认知大模型获得1775最高分蝉联冠军,并获得基础能力指数、智商指数、工具提效指数三项评测指标第一。 在通用人工智能全球...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
2023 CCF国际AIOps挑战赛决赛成功举办
...办;华为技术有限公司、国网宁夏电力有限公司电力科学研究院、软通动力信息技术(集团)股份有限公司特别赞助支持。CCF国际AIOps挑战赛由CCF、清华大学和南开大学自2018年联合发起,旨在借助社区力量,运用人工智能算法解...……更多
...到位于合肥市高新区的合肥综合性国家科学中心人工智能研究院,在这里人工智能不仅“能听会说”,还能“察言观色”。“当目标人物从镜头前经过,智能心理监护系统V3.0就能通过无感智能情绪识别、生理信号识别、行为动...……更多
从AI搜索到语音陪练,腾讯元宝全面评测来了!大模型C端玩家谁更胜一筹?
《科创板日报》5月31日讯(记者 朱凌)直至五月尾声,AI应用市场的火热态势依旧不减。30日,基于混元大模型的AI助手App“腾讯元宝”上线,标志着BAT终于在AI消费C端应用领域聚首。据介绍,自2023年9月首次亮相以来,腾讯混...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
...即可轻松部署SandboxFusion,也可直接在GitHub上进行体验。评测结果:解决难题,闭源模型仍优于开源模型发布评测基准及沙盒的同时,研究团队也基于FullStack Bench测评了全球20余款代码大模型及语言大模型的编程表现。模型包括Qwe...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...集。虽然这类数据的生成成本较低、人力需求不高,但是评测方法的开发却需要他们逐一校验,因为数据分析的结果并不仅仅依赖于执行的一致性。例如,在生成分类器的问题上,即便参考代码的执行结果和预测代码的结果不一...……更多
海信电视U8公开评测,这才是高端Mini LED电视该有的画质
...细腻。 (图片来源:杰夫视点)经中国电子技术标准化研究院赛西实验室评测,海信电视U8系列产品在模拟用户真实的环境光条件下,对比度、峰值亮度、色彩等维度,皆展现了无惧各类光线的出色表现,是目前Mini LED高端电视...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...OpenAI表示, o1模型在推理能力上相比GPT-4o显著进步。综合评测显示,在绝大多数需要深入思考和复杂推理的任务中,新模型都展现出了明显优于GPT-4o的表现,并在多个细分测试上超过90%。在启用视觉感知能力的情况下,o1模型在M...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v,仅次于 GPT-4o(69.9)和 Clau...……更多
享老新举措 四川首创省级银发经济产品服务联盟
...,推动银发经济创新发展。同时,西南交大国际老龄科学研究院代表专委会向社会各界发布了《四川省银发经济蓝皮书暨全省适老化产品需求调查结果》,该蓝皮书是全国首个省级银发经济蓝皮书。华西医疗机器人研究院项目总...……更多
月狐数据发布中国市场首份《AIGC应用app智能化评测报告》
...,另一方面能够直观体现国产大模型的最新发展进程。 评测结果显示,文心一言app在智能体能力方面表现突出。在用户创建智能体功能方面,文心一言app支持用户通过上传图片或拍照的方式制作智能体形象,同时支持用户通过...……更多
AI潮起 共筑数智之基
...0+项评测指标、200+项评测场景、100多万专属评测数据集,评测结果客观性跻身国内外主流基准第一阵营。依托自研大模型评测智能体,支持评测数据自学习、用例自编排、执行自适应,同比评测周期缩短90%以上,已服务政府部委...……更多
阿维塔11荣获IVISTA中国智能汽车指数五星智能评价
...智能星级评价。 阿维塔科技供图 华龙网发中国汽车工程研究院股份有限公司(简称“中国汽研”)IVISTA中国智能汽车指数评价涵盖智能行车、智能安全、智能泊车、智能交互、智能能效五大评测项目,围绕用户日常用车场景及...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...视角视频,时长在20到120分钟之间,涉及77种日常活动。评测结果表示,人类专家水平显著优于目前长上下文多模态模型中最厉害的Gemini Pro 1.5(85.0%对37.3%)。在多模态能力上,大模型们还任重而道远。HourVideo如何炼成? 之所以...……更多
多家券商最新研判:海螺AI爆火,MiniMax商业化进展迅速
...贯性、流畅性等多维度均处于领先地位。中金公司研究部评测结果显示,MiniMax视频模型在长复杂指令遵循、动作物理逻辑及人物表情刻画方面表现亮眼,“在长复杂指令遵循方面,海螺 AI 能够精准地捕捉到逐个关键信息,并按...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...至比他们更严重,非常类似。GLM-130B唯一来自亚洲被列入评测的对象张鹏说,2022年我们在训练自己的千亿模型的时候,我们的研发团队、我们的算法工程师甚至是7*24小时的盯着我们的GPU集群,凌晨三点多的故障,我们可以在5分...……更多
人工智能人才抢夺战一触即发,大模型开发岗位年薪接近百万元
...这样的薪酬水平在IT开发领域是比较靠前的。猎聘大数据研究院发布的《2024年一季度就业大数据洞察报告》显示,一季度AIGC(生成式人工智能)相关职位数同比暴增321.7%,且各年薪段的AIGC相关职位都出现了较大幅度的增长,其...……更多
自带副驾屏的腾势N7,座舱智能化体验如何?
...和连续对话方面,仍有提升空间。结合基础项体验与体系评测结果来看,腾势N7基础项完成度为75.74%。负责运行腾势Link车机系统的芯片为 紫光展锐A7870,非冷启动状态下,系统流畅性、核心应用启动速度、目的地搜索速度和投屏...……更多
to B要挣钱、to C要谨慎,李开复的大模型坚持
...依靠他们来实现盈利,短期来看是不切实际的,"瑞达恒研究院经理王清霖告诉北京商报记者,"B端市场为了提高效率、跟上时代步伐、吸引投资人的注意力,可能有一些是相对刚需的购买意愿。如真的能够切入某一类或者某一个...……更多
...都11月11日电 (曹旭帆)9日,由中国人民大学创意产业技术研究院、文化品牌评测技术文化和旅游部重点实验室联合新华社《中国名牌》杂志社共同研究编制的“全球城市文创指数”(以下简称“指数”),在第十届成都创意设计周...……更多
RTX3090可跑,360AI团队开源视频模型FancyVideo,红衣大叔都说好
...置。论文还在 UCF-101 和 MSR-VTT Benchmark 上进行了 Zero-shot 的评测,在衡量生成视频丰富性的 IS 指标和文本一致性的 CLIPSIM 指标均取得了 SOTA 结果。 此外,论文还基于 FancyVideo 模型的 T2V 和 I2V 能力分别和前人方法……更多
...与大数据研究所所长何宝宏公布了元宇宙、内容科技产品评测结果;中国信息通信研究院云计算与大数据研究所内容科技部副主任石霖(主持工作)发布了虚拟时空平台、全景生成平台等元宇宙典型产品评估规范;相关企业代表...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...带宽和更激进的价格才行。下面是最新发布的 MLPerf 基准评测结果:英伟达的 MLPerf 基准评测结果来自英伟达自身,其中也包括使用 Llama 2 70B 模型在单台 Blackwell B200 SXM 上的结果,详情可访问这篇博客:https://blogs.nvidia.com/b……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...团队观察到,虽然重复采样和思路搜索能成功地提升基准评测的结果。但在很多案例中,多次提示(pass@k)(即使在温度设置很高)只会导致输出代码发生很小的变化,这些变化只会改变一些小方面,但无法改善思路中的缺陷。...……更多
更多关于科技的资讯:
参半出席中国口腔新健康行动“全国爱牙日”活动 共筑国民口腔健康防护基石
9月19日,“中国口腔新健康行动・2025年全国爱牙日”活动在人民网演播厅举办。活动现场,中国口腔清洁护理用品工业协会
2025-09-22 11:44:00
CICAS组委会联合知乎开启第三届全国人工智能应用场景创新挑战赛AGI专项赛
9月20日,以“AI之下,科技重构”为主题的知乎首届TechClub新知科技大会在杭州拉开帷幕。学界专家、企业高管、AI开发者
2025-09-22 11:52:00
于都“织”出老区振兴新图景
本报讯 (全媒体记者李思成) 9月的赣南大地,秋意正浓。近日,记者随“高质量发展中国行·焕新江西”专题活动采访团一行走进赣州市于都县
2025-09-22 07:15:00
近日从太钢获悉,太钢供应用于国家能源局首台(套)重大技术装备项目——扎拉水电站的900兆帕超高强磁轭钢顺利通过叠检试验
2025-09-22 07:26:00
南京微短剧有流量更有“料”
微短剧《平凡警事》海报。微短剧《金箔奇缘》海报。百川短剧剧组在拍摄现场。 中国(南京)游戏谷。□芮天舒韶静王懿闫葛菲地铁里
2025-09-22 07:40:00
为什么越来越多的女生,恋爱前要交换体检报告?
“亲亲许可证”在即将接上吻的那一刻,女友的脑袋往后一躲,闪开了。紧接着,她抬起头,认真地盯着老王,问他,“你有没有幽门螺旋杆菌
2025-09-22 00:56:00
河北日报讯(见习记者康晓博)AI工业内窥镜、无针注射笔、分布式储能路灯、风滚草仿生播种机器人……9月20日,2025河北国际工业设计周活动开幕
2025-09-21 08:12:00
厦门网讯(厦门日报记者 林钦圣 通讯员 江安娜 徐燕) 最近,不少厦门市民都注意到这样一个现象:上班高峰期,正当大家为等候BRT快速公交车而焦急时
2025-09-21 09:00:00
乐陵杨安镇香辛料数智化交易平台正式启动
9月20日,乐陵市杨安镇以“智链未来・香聚全球”为主题的香辛料数智化交易平台启动仪式暨黄河商品交易市场香辛料品种上线仪式隆重举行
2025-09-21 09:25:00
现场签约金额达115亿元!中国制造业民营企业合作交流对接会聚焦“AI+”
大皖新闻讯 9月20日,2025世界制造业大会中国制造业民营企业合作交流对接会在合肥举行。活动现场签约项目10个,总额115
2025-09-21 10:14:00
留交会上首次设立“新招引企业专区”,200多个岗位虚席以待——这里有一份令人“新”动的邀约□南京日报/紫金山新闻记者张甜甜在9月20日举行的留交会现场
2025-09-21 10:24:00
“+”上去,活下来——2025世界制造业大会采访引发的思考
大河网讯 9月20日,2025世界制造业大会在安徽合肥开幕。河南省作为主宾省参会,30家企业参展。在人们的印象中,河南农业可圈可点
2025-09-21 14:48:00
十堰成功举办2025新能源汽车零部件交易会项目路演 十大前沿技术项目集中亮相
十堰广电讯(全媒体记者 耿吉国 通讯员 刘爱理)9月21日上午,2025新能源汽车零部件交易会项目路演活动在十堰国际会展中心成功举办
2025-09-21 15:32:00
河北新闻网讯(王丽英)近日,宁晋县晶龙餐饮管理总公司凭借市场化转型与外向型发展战略的深入实施,成功签约宁晋县产融区学生食堂
2025-09-21 15:53:00
中新经纬9月20日电 题:L2新国标将给智能驾驶立“铁律”作者 江瀚 盘古智库高级研究员智能网联汽车组合驾驶辅助系统或将迎来国家标准
2025-09-21 19:36:00