• 我的订阅
  • 头条热搜
谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o
...放出最强端侧 Gemma 2 2B 小模型后,刚刚,Gemini 1.5 Pro 实验版本 (0801) 已经推出。用户可以通过 Google AI Studio 和 Gemini API 进行测试和反馈。既然免费,那我们帮大家测试一下最近比较火的比大小问题。当我们问 Gemini 1.5 P……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...据的时效性。目前已有UDK-VQA-240401-30、UDK-VQA-240816-20两个版本的数据集,涉及到的时间跨度分别是2024年4月1日-2024年4月31日和2024年8月16日-2024年9月5日。研究者在超过15个开源、闭源模型上进行了实验,包括GPT-4o、Gemini 1……更多
ai实验室阿里通义将推出创新视频生成大模型
...次。回顾今年5月,在阿里云AI智领者峰会上,通义千问2.5版本正式发布,同时,其1100亿参数的开源模型在多个基准测试中表现优异。会上还宣布了原通义千问APP更名为“通义APP”,旨在整合通义大模型的全栈能力,向所有用户...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...Meta官方正式发布了Llama3.1模型。本次Llama3.1模型共有三个版本,分别是8B、70B和405B。从基准测试结果来看,超大杯Llama3.1405B与OpenAI的GPT-4o和Claude3.5Sonnet在多个项目上能够媲美。在GSM8K任务中,Llama3.1405B得分9……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...完成了。他称,在大约 6 次提示后,o1 便创建了一个运行版本的 Python 代码,描述出研究论文「方法」部分的内容。虽然 AI 生成的代码框架,模拟了 Kabasares 实际代码功能,但它使用的是「合成数据」,并非真实的天文数据。论...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...的结果,测试领域包括 Blocksworld 和 Mystery Blocksworld(混淆版本),其中前者是在 600 个 3 到 5 个 blockBlocksworld问题静态测试集上运行的结果,后者是在 600 个语义相同但语法混淆的实例(称之为 Mystery Blocksworl……更多
MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来,双方将携手打造面向应用开发者和终端设备厂商的生成式AI软...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...升模型性能。性能评估使用lm-evaluation-harness包对新排行榜版本的所有基准测试进行模型评估,然后使用HuggingFace分数归一化处理评估结果。如下图所示,Falcon Mamba 7B获得15.04的均分,超过Llama 3.1 8B 13.41分和Mistral 7B ……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...的几K几十K,发展到了如今的百万token级别。Gemini的最新版本可以接收200万个token作为上下文。这大概相当于140万个单词、2小时视频或者22小时的音频。但不知诸位平时用得着这么长的上下文吗?毕竟100K已经相当于一部比较长的...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...模型训练和部署方案。据智谱AI CEO张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。△在最新AgentBench上,ChatGLM3-turbo版本的Agent能力智……更多
类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
...两者之间的关系「划上了不等号」。 该团队通过大规模实验发现 ——即便依照 Scaling Law 扩大模型参数与训练数据量,模型依然无法抽象出一般物理规则,甚至连牛顿第一定律、抛物线运动都无法领会。「视频生成模型目前就...……更多
三星990 EVO AI应用体验
...能效。 在存储颗粒方面,三星990EVO搭载了经过改良的V6版本TLCNAND存储颗粒。单颗颗粒为1TB,高密度设计不仅提升了整体存储效率,还增强了数据的可靠性和耐久性。性能测试中,CrystalDiskMark空盘1GiBSeqQ8T1读写速度分别达到5081.52M...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...苹果发布iOS 18.1开发者测试版,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能:1、Siri升级。Siri唤醒后具备屏幕边缘发光特效,能理解用户表述不通顺的指...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者来自清华大...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...官方博客显示,ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重,但仅限于非商业用途。仓库地址:https://huggingface.co/EvolutionaryScale/esm3-sm-open-v1/tree/main此外,ESM3与不同于模拟多种生物分子的……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...开发者可以通过 Google AI Studio 和 Gemini API免费访问。聊天版本还得再等等。不过也有网友发现了华点,虽然数学能力很强,但还是没有打败o1-mini以及o1完整版(94.8)。谷歌Gemini 1.5大升级此次更新的有两个型号:Gemini-1.5-Pro-002和G……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...准测试上进行训练,因为无法确定这就是用于训练该特定版本模型的数据集。 项目地址:https://github.com/lm-sys/llm-decontaminator随后,他又进行了另一个测试——对于基准测试集中的每个问题,将问题字符串分成两半,然后在温度...……更多
StableDiffusion原班人马新公司官宣!连发新模型刷新AI绘画格局
...黑森林团队正缓步提升API中FLUX.1 [pro]的推理计算能力。此版本可以通过Replicate和fal.ai访问;提供专用和定制的企业解决方案。 FLUX.1 [dev]:系列中杯。一个允许非商业途径使用的模型,开放权重、经过蒸馏。[dev] 直接从[pro] 中蒸...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...新了性能和服务成本的新标准。特别是在 MMLU 上,预训练版本实现了 84.0% 的准确率。代码与推理Mistral AI 基于此前 Codestral 22B 和 Codestral Mamba 的经验,在很大一部分代码上训练了 Mistral Large 2。Mistral Large 2……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
...领先。值得一提的是,本次MLPerf存储基准测试已升级至1.0版本,这一升级提出了哪些新的要求,浪潮信息又是如何凭借其技术积淀与整体解决方案,获得新版测试中的多项最佳成绩的呢? 一、MLPerf测试迎升级,存储助力AI算天...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预...……更多
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;
...项目,可以实现图片、视频和直播的实时换脸。最新1.3.1版本更新提升了性能,速度,用户界面,并引入了高性能版本和面部增强技术。 聚焦开发者微软研究员推LoRAShear技术:高效对大语言模型结构化剪枝微软的LoRAShear技术旨在...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...E)相同,由于图像是二维的特征,所以研究人员探索了2D版本的RoPE:「插值-PE」(interpolating-PE)方法不管序列长度如何,保持起始和结束位置ID固定后,在中间插值位置ID,不过该方法在训练分辨率上严重过拟合,并且无法泛化...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...前的大模型和各种方法无论是在文本、视频、还是多模态版本的 MMToM-QA 上都表现较差,而 BIP-ALM 则展现了较好的结果。论文作者认为 BIP-ALM 得益于:(1)使用适用于不同模态信息的符号表示,(2)模仿人类心智推理的逆向规划方法...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
..._rephrase = M(P_system, P_eg, D_task, T)生成,其中M是ChatGPT的GPT-4o版本。图5(上)详细说明了P_system和P_eg的内容,以ScanRefer数据为例。通过使用sentence=和rephrase=的结构化提示,GPT-4o能够轻松遵……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...的时间内,北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B,表现出了比 Meta 微调的 Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...3)和GPT-4o mini,Claude 3.5 Sonnet,以及Gemini 1.5 Pro(0801和0523版本),代表了多模态模型能力的最前沿。2. 开源模型:InternVL2(8B、40B和Llama3-76B版本)、LLaVA(OneVision-7B……更多
视频生成大模型sora和可灵的区别在哪里?
...差。值得注意的是,上述可灵视频由记者测试生成,不同版本视频可能存在差异。而目前Sora仍未开放,所生成视频均为官方发布的版本,待Sora开放测试后,用户实际测试效果或许与官方发布视频也有差异。 可灵整体框架采用...……更多
英特尔Arc A770 Photon新老驱动对比
...0版驱动更新,可以说非常的“勤奋”,在今年2月份的4091版本上,DX9游戏相比于最开始获得了平均超40%的提升,在8月份的4644版本驱动上,则大幅提升了DX11游戏性能表现,并且在后续版本上持续进行优化。英特尔一直履行着当初...……更多
更多关于科技的资讯:
茶酒融合催生“微醺”新赛道,新茶饮品牌争饮“昼夜”经济
当白天的提神茶饮与夜晚的放松酒品打破边界,正催生出国内消费市场一股新的“微醺”风潮。近期,茶百道经典白酒奶茶回归即创下销量佳绩
2025-10-14 11:33:00
嘎子谢孟伟被执行超1400万,已被限高,此前因穿警服带货被行拘7日
近日,因穿警服直播带货被行政拘留、账号遭封禁的嘎子谢孟伟发视频称 “我回来了”,并向所有观众诚恳道歉。视频中,其透露公司员工已被安排回老家
2025-10-14 11:33:00
平谷将打造全国农业科创中心
原标题:世界农业科创大会开幕 农业中关村核心区2.0发布平谷将打造全国农业科创中心本报讯(记者 赵婷婷)昨天,2025世界农业科技创新大会(WAFI)在北京平谷开幕
2025-10-14 11:59:00
据大象新闻报道,近期蜜雪冰城的小票成了年轻人追捧的“追更凭证”,其上连载着名为《雪王在古代卖咖啡》的小说,20个章节随机印在消费小票上
2025-10-14 12:10:00
电通创意发布《2025首席营销官报告》:算法与人性的重构力量
AI时代,品牌的长期价值回归于人性与文化共鸣,人类的创造力、同理心与文化相关性愈加重要。•AI已成日常:几乎所有CMO都在使用AI
2025-10-14 13:29:00
近日,一则“美团外卖骑手能屏蔽顾客”的消息在网络上引发热议。据媒体报道,美团已在福建晋江、浙江绍兴等七个城市试点上线骑手评价用户和屏蔽用户功能
2025-10-14 13:40:00
这座产业园一年制造千万颗球胆、百万颗整球——沂南县“造球记”
齐鲁晚报·齐鲁壹点 记者 公绪成 李其峰 通讯员 陈婉塑炼、分切、热压......沂南县泽辉体育产业园内,工人们正紧忙制作新一批篮球内胆10月9日
2025-10-14 15:00:00
在数字经济奔涌向前的浪潮中,VR正加速与新一代信息技术融合,不断催生新的应用场景。紧抓发展机遇,江西移动聚焦VR产业发展的核心问题
2025-10-14 16:02:00
行业首个!海尔智家牵头制定《智能门锁安装和售后服务要求》
据洛图科技数据显示,2025年上半年,中国智能门锁市场全渠道销量达到897万套,同比增长6.8%。面对日益增长的智能安防需求
2025-10-14 16:14:00
蜜雪冰城卖啤酒,5.9元一杯冲上热搜!网友:期待雪王啤酒了
10月14日,蜜雪冰城啤酒5.9元一杯冲上微博热搜榜。10月1日,蜜雪集团在港交所发布的公告显示,蜜雪冰城以2.856亿元增资认购鲜啤福鹿家新增注册资本
2025-10-14 16:40:00
【宅男财经|专家面对面】据媒体报道,近日,有网友在社交媒体发帖称,美团外卖骑手能屏蔽顾客了。相关页面信息显示,目前已在晋江
2025-10-14 17:08:00
华为、OPPO等国内厂商也将陆续上市eSIM手机
日前,苹果宣布iPhoneAir国行版将于10月17日早9点预购,10月22日正式发售。随后,中国移动、中国联通、中国电信三大运营商相继宣布
2025-10-14 17:49:00
无人驾驶获《时代》2025最佳发明奖:萝卜快跑、谷歌、特斯拉“三大家”全球竞速
中国青年报客户端讯(中青报·中青网记者 王军利)近日,《时代》公布2025年最佳发明榜单,无人驾驶技术赫然在列。作为人工智能在物理世界的典型应用
2025-10-14 22:56:00
两个月融资近7亿元 零重力飞机工业A轮融资收官
大皖新闻讯 10月14日,总部位于合肥的零重力飞机工业(合肥)有限公司(以下简称“零重力飞机工业”)正式宣布完成A++++轮融资
2025-10-14 18:42:00
大皖新闻讯 10月14日,记者获悉,第138届中国进出口商品交易会(广交会)将于10月15日至11月4日在广州举办。本届广交会展览面积达155万平方米
2025-10-14 18:44:00