• 我的订阅
  • 头条热搜
谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o
...放出最强端侧 Gemma 2 2B 小模型后,刚刚,Gemini 1.5 Pro 实验版本 (0801) 已经推出。用户可以通过 Google AI Studio 和 Gemini API 进行测试和反馈。既然免费,那我们帮大家测试一下最近比较火的比大小问题。当我们问 Gemini 1.5 P……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...据的时效性。目前已有UDK-VQA-240401-30、UDK-VQA-240816-20两个版本的数据集,涉及到的时间跨度分别是2024年4月1日-2024年4月31日和2024年8月16日-2024年9月5日。研究者在超过15个开源、闭源模型上进行了实验,包括GPT-4o、Gemini 1……更多
ai实验室阿里通义将推出创新视频生成大模型
...次。回顾今年5月,在阿里云AI智领者峰会上,通义千问2.5版本正式发布,同时,其1100亿参数的开源模型在多个基准测试中表现优异。会上还宣布了原通义千问APP更名为“通义APP”,旨在整合通义大模型的全栈能力,向所有用户...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...Meta官方正式发布了Llama3.1模型。本次Llama3.1模型共有三个版本,分别是8B、70B和405B。从基准测试结果来看,超大杯Llama3.1405B与OpenAI的GPT-4o和Claude3.5Sonnet在多个项目上能够媲美。在GSM8K任务中,Llama3.1405B得分9……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。在最近关于「Scaling Law 是否撞墙」的讨论中,...……更多
复旦MOSS大模型开源了!Github和Hugging Face同时上线
...程,也能生成图片据了解,这次MOSS开源的是第三轮迭代版本,名叫MOSS 003。当然,MOSS 003也并非开源了全部模型,目前主要开放的是基座预训练模型,最终模型即将在近期开源:此前,MOSS已经经历了两版迭代,一版是公开邀请内...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...完成了。他称,在大约 6 次提示后,o1 便创建了一个运行版本的 Python 代码,描述出研究论文「方法」部分的内容。虽然 AI 生成的代码框架,模拟了 Kabasares 实际代码功能,但它使用的是「合成数据」,并非真实的天文数据。论...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...的结果,测试领域包括 Blocksworld 和 Mystery Blocksworld(混淆版本),其中前者是在 600 个 3 到 5 个 blockBlocksworld问题静态测试集上运行的结果,后者是在 600 个语义相同但语法混淆的实例(称之为 Mystery Blocksworl……更多
MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来,双方将携手打造面向应用开发者和终端设备厂商的生成式AI软...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...的生成准确率和效率,都获得了一定提升。★代码准确性实验研究团队在HumanEval(+),MBPP(+)和DS-1000三个数据集上进行了广泛实验,涵盖8种主流代码生成模型,包含Base模型和SFT模型。团队观察到CodeDPO在所有模型上均带来了...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...升模型性能。性能评估使用lm-evaluation-harness包对新排行榜版本的所有基准测试进行模型评估,然后使用HuggingFace分数归一化处理评估结果。如下图所示,Falcon Mamba 7B获得15.04的均分,超过Llama 3.1 8B 13.41分和Mistral 7B ……更多
复旦大学推出AI生成文本检测软件“谛听”
...规模监督训练,就能检测AI生成的文本。据该软件的英文版本介绍,对于ChatGPT生成文本的检测率达到80%左右。实验室负责人邱锡鹏教授3月16日晚间在微信朋友圈上表示:“后续将会在MOSS语言模型开源后,将Sniffer与MOSS进行联动,...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
...,使其能够接入 Google 搜索、执行代码等。2.0 Flash 的实验版本将从今天开始通过 Gemini API 和 Google 的人工智能开发者平台AI Studio 和Vertex AI 提供。 不过,音频和图像生成功能仅面向"早期访问合作伙伴"推出,并将于 1 月份全面推...……更多
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...生成 三大技术亮点看懂天工硬实力从“天工”目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平。 其产品完成度与体验成熟度已不仅仅停留在“尝鲜级...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...的几K几十K,发展到了如今的百万token级别。Gemini的最新版本可以接收200万个token作为上下文。这大概相当于140万个单词、2小时视频或者22小时的音频。但不知诸位平时用得着这么长的上下文吗?毕竟100K已经相当于一部比较长的...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...模型训练和部署方案。据智谱AI CEO张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。△在最新AgentBench上,ChatGLM3-turbo版本的Agent能力智……更多
类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
...两者之间的关系「划上了不等号」。 该团队通过大规模实验发现 ——即便依照 Scaling Law 扩大模型参数与训练数据量,模型依然无法抽象出一般物理规则,甚至连牛顿第一定律、抛物线运动都无法领会。「视频生成模型目前就...……更多
三星990 EVO AI应用体验
...能效。 在存储颗粒方面,三星990EVO搭载了经过改良的V6版本TLCNAND存储颗粒。单颗颗粒为1TB,高密度设计不仅提升了整体存储效率,还增强了数据的可靠性和耐久性。性能测试中,CrystalDiskMark空盘1GiBSeqQ8T1读写速度分别达到5081.52M...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...苹果发布iOS 18.1开发者测试版,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能:1、Siri升级。Siri唤醒后具备屏幕边缘发光特效,能理解用户表述不通顺的指...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者来自清华大...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...官方博客显示,ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重,但仅限于非商业用途。仓库地址:https://huggingface.co/EvolutionaryScale/esm3-sm-open-v1/tree/main此外,ESM3与不同于模拟多种生物分子的……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...开发者可以通过 Google AI Studio 和 Gemini API免费访问。聊天版本还得再等等。不过也有网友发现了华点,虽然数学能力很强,但还是没有打败o1-mini以及o1完整版(94.8)。谷歌Gemini 1.5大升级此次更新的有两个型号:Gemini-1.5-Pro-002和G……更多
对着3个中国AI大模型,两个美国科技界大佬深聊了半小时
...的AI模型。那么,这其中有什么区别呢?一个完全开源的版本意味着他们不仅提供了模型权重,还同时提供了训练代码、数据集和所有他们采用的设置,有了这些,你就可以复制这一个AI模型。你可以想象到很多组织会喜欢这种...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...准测试上进行训练,因为无法确定这就是用于训练该特定版本模型的数据集。 项目地址:https://github.com/lm-sys/llm-decontaminator随后,他又进行了另一个测试——对于基准测试集中的每个问题,将问题字符串分成两半,然后在温度...……更多
StableDiffusion原班人马新公司官宣!连发新模型刷新AI绘画格局
...黑森林团队正缓步提升API中FLUX.1 [pro]的推理计算能力。此版本可以通过Replicate和fal.ai访问;提供专用和定制的企业解决方案。 FLUX.1 [dev]:系列中杯。一个允许非商业途径使用的模型,开放权重、经过蒸馏。[dev] 直接从[pro] 中蒸...……更多
DeepSeek的一次小更新 堪比发布新模型
...扔了个 DeepSeek -V3-0324 模型。模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为...……更多
OpenAI“后院失火”? Sora疑遭恶意泄露 因内测人员“破防”:报酬太少
... 宋子乔)OpenAI尚未正式发布的视频生成大模型Sora的内测版本疑似遭恶意泄露。11月27日凌晨,有人在大模型平台HuggingFace上泄露了其API,使其短暂的开放了1小时左右。从泄露的API来看,通过简短的文本描述,Sora可以生成1080P、720...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...了明显的改进。Text-Davinci-003是GPT-3和GPT-4之间的一个中间版本,通过指令微调后比GPT-3的性能更好。除此之外,实验中还报告了人类应试者的平均成绩和最高成绩,作为每个任务的人类水平界限,但并不能完全代表人类可能拥有...……更多
美搜索巨头被“AI接管” 谷歌全新生成式搜索重磅发布
...巴德”。谷歌周三扩大了这一工具的使用范围,将其英文版本推向180多个国家和地区,同时还提供日文和韩文版本。谷歌AI利器PaLM 2皮查伊还在大会上讨论了谷歌为打造更强大AI技术所做的努力。他公布了一项更强大技术的最新...……更多
更多关于科技的资讯:
聚焦2025中国国际数字经济博览会·访谈|沈昌祥:发挥优势,不断筑牢人工智能安全底座
发挥优势,不断筑牢人工智能安全底座——访中国工程院院士沈昌祥中国工程院院士沈昌祥。 河北日报记者 李东宇摄2025中国国际数字经济博览会的主题为“可信数据赋能产业发展”
2025-10-18 08:25:00
10月17日,2025中国国际数字经济博览会,一款AI绘画机器人精准识别人脸神态,快速绘画出人脸素描,被这只机械臂画得心服口服。(摄制:苏畅、白中豪、朱泊宇)
2025-10-18 08:27:00
深化开发利用,让高质量数据“动”起来——2025中国国际数字经济博览会探新之一机器人亮绝活、大模型总动员、虚拟空间沉浸体验……10月17日
2025-10-18 08:37:00
厦门网讯(厦门日报记者 薛尧)苹果iPhone17 Air昨日正式开启预售,这款取消实体卡槽、仅支持eSIM(嵌入式虚拟SIM卡)的新机
2025-10-18 08:59:00
近日,建设银行正式启动“‘享趣’玩·惠游中华”信用卡活动,为客户提供涵盖景区票务、特色餐饮、文创消费等多方面的用卡优惠
2025-10-18 10:41:00
海信贾少谦:AI重塑企业管理模式,打法要快,生意要慢
10月17日,第十五届中国管理·全球论坛暨首届“中国企业管理最佳实践榜”发布盛典在青岛举办。作为C50+2025年度轮值企业家召集人
2025-10-18 10:57:00
竹溪县数字经济产业链招商签约超亿元
十堰广电讯(全媒体记者 白孟尧 通讯员 付延峰)竞逐数字经济新赛道,孕育产业链招商硕果。10月18日,湖北十堰竹溪县竹溪数字经济产业链招商暨2025“国芯一号”生态合作伙伴大会在桃花岛夯土小镇举行
2025-10-18 13:47:00
东南网龙岩10月17日讯(通讯员 陈碧霞)近日,工行龙岩漳平支行组织青年志愿者主动深入当地企业园区,精心开展集“个人金融产品精准营销”与“金融反诈知识普及”于一体的“一站式”综合服务活动
2025-10-18 16:32:00
烟台银行荣登2025上半年度高质量数字化转型十大典型案例榜单
近日,由中国信通院主办的以“洞见十五五”为主题的2025数字生态发展大会暨“铸基计划”年中会议在北京盛大召开。会上,烟台银行联合长亮科技申报的《DataOps赋能烟台银行建设高质量智能数据中枢》案例
2025-10-18 17:45:00
视源股份广交会展示AI全场景创新实力,机器人机器人系列产品亮相成焦点
在第138届中国进出口商品交易会(广交会)上,视源股份以“AI+未来教育、AI+企业服务、AI+机器人、AI+生活”为主线
2025-10-18 18:18:00
本土智造重磅升级,医科达将八度亮相进博
第八届中国国际进口博览会(进博会)进入倒计时,作为八年“全勤生”,全球精准放疗先锋医科达将以“共建本土生态,共筑抗癌未来”为主题
2025-10-18 18:42:00
不用等到20号了!现在来京东11.11 iPhone 17 Pro系列可领300元惊喜券
每年11.11对于广大果粉而言无疑是换新的绝佳时机,无论是追求最新款还是预算有限入手上一代机型都能享受到极具吸引力的价格
2025-10-18 18:43:00
破局重构引领前行,联众优车持续锻造二手车服务新基建
近年来,在国内汽车消费结构持续升级的背景下,二手车市场已成为拉动汽车消费的重要引擎。特别是随着国家一系列利好政策的推出
2025-10-18 18:43:00
从龙虎到鹤年堂 京东七鲜十月品牌日再造下一个老字号联名爆款
随着“养生年轻化”与“即食化养生”成为主流,当代消费者愈发青睐“轻松养生、即时进补”。如何让传统养生智慧通过自有品牌融入日常
2025-10-18 18:43:00
全时段畅飞 全年不限次:长龙航空“365畅飞卡”10月19日在京东旅行限时开售
国内随心飞历史新低,全时段畅飞、全年不限次!在推出海航随心飞,并创下2天超25万用户下单、2亿销售额的纪录之后,京东11
2025-10-18 18:45:00