• 我的订阅
  • 头条热搜
华人团队爆火instructblip抢跑看图聊天
碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线,就已经被超越了。近来,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。BLIP家族...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
随着语言模型的能力越来越强,现有的这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...人学者Tianhao Wu,导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化(Thought Preference Optimization)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思考过程。TPO将...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...答案?为了解决这一问题并推动多模态AI评估的边界,MMMU团队对MMMU基准在健壮性和问题难度上进行提升,新基准MMMU-Pro能够更准确、更严格地评估模型在广泛的学科领域内真正的多模态理解和推理能力。论文链接:https://arxiv.org/...……更多
大模型这把“火”,烧到了人形机器人
...内部成立了一个机器人部门。早在2017年,OpenAI的机器人团队,就发布过用于模拟机器人控制的开源软件Roboschool。2018年,团队研发出来的机械臂已经能自如地“盘核桃”,即灵活把玩木块。当然,OpenAI机器人团队最著名的研究,...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...了这一观点。来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...的研究比比皆是。那么,我们该怎么办呢? 最近,微软团队提出了可扩展的智能体框架——AgentInstruct,可自动创建大量多样化、高质量的合成数据。它最大的优势在于,仅只用原始数据源,就能创建完整的提示和回应。论文地...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型(MLLM)。之所以选择多模态大模型作为 Ferret 的设计前提,是因为其拥有强大的视觉语言全局理解能...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...上述问题,来自UNC ,芝加哥大学,UMD和罗格斯大学的研究团队提出了Calibrated Self-Rewarding(CSR),多模态大模型的自我增强因为会存在一个真实图像的参照,这会使得self-rewarding的过程更加可靠。论文地址: https://arxiv.org/pdf/2……更多
字节版Sora火爆24小时,同名论文再次被热议
...值也是拉满了,嗷嗷待哺内测资格!与此同时,字节研究团队一篇PixelDance同名论文,也被扒了出来,再次引发热议。‍‍‍背后论文揭示「PixelDance」原型‍‍字节团队此前入选CVPR 2024的论文,就提出了名为一种PixelDance的模型。...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...程,最终生成用户所需的专业地理图表。展望未来,研究团队将继续深耕地图大模型及地理推理机研发领域,致力于让“坤元”等地理科学语言大模型能够读懂地图、理解地理空间关系。此外,他们还将打造地理科研协作大平台...……更多
90 后华人 CMU 校友回国创业,自研具身智能机器人
...恒地投入,才能打赢关键核心技术攻坚战。\"90 后 \" 创业团队涌现如我们所见,除了相关领域的龙头企业在布局自研人形机器人,国内也有不少年轻的初创团队涌现。例如由 \"90 后 \" 科技博主、前华为 \" 天才少年 \" 彭志辉创办...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种信息的干扰,阻碍智能体完成用户目标。更糟糕的是,GUI Agent 可以在私有设备...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...合专家架构,能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。在当今以数据为驱动的时代,时序预测已成为众多...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...ma2自己给自己微调,性能超越了GPT-4Meta和纽约大学的研究团队最近提出了一种创新的“自我奖励语言模型”方法,使得微调后的Llama 2-70B模型在AlpacaEval 2.0排行榜中超越了GPT-4、Claude 2和Gemini Pro等领先的大语言模型。这项研究的突...……更多
首位“AI软件工程师”亮相引爆科技圈
...握着十块IOI(国际信息学奥林匹克竞赛)金牌,核心创始团队为3名华人。Devin现处于内测阶段,有意用户可申请提前试用。目前,团队尚未透露更多核心技术细节,但他们表示,Devin源于其长期推理及规划研究的进展。编码只是...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...。本开源项目由北京大学对齐小组开发并进行长期维护,团队专注于人工智能系统的安全交互与价值对齐,指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...任务的扩散基础模型,由清华大学人工智能研究院 TSAIL 团队构建。当前,机器人领域公认的卡脖子问题是 “不够智能”。许多模型需要人教几十遍才能完成单个任务,面对没教过的情况则 “束手无策”。而 RDT 正是这个 “智能...……更多
百度CTO王海峰:文心大模型的底色和成色
...助推剂”。一开场,他就用一句话解答了大家的疑惑:“团队基于更大的算力、更多的数据和更强的算法,训练出来规模更大、效果更好的文心大模型4.0。”升级:算力更大、数据更多、算法更强王海峰坦言,文心大模型4.0的基...……更多
meta推出两款基于ai的图像编辑工具
...过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为EmuVideo的方法,可以改善最终生成视频的品质和多样性。据悉,EmuEdit号称是一种创新的影像编辑方法,目的是要简化各种影音操作任务,为视频编辑提...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...现实世界中的各种物体进行交互的,由此来自微软的研究团队提出了IGOR。究竟怎样才能学到人类和机器人统一的动作表示呢?IGOR框架解读IGOR框架如下所示,包含三个基础模型:Latent Action Model、Policy Model和World Model。具体来说,...……更多
国际网络安全团队研发了新型ai蠕虫病毒
3月3日消息,国际网络安全团队近日研发了新型AI蠕虫病毒,能够在生成式人工智能服务之间独立传播、窃取数据并通过电子邮件发送垃圾邮件。伴随着OpenAIChatGPT和GoogleGemini等生成式AI系统的快速发展,AI开始被应用于解决某个...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...从数据接口执行指令到与不同硬件厂商的协同工作。创始团队方面,若愚科技的创始团队出自哈尔滨工业大学(深圳)计算机科学与技术学院,团队拥有多媒体计算、自然语言处理、具身智能和大模型量化压缩等方向的国家级高...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...亟待解决的问题。来自卡内基梅隆大学和清华大学的研究团队提出了 SELF-GUIDE 方法。该方法通过语言模型自身生成任务特定的数据集,并在该数据集上进行微调,从而显著提升模型在特定任务上的能力,无需依赖大量外部高质量...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
自从 Ilya Sutskever的名字出现在 OpenAI o1 背后团队名单中,他在 o1 中发挥了哪些作用,一时间成为不少网友的关注焦点。这不,机器学习工程师 Rohan Paul 刚刚发帖表示,去年 5 月份 Ilya 合著的一篇论文不能错过。论文题为“Let\'s V...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...用下游任务上对 OLMoE-1B-7B 的性能进行了基准测试。研究团队发现,在所有任务中,OLMoE-1B-7B 比密集 OLMo 模型以更少的计算量 (FLOP) 获得了更好的性能。尽管 OLMoE-1B-7B 使用了不到一半的 FLOP 进行训练并且仅使用 1B 个激活参数,但 ...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...者来自上海交通大学和上海人工智能实验室智慧医疗联合团队,共同第一作者为上海交通大学博士生邱芃铖和吴超逸,共同通讯作者为上海交通大学人工智能学院王延峰教授和谢伟迪副教授,这是该团队在继 PMC-LLaMA 后,在持续...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...域,也出现在了机器人领域。昨天晚上,朱玉可和 Jim Fan 团队(英伟达 GEAR 团队)新鲜发布了他们的最新研究成果 HOVER。这是一个仅有 1.5M 参数的神经网络,但它足以控制人形机器人执行多种机体运动。先来看看效果,将 HOVER ...……更多
更多关于科技的资讯:
amd发布2025年笔记本平台硬件规格
11月11日消息,消息人士、B站UP主金猪升级包 在昨日的视频中对2025年笔记本平台的硬件规格进行了前瞻分析。其中在AMD处理器部分
2024-11-12 01:57:00
oppo、vivo和荣耀线下走量机型全员配备潜望镜头
当前,众多品牌的线下走量机型在线上用户群体中并未赢得广泛好评。一方面,这些线下机型的配置参数难以在市场上掀起高潮;另一方面
2024-11-12 02:10:00
两款Ultra新机将于明年三月面世,配备2K新微曲屏
日前,CNMO注意到,博主“智慧皮卡丘”透露,有两款Ultra新机将于明年三月面世,均配备2K新微曲屏。这两款新机在焦段上的变化不大
2024-11-12 02:12:00
小米15全球版、redmi新机现身新加坡认证平台
近日,小米15全球版和一款Redmi新机在新加坡IMDA认证平台上现身,确认了这两款设备即将登陆新加坡市场。据悉,小米15全球版的型号为“24129PN74G”
2024-11-12 02:16:00
金邦新款DDR5 CUDIMM和UDIMM内存将于11月上市
11月10日消息,PC组件厂商金邦(GeIL)于11月8日发布了新款DDR5CUDIMM和UDIMM内存。该内存覆盖6400MT/s到8000MT/s频率
2024-11-12 02:16:00
安克25k165w移动电源开售,主打 165W 功率
11月10日消息,安克旗下型号为“ZoloPowerBank25K165W”的移动电源将于今晚8点在京东开售,这款移动电源主打165W功率
2024-11-12 02:24:00
机械革命极光15 2024款笔记本带来新配置
11月10日消息,机械革命极光152024款笔记本带来新配置,首发价5699元。据介绍,新款笔记本搭载了酷睿i5-12450HX处理器
2024-11-12 02:28:00
苹果m4款macmini上电源按钮解决方法分享
11月10日消息,2024款Macmini采用了全新的设计,苹果为了容纳各种部件因此选择将电源按钮移到底部,但这也给部分需要用到开机按钮的用户带来了不便
2024-11-12 02:28:00
boseultra“炫光石墨蓝”配色开售,支持精准定向传声
11月10日消息,BoseUltra开放式耳机“炫光石墨蓝”配色今日20:00开售,该款耳机支持空间音频、骁龙畅听,售价2299元
2024-11-12 02:31:00
迈从kx75机械键盘开售,内置 8000mAh 电池
11月10日消息,迈从KX75机械键盘将于今晚19:30开售,该款键盘采用Gasket结构设计、内置8000mAh电池
2024-11-12 02:37:00
昊铂hl将于11月15日亮相广州车展
11月11日消息,广汽埃安旗下高端新能源品牌昊铂今日宣布,定位为“豪华智能旗舰SUV”的新车昊铂HL将在11月15日的2024广州车展期间正式亮相
2024-11-12 02:40:00
酷睿i7-14700kf和锐龙79700x哪个好?
虽然《黑神话:悟空》在全球引起的狂潮令人热血澎湃,但对于玩家来说,对游戏的热情从未停止。CPU作为装机的必备,向来也是厂家们争相追逐的重点
2024-11-12 02:48:00
安兔兔平板电脑性能排行榜:红魔平板pro第一
近日,根据多家科技媒体的消息,国内手机评测机构安兔兔公布了最新一期的手机性能排行榜。和以往不同的是,安兔兔这一次还带来了安卓平板电脑的性能排名
2024-11-12 02:49:00
手机屏幕朝下放置有什么好处?
在这个科技飞速发展的时代,手机已经成为我们日常生活中不可或缺的一部分。从通讯联络到娱乐消遣,从工作办公到生活缴费,手机几乎无所不能
2024-11-12 02:52:00
originos5到底好在哪里?
目前vivoX200在笔者手上已经用了接近一个月的时间了,总体来说体验还是相当满意的,除了性能与影像都足够给力外,流畅
2024-11-12 02:53:00