• 我的订阅
  • 头条热搜
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数,……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...的?后训练功不可没从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以...……更多
马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
...上一代模型,Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。值得一提的是,Grok-2在数学推理(MathVista)方面表现登顶测试榜首。但细心网友不难发现,即便是Grok-2,在其他方面与前沿模型GPT-4o或Claude ...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...易。以往的研究,如 GenSAM [1],提出利用 LLaVA/BLIP2 这类多模态大模型(MLLMs)来推理出特定样本的分割提示,以指导分割过程。然而,这种方法在处理像伪装样本分割这样的场景时,往往因为目标共现偏差(object co-occasion bias)...……更多
...款大模型:Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE(混合专家架构)语言大模型预览版。据阶跃星辰系统负责人朱亦博博士介绍,其中,千亿参数大模型Step-1耗时2个月训练成功,在逻辑推...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
百川智能发布baichuan3稳定语言模型
...,大模型的全能特性发挥着至关重要的作用。首先,其多模态学习能力能够整合文本、影像、声音等多种类型的医疗数据,提供更全面、准确的分析和诊断。其次,大模型的深层推理能力有助于复杂医疗决策的制定。此外,稳定...……更多
技术最前沿|瞄准行业痛点, AI验布机赋能传统行业技术焕新
...面,TeleAI创新性采用“大小模型”训练+“多层金字塔”推理的训练、推理两段式算法策略。“大小模型”训练中的大模型是指依托电信自研星辰大模型基座,打造布匹质检行业预训练基础大模型;小模式是指针对不同客户场景...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
架构优先、先易后难,华为的制造业生成式AI方法论
...模型包括视觉大模型、自然语言大模型、预测大模型、多模态大模型、科学计算大模型等;L1行业大模型是针对汽车、生命医药、电子等行业需求特点而构建的;L2场景模型则面向细分的应用场景,比如传送带异物检测、焊点质...……更多
...深耕场景。”他说,“能连接各类实时业务数据,融合多模态的内容,生成并打通原有的多媒体交互能力,成为所有流程的第一助手,这是我们对大模型在证券公司未来应用的展望。”“一项新技术是否能实现有效落地,可以从...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...服务完成备案,各类国产大模型,更是超过了200多个,多模态的大模型应用场景正在不断拓展。然而,随着大模型的快速发展,算力成本日益成为影响人工智能推广应用的重要因素,大模型产品的价格居高不下,更是长期制约着...……更多
未来医院变形记:生成式AI将病历书写从8小时缩短至25分钟
...与智能手机等工具的交互存在数字鸿沟。AI陪诊师利用多模态交互技术,老年患者通过文本或语音与AI陪诊师互动,就能获得清晰的语音版和文本版就医指导,缩短数字鸿沟。第二,服务流程复杂,患者晕头转向。就医过程中,...……更多
星火大模型v3.5发布,带来七大能力提升
...为教师的“AI助手”。据官方介绍,星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”,教师使用粉笔在智慧黑板旁边的传统黑板上书写时,板书内容可以同步...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
...中的商业周期、物理学中的电磁波,以及数学运算和逻辑推理等。因此,在许多任务和场景中,人们希望对周期进行建模,以便根据以往的经验进行推理。尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功,但是它...……更多
中国科技创新“乘”数直上
...火V3.5在逻辑推理、语言理解、文本生成、数学答题、多模态等方面的能力均显著提升。同时,讯飞还发布了星火语音大模型和开源大模型。“大模型带来了语音技术发展的全新机会。”刘聪说。让机器具备学习、推理和决策的...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...基于预训练GPT-2提出了一种新的注意力机制,来衔接不同模态之间的语义差异,无需大量图像-文本数据训练,就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造,基于新的编解码器架构C-V...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元
...和平台的发展:1、以机械臂作为物理输入/输出设备的多模态大模型:VIMA、PerAct、RvT(英伟达)、RT-1、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;2、弥合 System 1(负责低级控制)和 System 2(负责高.……更多
“3D视频版Sora”来了!
...-Diag和FV4D)方面都击败了此前的模型。结语:Stability AI多模态再添新布局Stability AI以文生图开源模型起家,在文本、视频、3D等多个模态上都有所布局。此次开源SV4D,是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...注意力表现出与视频中的运动和动态相关的中频变化;跨模态注意力是最稳定的,将文本与视频内容联系起来,类似于反映文本语义的低频信号。基于此,研究团队提出金字塔式注意力广播来减少不必要的注意力计算。在中间部...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...行的技术开放日上发布了其最新的“日日新SenseNova”5.0多模态大模型系列。该产品采用了混合专家(MoE)架构,并支持高达10TTokens的中英文训练数据与推理合成数据,数量达到数千亿Tokens。其推理时上下文窗口可有效达到200K左...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
OpenAI未来猛料全曝光!奥特曼承认自己最大弱点是产品
...品,那么的确可能很难获得投资回报。 OpenAI将对o1进行多模态改进;在o1新范式下,预计基于图像的模型将迅猛发展。 对OpenAI最自豪的事情,是反复去做一些新的、完全未经验证的事情。 世界上很多有才的人因为他们在糟糕的...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...pMind CEO Demis Hassabis 代表 Gemini 团队正式推出了全新一代多模态大模型 Gemini,拥有「视觉」和「听觉」,还有强大的学习和推理能力。其中,Gemini Ultra 直接对标公认最强大的 GPT-4 模型,行业推测参数超万亿。更耐人寻味的是,在...……更多
中国电信推出“星辰慧答”服务,将AI智能赋予传统短信业务
...能研究院(TeleAI)联合研发,覆盖语义、语音、视觉、多模态等。TeleAI最近又联合中国电信增值业务运营中心,推出了“星辰慧答”服务。区别于传统大模型需要额外下载App或者使用网页、小程序等的要求,星辰慧答简单原生,...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
更多关于财经的资讯:
靠浦拦截诈骗出账资金,守护群众财产安全暖民心
“多亏网点工作人员的耐心细致,为我们家挽回了10万元资金损失!”近日,客户Y女士在我行网点办理解控业务时,因提及大额境外消费被柜员及时拦截
2025-09-26 18:26:00
兴业银行南京分行为江苏企业撑起汇率“安全伞”
出口利润被汇率变化“吃掉”是许多外贸企业长期面临的挑战。近日,兴业银行南京分行为省内一家年出口2亿美元的锂电国企量身定制“12个月稳价方案”
2025-09-26 07:31:00
中重科技等在江苏成立机器人科技公司
近日,中重灵希机器人科技(江苏)有限公司成立,注册资本1000万元,经营范围包含:人工智能行业应用系统集成服务;智能机器人的研发;智能基础制造装备销售;人工智能硬件销售等。企查查
2025-09-25 16:48:00
打破“快牛”多劳“慢牛”逍遥怪圈
在机关工作中,能力强、责任心强的干部被不断加担子,俗称“鞭打快牛”。而效率低、主动性差的“慢牛”却逍遥自在。提升机关工作效能必须打破“快牛”多劳“慢牛”逍遥怪圈
2025-09-25 16:48:00
赛力斯成功注册RoboREX商标
近日,赛力斯(601127)申请的“RoboREX”商标注册成功,国际分类包括设计研究、机械设备、运输工具。据悉,RoboREX是赛力斯推出的智能控制技术
2025-09-25 17:00:00
纵横股份在深圳成立低空运营服务公司
近日,深圳纵横低空运营服务有限公司成立,法定代表人为王陈,经营范围包含:智能无人飞行器制造;导航、测绘、气象及海洋专用仪器制造;海洋环境服务;通用航空服务等。企查查股权穿透显示,
2025-09-25 17:00:00
光环新网等成立数据科技公司
近日,浙江光环数据科技有限公司成立,法定代表人为庄小航,注册资本为1000万元,经营范围包含:互联网数据服务;数据处理服务
2025-09-25 17:00:00
三峡不动产 × 北京远行 | 精英开讲以专业赋能
面对瞬息万变的市场环境,如何紧跟趋势,为运营注入新动能,成为当下众多企业突破发展瓶颈的关键命题。9月23日,三峡不动产管理有限公司精心策划并组织了“房产土地经营管理能力提升暨‘五化’体系建设专题培训班”
2025-09-25 17:08:00
智慧赋能、创新支撑,党建引领打造高质量建设标杆
9月18日,2025年东莞市住房和城乡建设系统“质量月”现场观摩交流会在中建三局深圳公司承建的团泊洼11号地块项目成功举办
2025-09-25 17:08:00
民生银行济南分行举办科技型企业银企对接活动
近年来,伴随经济形势发展及社会信息化程度的提高,实体企业经营中面临的降本增效、企业管理智能化需求日益突出,民生银行济南分行顺应企业实际需求
2025-09-25 17:32:00
中建六局交通公司:志愿服务添力 护航世界生物圈保护区大会
第五届世界生物圈保护区大会国际协调理事会召开在即,中建六局交通公司主动对接大会需求,投身杭州临安区服务保障工作,以“交通力量”为这一国际盛会保驾护航
2025-09-25 17:38:00
宜美照明:节能不止于关灯,更在于智慧与健康
在绿色转型成为各行业共识的今天,商业与工业空间的能源管理正迎来新一轮升级。照明系统作为建筑能耗的重要组成部分,其智能化与高效化已成为企业降本增效
2025-09-25 17:38:00
中建三局西北公司安装分公司召开“清风明月共团圆 党建引领话廉洁”中秋六方联建共建暨廉洁教育活动
古韵今风,共赏一轮明月;中秋之际,共赴团圆盛宴。为弘扬中华民族优秀传统文化,营造温馨浓厚的节日氛围,进一步推动党业融合
2025-09-25 17:38:00
农行济南槐荫济兖公路支行:特事特办紧急服务,暖心助力客户应急就医
近日,农业银行济南槐荫济兖公路支行在非营业时间紧急协助一名客户办理定期存单支取业务,缓解其医疗费用急需,获得客户高度赞誉
2025-09-25 18:07:00
农行济南槐荫阳光新路支行:暖心服务退伍老兵,耐心关怀获敬礼致谢
近日,农行济南槐荫阳光新路支行因持续耐心服务一位八十多岁退伍老兵,获得老人多次敬礼致谢,暖心互动成为网点佳话。该老人曾服役于文工团
2025-09-25 18:08:00