• 我的订阅
  • 头条热搜
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...Siri!”来使用语音功能。从性能来看,OpenAI表示,在传统基准测试中,GPT-4o在文本、推理和代码智能方面达到了GPT-4 Turbo级的性能,同时在多语言、音频和视觉能力方面达到了新高度。它在英文文本和代码上的性能与GPT-4 Turbo相当...……更多
AI视觉迎GPT-3时刻!国内市场规模将达6000亿 受益上市公司梳理
...可对不熟悉的物体和图像进行零样本泛化,初步验证了多模态技术路径及其泛化能力。国盛证券刘高畅4月8日研报中表示,预计1-5年内,多模态发展将带来AI泛化能力提升,通用视觉、通用机械臂、通用物流搬运机器人、行业服...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...,来源于经过数据治理、多维评测的数据工厂。为了将多模态能力搬上了手机,面壁智能还发布了多模态端侧模型MiniCPM-V。通过将手机调整为飞行模式来模仿野外无信号的情况,面壁智能演示了野外生存情况下人与MiniCPM-V的多模...……更多
本周(4.8-4.14)AI界发生了什么?
...源:论文论文链接:AI界前线马斯克旗下xAI发布其首款多模态大模型4月13日消息,马斯克AI初创公司xAI推出了其首款多模态大模型Grok-1.5V。除文本功能外,Grok现在可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代,AI时代...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...型也有局限性。首先,OpenAI o1模型(至少目前)还不是多模态大模型,同时在回答事实性问题时也不如其他模型。所以在图像互动、常识问答、互联网搜索方面,GPT-4o依然是更胜一筹的选择。当然,OpenAI明确表示未来会给这个模...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...的?后训练功不可没从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以...……更多
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”
...潮将是“具身智能”,他也公布了Nvidia VIMA,这是一个多模态具身人工智能系统,能够在视觉文本提示的指导下执行复杂的任务。反映在A股二级市场上,今日,相关标的强势上涨,多只个股涨停。截至收盘,鸣志电器、优德精密...……更多
...”Ultra性能优于迄今最先进的人工智能模型,具有天然多模态性,显示出拥有更复杂推理能力的早期迹象。谷歌公司还表示,“双子座”能够理解、解释和生成世界上主流编程语言的代码,可以用作高级编码系统的引擎。此外“...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...麦克风捕捉的语音,转录为文本输入到由OpenAI预训练的多模态大模型中,模型能够理解图像和文本。模型会处理整个对话的历史记录,包括以往的图像,以生成语言响应,再通过文本到语音的方式向人类回话。△Figure 01训练方法...……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...。 首先,提升了整体性能,尤其在数学、长文本以及多模态方面。在MMLU-Pro上性能提高约7%;而在 MATH 和 HiddenMath(内部保留的竞赛数学问题集)基准测试中,两种模型有约 20% 的显著改进,其中Pro版本以86.5%的成绩超过了o1-previe...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...持下,360AI浏览器则可以对文本、视频、音频、图片等多模态的媒体内容进行分析处理,为用户提供了全方位的AI助手功能,绝对是不逊于 Copilot 的打工效率神器。视频内容也是如此,即使是长视频也能快速给出总结和内容描述...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。大会上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生成将成为新一代生产方式,带来行业发展的新机遇。肖欣延分别从图片...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...技术人才,成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向,致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用,引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智能(AI)领...……更多
小模型正在成为AI界的新宠
...源的 GLM-130B 模型,具有 1.3 万亿参数。 M6:达摩院的多模态预训练模型 M6,拥有 10 万亿参数。 然而这种大模型之间的军备竞赛,令业内十分担忧。参数量的增加,就一定能带来显著的性能提升吗?不一定。大模型带来的问题...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...官方声称Claude 3.5 Sonnet是当前最前视觉模型,在标准视觉基准上超越了Claude 3 Opus。不仅如此,其在视觉数学逻辑推理、科学图解分析、图表分析、文件视觉分析方面表现性能全部优于GPT-4o。“重大改进对于需要视觉推理的任务最...……更多
“3D视频版Sora”来了!
...-Diag和FV4D)方面都击败了此前的模型。结语:Stability AI多模态再添新布局Stability AI以文生图开源模型起家,在文本、视频、3D等多个模态上都有所布局。此次开源SV4D,是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以评估其对文本长程依赖的建模...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...刚刚显现,未来还存在巨大的探索空间。第二个是关于多模态理解和生成的统一。在当前「scaling law 撞墙」的相关讨论中,多模态其实是一个被寄予厚望的方向。但是,这个领域目前面临一个严峻的挑战,即多模态的理解和生成...……更多
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
...技术普惠的理念,在今天上线备受期待的第一款免费的多模态模型——GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。这一多模态免费模型将进一步降低开发者在各个领域深入...……更多
OPPO AI 中心产品总监张峻:多模态和个性化是将要深耕的方向
...的主要方向,表示 OPPO 会在 AI 方面带来更多的惊喜。多模态和个性化是将要深耕的方向,同时端云协同将是重点架构。“我们相信,在这些领域持续投入后,一定能为用户带来更加与众不同的体验。”张峻进一步说明,未来会...……更多
豆包再降价,字节“饱和式”进攻仍在继续
...AGI更进一步,大家都在加速。实际上,字节对视觉化、多模态模型的重视度肉眼可见的提升。12月11日,据智能涌现报道,字节提升了即梦的产品优先级,尝试用新的路径打造AI时代的“抖音”。字节计划后续把更多资源向更多模...……更多
更多关于科技的资讯:
苹果计划2026年推出两款新品头显产品
苹果即将在头戴式显示器(头显)市场迈出关键步伐,据知名市场研究机构TrendForce集邦咨询的最新研究报告揭示,这家科技领航者计划在2026年前推出两款创新的头显产品
2024-12-21 15:55:00
联想将推出全新游戏掌机legiongos
联想近期揭晓了一个令人振奋的消息:在即将举行的CES2025展会上,Valve公司SteamOS操作系统及SteamDeck掌机的核心设计者Pierre-LoupGriffais将作为特邀嘉宾出席
2024-12-21 15:56:00
蓝宝石pulse脉动b650m主板测评
蓝宝石前段时间推出了PULSE脉动B650M主板,主打AMD平台的性价比,因为采用了AM5插槽,所以兼容锐龙7000/8000G/9000/9000X3D处理器
2024-12-21 15:57:00
蓝宝石rx7900xt20g极地版正在热销
3A平台最近一段时间非常受欢迎,A卡普遍因为拥有大缓存设计,不管是创作还是游戏也都非常有市场,正好最近一段时间蓝宝石RX7900XT20G极地版正在热销
2024-12-21 15:57:00
苹果推出appstore充值返利活动,为用户提供充值优惠
苹果公司正式宣布推出AppStore充值返利活动,为用户提供额外的充值优惠。活动规定,在2024年12月30日之前,用户充值AppStore账户时
2024-12-21 15:59:00
寻找合适的手游代理是开启游戏事业的关键一步。首先,可以从行业展会和论坛入手。参加各类游戏展会,如中国国际数码互动娱乐展览会(ChinaJoy)等
2024-12-21 16:00:00
一加ace5系列正式官宣发布时间
一加Ace5系列正式官宣发布时间,同时透露了关于该系列的诸多细节。与此同时,一加还宣布将于2025年1月7日在海外发布一加13系列
2024-12-21 16:00:00
华为mate70系列销量预计突破千万台大关
据爆料,华为Mate70系列在前两周的激活销量相比前代有明显增长,业界普遍预计该系列销量将突破千万台大关。这一消息引发了广泛关注和讨论
2024-12-21 16:01:00
豆瓣崩了?官方回应:已紧急提交新版本
多位网友在社交媒体上反馈称“豆瓣崩了”,表示在使用豆瓣App时遇到了闪退情况,多次尝试点击仍无法进入App首页。这一突发状况引发了广大豆瓣用户的关注和讨论
2024-12-21 16:01:00
现在是入手电视的最好时刻 面板价格马上要涨了
快科技12月21日消息,要买电视的赶快了,电视面板价格要涨了。近日,TrendForce集邦咨询发布了2024年12月下旬的面板价格信息
2024-12-21 16:02:00
特斯拉陶琳:电动车在寒冷地区的强劲表现
特斯拉公司高层近期在社交媒体上发布了一系列令人瞩目的数据,揭示了电动车在寒冷地区的强劲表现。特斯拉副总裁陶琳指出,即使在气候寒冷的地区
2024-12-21 16:03:00
拜雅游戏耳机mmx300pro评测
还记得小时候为了让FPS游戏中的枪声和脚步声能分辨的足够清晰,第一次接触到了游戏耳机的概念,虽然只有50元的耳机放在现在来看哪里谈得上专业
2024-12-21 16:05:00
小米yu7无伪装实车曝光,外观时尚运动范十足
一组小米SUV车型YU7的无伪装实车照片在网络上广泛流传,据称拍摄地点位于北京雁栖湖。这组照片为公众提供了更为真实、立体的视角
2024-12-21 16:06:00
机械革命斩获京东金榜新品金奖,成唯一获此殊荣的电脑品牌
12月20日消息,京东年度金榜揭晓,机械革命斩获京东金榜最重磅奖项之一——2024京东金榜新品金奖,成为唯一获此殊荣的电脑品牌
2024-12-21 16:07:00
华为在主机上云领域取得重大突破
华为在今年成立了主机上云军团,这是由其主机上云军团CEO、混合云总裁尚海峰公布的消息。根据尚海峰的介绍,该军团聚集了华为研发的核心资源
2024-12-21 16:09:00