英伟,模态,文本,性能,模态,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

支付宝发布多模态医疗大模型：支持千亿级视觉识别

...快科技7月5日消息，在2024世界人工智能大会上，支付宝多模态医疗大模型正式亮相，成为国内首批多模态医疗大模型之一。据悉，该医疗大模型的基石，源自蚂蚁集团自主研发的蚂蚁百灵大模型，这一先进平台不仅拥有“视听言...……更多

2024-07-05 16:17:00模态,模型,支付,视觉,医疗,支持

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...数据泄露，从而反映模型的真实性能。研究团队测试了多模态大模型（LMMs）和纯文本大模型（LLMs）。对于LLMs的测试，输入时不提供任何与图像相关的信息给模型，仅提供文本。所有评估均采用零样本（zero-shot）思维链（Chain of ...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

2B多模态新SOTA！华科、华南理工发布Mini-Monke

【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的...……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率

ChatGPT一周年｜炼制大模型芯片短缺数据有限，何以解忧？

...更紧迫的优化需求。如果说OpenAI是这场浪潮的引领者，那英伟达就是获得了最大实际利益的玩家。今年以来，这家AI芯片公司的股价已上涨241%，市值突破万亿美元，其领先市场的GPU（图形处理器）和高性能计算设施被全球科技企...……更多

2023-12-01 09:28:00炼制,芯片,模型,数据,有限,数据

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

...事实性以及推理能力的缺陷，实现更精细的语义理解、多模态（文本、图像、语音、视频等）输入和输出，具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能，实现AI的自我解释、自我评测和自我监督，构建...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手

...持的Gemini”，认为其会为应用程序构建者带来新的机会。英伟达高级研究科学家范麟熙（Jim Fan）表示：“谷歌正在做的一件事是正确的：他们终于在认真将AI整合到搜索中......谷歌最强大的护城河是分销。Gemini不一定要成为最好...……更多

2024-05-15 09:54:00文生,模型,模态,全家,助手,视频

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...，公司的AI战略是以自主构建算力能力为底座，以开悟多模态大模型为支撑，通过中台体系的构建，实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

本周（4.8-4.14）AI界发生了什么？

...涨超4%，约 1120 亿美元。英特尔发布新AI芯片，性能超越英伟达H100当地时间4月9日，英特尔Vision大会上发布新一代 Gaudi 3 AI 芯片。新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%，推理能力提高了 50%，效率提高了 40%，且成本更...……更多

2024-04-14 20:33:00模型,特斯,马斯,芯片,融资,英特

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...大招了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成

云知声推出山海多模态大模型：实时生成文本、音频和图像

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多

2024-08-27 09:38:00模态,山海,实时,生成,模型,图像

英伟达blackwell计算引擎制造商推出的ai模型

如果还有人想在AI处理领域跟英伟达正面抗衡，那最好再多做几手准备。除了最强大的技术储备之外，大家可能还需要雄厚的资金支持和上天的意外眷顾。换句话说，如今压制英伟达的唯一可能性恐怕只有天降神迹。日前在圣何...……更多

2024-03-20 02:59:00英伟,制造商,模型,引擎,制造,英伟

最强多模态模型GTP-4o问世，OpenAI继续开启人工智能

...性创新的今天，OpenAI公司隆重宣布，其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能，更在实时对话、图文分析等方面实现了质的飞跃，被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多

2024-05-14 14:04:00模态,之路,人工智能,人工,模型,智能

AWS搭载“最强大模型”！40亿美元投向OpenAI竞对

...Anthropic合作的最新进展，并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元，截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外，双方的合作关系也再次加深，Amazon ...……更多

2024-04-03 16:49:00模型,模型,能力,演示,模态,生成

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

GPT-4o的识图能力有多牛？四大维度深度体验

...入到后训练中的计算力。”针对GPT-4o强大的多模态能力，英伟达高级研究科学家JimFan发表长文表示，从技术角度来看，这需要对标记化和架构进行一些新的研究，但总体上是一个数据和系统优化问题。在JimFan看来，GPT-4o很可能是...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...zhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...张鹏则表示，对于Sora的出现，他并不吃惊，因为立足多模态领域的深耕，智谱也正在做这件事。如今，“清影”面世，让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态，也让没有视频制作基础的小...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

GPT-4劲敌，谷歌进入高能+高产模式

...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

...月以来，全球 AI 界接连开展了数十场发布会，从海外的英伟达、OpenAI、谷歌、苹果，到国内的阿里巴巴、字节跳动、腾讯等一众企业纷纷出新，还不约而同地选择将大模型技术落地到产业应用之中。AI 企业们似乎都在向世界宣...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》，借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果，以及赋能智能音频和数字安全方面的一些思考。首先，请允许我简...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI如今发展迅猛的...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

OpenAI机器人亮相，大模型有了“肉身”，英伟达微软都有投

...，其实只用了短短十三天。成立两年估值26亿美元，微软英伟达参投Figure是最近硅谷备受关注的新星。公开资料显示，机器人公司Figure成立于2022年，公司成立之初就瞄准通用人形机器人领域。创始人Brett Adcock是位连续创业者，据...……更多

2024-03-14 17:17:00英伟,微软,肉身,机器人,模型,机器

财经观察：提升人机交互效率多模态大模型易用性进一步推进

...晨，美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂（Mira Murati）介绍，GPT-4o可以接收文本、音频和图像的任意组合作为输入，并实时生成文本、音频和图像的任意组合进行...……更多

2024-05-14 13:59:00进一,模态,易用,易用性,人机,模型

“杜甫很忙”梗图变视频！智谱AI生成视频模型上线

...过半，经过一轮“价格战”后，各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点，大模型行业本身也正经历从单模态到多模态，再到全模态的演进。就在本月初的世界人工智能大会上，腾讯集团副总裁...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

Bengio团队提出多模态新基准，直指Claude 3.5和

...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务