• 我的订阅
  • 头条热搜
“试用完谷歌的新AI模型,再也不爱GPT”
...号,憋了好久的谷歌开大了,直接推出了最新的人工智能模型 Gemini ( 双子座 )。这个被谷歌称为规模最大、能力最强的人工智能模型,如果光看官方的演示视频,那真的过于高级了点。在视频里, Gemini 不仅秒识别演示者画的...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
Gemini的展示是剪辑造假?我们亲测了一下,发现…
...重推出他们史上“规模最大、能力最强”的原生多模态大模型Gemini 1.0。并称已在多项基准测试中打败GhatGPT,综合能力称霸目前市面上所有AI大模型。官方放出的一段6分22秒演示视频更是震撼:Gemini能流畅而准确地识别出视频中...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
大模型的未来,快手在自己身上找答案
...检票口久违的出现了许多黄牛,这一切都意味着国内对大模型的关注从 2023 年小圈子里的迅速升温,到现在的白热。所有人都在想尽办法靠近大模型,所有公司都在寻找一种对大模型来说合适的描述方式,但从目前来看,大多都...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...与AI创企Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标超越 GPT-4V 水平。更有多项功能首次上「端」:小钢炮...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生图”四大核心功...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...即理解人们思维的能力,是开发具有类人社会智能的 AI 模型的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出...……更多
...但很可能永远都达不到;有专家认为,大家对大数据和大模型关注度太高了,现在的人形机器人应该更多关注机器人本体。而关于具身智能,身为北京大学计算机学院前沿计算研究中心(CFCS)助理教授、博士生导师,同时又是...……更多
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...下午,由中国信息通信研究院承办的WAIC 2024“迈向AGI:大模型焕新与产业赋能”论坛在上海徐汇西岸拉开帷幕。小红书技术副总裁王晓博在论坛上发表主题演讲,分享了小红书在大模型领域的最新布局与探索。目前小红书社区拥...……更多
AIGC工具测评:生成式AI的产品表现如何
...这一年,AI展现出了前所未有的发展势头,无论是在基础模型能力、实际应用场景,还是资本投入方面都取得了显著进展。特别是在2022年11月30日,OpenAI发布了ChatGPT,标志着AI技术的一个新纪元。紧接着,在2023年1月,ChatGPT的月...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...技术方向,仍然值得关注,但可以明确的是,随着大型AI模型的产业化进程不断深入,国内外参与者也越来越冷静,更加专注于自身的AI策略与节奏。有人将这两场发布会比作是一场斗地主游戏,OpenAI打出一对二,谷歌就跟四个...……更多
百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。公司2014年以决策式AI起家,2017...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
更多关于科技的资讯:
离年薪百万最近的大学专业,被求职年轻人评为新“天坑”
原标题:离年薪百万最近的大学专业,正在沦为新“天坑”作者:睡着数据:睡着 乐乐如今,甭管是 ChatGPT 还是国产 Kimi
2025-02-11 23:33:00
行业首家!海信电视正式接入DeepSeek!支持R1、V3自由切换
快科技2月11日消息,海信电视今日正式宣布接入DeepSeek,成为全球首个接入DeepSeek的电视品牌,并支持R1和V3版本自由切换
2025-02-11 21:48:00
暴雪国服战网今日起调整登录方式:必须绑定网易游戏账号
快科技2月11日消息,暴雪游戏国服运营团队宣布,战网今起正式调整登录方式。用户需要将战网通行证与网易账号进行绑定,并使用该网易账号才能登录游戏
2025-02-11 22:18:00
明星智驾公司爆雷!纵目科技员工称多名高管卷款跑路
快科技2月11日消息,据报道,国内明星智驾公司纵目科技爆雷,总部停水停电,公司暂停运营,甚至还有多位高管卷款跑路。报道称
2025-02-11 22:49:00
意料之外!阿里将为中国iPhone开发AI功能
快科技2月11日消息,据最新报道,苹果和阿里巴巴将合作为中国iPhone用户开发AI功能。此前,在业界曾广泛流传着多种关于苹果合作伙伴的猜测
2025-02-11 22:49:00
2025消博会时装周将于4月13日启幕 目前已启动全球招募活动
南海网2月11日消息(记者 王子遥)记者从2025消博会时装周组委会获悉,2025消博会时装周将于今年4月13日启幕,目前全球招募活动已正式开启
2025-02-11 18:27:00
十大行动促消费!“2025欢乐元宵·购物嘉年华”活动启动
齐鲁晚报•齐鲁壹点 尚青龙百年老字号青岛啤酒带来只有酿酒师才能喝到的新鲜原浆,21天保质期的水晶纯生;李村脂渣、高家糖球
2025-02-11 22:15:00
3案例入选工信部数字应用场景典型案例河北新闻网讯(刘一格、王育民)近日,工业和信息化部公布2024年“数字三品”应用场景典型案例
2025-02-11 19:38:00
SOT能否以云算力服务商,突围算力挖矿赛道,引领加密数字潮流
[2025年2月5日,马来西亚吉隆坡]全球算力竞争白热化,SOT是否具备突围能力?这个问题是全球各界关注的焦点。2024年BTC第四次减半以来
2025-02-11 19:59:00
“Al背景下文艺创作研讨会”在宁举行
AI技术迅猛发展,给文艺创作带来了前所未有的变革和机遇。2月11日下午,由江苏省当代艺术创作研究会主办的“Al背景下文艺创作研讨会”在宁举行
2025-02-11 20:13:00
东南网2月11日报道(福建日报记者 徐士媛 通讯员 温连光)6日,新春伊始,龙岩市举行2025年全市民营企业家新春恳谈会暨“迎新春 开门红”招商项目集中签约活动
2025-02-11 20:17:00
RTX 4090工程卡首次公开:残暴四个16针接口 供电2400W!
快科技2月11日消息,chiphell论坛网友“maxreni”从神秘渠道搞到了一大批NVIDIA显卡的工程样卡,涵盖GTX 10
2025-02-11 20:18:00
比亚迪智驾下饺子 7万的车也有NOA 王传福:要像安全带一样标配
智驾一夜变天了。昨晚,比亚迪召开智能化战略发布会,介绍了自己关于智驾方面的规划,一句话总结就是——智驾无差别上车。价格不再是区分智驾的隔离带
2025-02-11 20:18:00
余承东之后 长城魏建军发声:智能驾驶不是一场秀 实践出真知!
快科技2月11消息,今日晚间,长城汽车董事长魏建军发微博称:“智能驾驶不是一场秀,实践出真知。”疑似回应近期友商全系普及智驾
2025-02-11 20:18:00
万亿宁王要在香港上市了!宁德时代向港交所递交招股书
快科技2月11日消息,据港交所文件,宁德时代正式向香港联交所递交发行境外上市外资股(H股)并在香港联交所主板挂牌上市的申请
2025-02-11 20:18:00