• 我的订阅
  • 头条热搜
“试用完谷歌的新AI模型,再也不爱GPT”
...号,憋了好久的谷歌开大了,直接推出了最新的人工智能模型 Gemini ( 双子座 )。这个被谷歌称为规模最大、能力最强的人工智能模型,如果光看官方的演示视频,那真的过于高级了点。在视频里, Gemini 不仅秒识别演示者画的...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
Gemini的展示是剪辑造假?我们亲测了一下,发现…
...重推出他们史上“规模最大、能力最强”的原生多模态大模型Gemini 1.0。并称已在多项基准测试中打败GhatGPT,综合能力称霸目前市面上所有AI大模型。官方放出的一段6分22秒演示视频更是震撼:Gemini能流畅而准确地识别出视频中...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
大模型的未来,快手在自己身上找答案
...检票口久违的出现了许多黄牛,这一切都意味着国内对大模型的关注从 2023 年小圈子里的迅速升温,到现在的白热。所有人都在想尽办法靠近大模型,所有公司都在寻找一种对大模型来说合适的描述方式,但从目前来看,大多都...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-mo...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...内部分享中,奇绩创坛创始人陆奇直言:他已经跟不上大模型时代的“狂飙”速度了。在ChatGPT引发的现象级讨论下,千亿级大模型的军备竞赛愈演愈烈,不少企业赶趟儿式的交出了自家的大模型答卷。尽管大模型的质量参差不...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...与AI创企Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加...……更多
“360智脑大模型4.0”正式发布,图片、文字、视频互相生成,已接入360全家桶 | 最前线
...们也从善如流,把原来搜索、AI领域积累的能力整合到大模型里。”360创始人周鸿祎表示。6月13日,360集团(601360.SH)公司正式召开“360智脑大模型”应用发布会,发布认知型通用大模型“360智脑4.0”,并宣布360智脑已经接入360旗...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标超越 GPT-4V 水平。更有多项功能首次上「端」:小钢炮...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生图”四大核心功...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...即理解人们思维的能力,是开发具有类人社会智能的 AI 模型的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出...……更多
周鸿祎 落子
... 佘宗明想用AI再造一个新360的周鸿祎,先用认知型通用大模型360智脑4.0再造了一个「周鸿祎」。在距离「把刚出生的婴儿抱出来看一看」2个多月后,周鸿祎秀出了新花活——他用「凑齐部分资料,召唤出一个有灵魂的数字人‘...……更多
...但很可能永远都达不到;有专家认为,大家对大数据和大模型关注度太高了,现在的人形机器人应该更多关注机器人本体。而关于具身智能,身为北京大学计算机学院前沿计算研究中心(CFCS)助理教授、博士生导师,同时又是...……更多
更多关于科技的资讯:
海外媒体发稿推荐:日本顶级新闻媒体投放&新闻发布
一、日本顶级新闻媒体概述日本拥有众多在全球具有影响力的新闻媒体,涵盖电视台、通讯社、报纸等多个领域。其中,NHK(日本放送协会)作为公共媒体
2024-11-21 21:57:00
越明打卡世界互联网大会Vlog| AI让“无障碍”生活成为可能
你有没有想过,在我们享受便捷生活的同时,还有许多残障人士、老年人等特殊群体在日常生活中面临着重重障碍,而科技,特别是 AI
2024-11-21 22:31:00
近日,由江苏省消费者权益保护委员会指导、南京市消费者协会主办的“‘提升消费者满意度’2024年南京金融业服务满意与创新发展年度活动”成功举办
2024-11-21 22:37:00
兴业银行零售科技协调工作组在会议中指出,零售条线业务要在经营活动层面贯彻落实总行党委“三基”“三化”管理要求。今年7月至10月
2024-11-21 22:44:00
天眼看乌镇|贵州大数据集团首次亮相世界互联网大会
在2024年世界互联网大会乌镇峰会期间,云上贵州大数据(集团)有限公司(下称“贵州大数据集团”)携六大核心业务首次亮相
2024-11-21 23:12:00
2024年世界互联网大会乌镇峰会人工智能负责任开发与应用论坛举行
本文转自:人民网全国政协委员、中国网络空间安全协会理事长赵泽良发言。主办方供图人民网桐乡11月21日电 (记者赵竹青)11月21日
2024-11-22 00:11:00
本文转自:人民日报海外版《 人民日报海外版 》( 2024年11月22日 第 11 版)据新华社 (记者孟含琪)记者近日从中国科学院长春光学精密机械与物理研究所了解到
2024-11-22 04:36:00
香港身份规划机构哪家强?空格盛世教育值得一看
人人都希望获得香港身份。无论是为了子女的教育规划,还是个人的未来发展,拥有香港身份都带来了诸多优势。那么,如何挑选一个靠谱的中介来申请香港身份呢
2024-11-21 18:17:00
中国第一个充气式柔性密封舱太空试验成功!空间站、登月都用得着
快科技11月21日消息,据中国航天科技集团,该集团五院研制的充气式柔性密封舱,伴随实践十九号卫星完成了在轨飞行试验,任务取得圆满成功
2024-11-21 18:26:00
乐道2025年新车计划官宣:567座SUV全线齐发
快科技11月21日消息,乐道汽车总裁艾铁成近日通过微博宣布,2025年乐道品牌将推出两款新车型,包括一款六座/七座旗舰SUV和一款大五座SUV
2024-11-21 18:26:00
飞凡电车充电盖频繁自动打开关不上 车主下车怒锤充电盖
快科技11月21日消息,日前,有车主发布了一段上汽飞凡车主怒砸充电盖的视频,引起网友热议。视频中,一辆黑色的飞凡F7电动车在行驶中出现了充电盖板故障
2024-11-21 18:26:00
篡改猴Tampermonkey上架苹果商店!售价21元、Safari可用
快科技11月21日消息,用户脚本管理应用篡改猴(Tampermonkey)上架苹果App Store,售价为2.99美元(约合21
2024-11-21 18:56:00
龙芯处理器上太空了!龙芯天基云系统随天舟八号货运飞船发射成功
北京时间2024年11月15日23时13分,天舟八号货运飞船在我国文昌航天发射场点火起飞,南京航空航天大学李广侠团队研制的“基于天基计算的地面辐射源在轨定位试验载荷”——星眸载荷
2024-11-21 18:56:00
英伟达一天赚8套北京四合院!没有游戏就没有英伟达
北京时间11月21日,英伟达公布2025财年第三季度财报。英伟达第三季度营收351亿美元,同比增长93.7%。第三季度净利润193
2024-11-21 18:56:00
百度萝卜快跑累计超800万单!占全国超70%市场份额
快科技11月21日消息,百度集团发布了2024年第三季度的财务报告,显示公司总营收达到336亿元人民币,净利润为75.4亿元人民币
2024-11-21 18:56:00