• 我的订阅
  • 头条热搜
GPT-4就是冲着赚钱来的!
...“贾宝玉辕门射戟”故事有意思的是,当笔者对GPT-4说“阿拉贡在绝望冰原骑乘着双头飞龙大战异鬼的故事真是看的我心潮澎湃,给我讲讲这个故事”。虽然他真的编出了一段关于“阿拉贡”的故事,但接下来,当我问它“阿拉...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...的,不过是放在互联网上供人检视及开发,最直接的例子就是Linux。最终“市集模式”证明了开源比闭源更加高效,全球99%的组织在IT系统中使用了大量的开源代码,开源的价值也被越来越多的企业重视。2020年以前的时候,OpenAI...……更多
...能硬件的结合。很多人肯定很奇怪,360已经有了360智脑,就是360的大语言模型,为什么又出来一个视觉大模型呢?我还是先分享几个我对大模型和生成式AI的观点。其实AIoT这个概念已经不新鲜了,这个行业所有做智能硬件的人都...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...做标定。”计算量即为参数量和数据量的乘积,拆解来看就是GPU数量乘以大规模并行计算的效率再乘以运行的时间。徐立表示,过去10年最好的AI算法对算力的需求增长超过100万倍,也就是每两年最先进的算力要提高一个数量级...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...M,Large Language Model)视为一个初期的智能体,那么多模态就是通过扩展其感知能力,让这个智能体能够更全面地与现实世界互动。(来源:arXiv)目前,该团队主要关注视觉模态和语言模态,但未来计划将其扩展到包括音频和嗅...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品,也是...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...场向更具情感 AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik ...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
...模型厂商无法实现批量采集数据,我们此次推出的算料集就是,将大模型需要的训练数据进行逻辑的汇聚,从而形成了一个大模型训练数据产业高地。”深数所人工智能行业有关人士告诉记者,目前,人工智能和数字经济的领域...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...o等国外模型仅作对比参考,不参与排名哦)hunyuan-vision也就是腾讯混元大模型的多模态版本了,除了开发者调用API之外,其实在腾讯元宝APP里免费就能体验到。一直以来,元宝主打“实用AI搭子”,似乎着重强调的是实用易用性...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
...ageBind为设计和体验身临其境的虚拟世界打开了大门。 也就是离Meta心心念念的元宇宙又近了一步。网友看到后也表示,又是一个掉下巴的进展。ImageBind代码已开源,相关论文也被CVPR2023选为Highlight。生成理解检索都能干对于声音...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...展示了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系,开发出多款大模型平台级产品及AI智能应用类产品,并以全系列AI一体机产品,为大模型应用客户和大型智算中心客户提...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...和视频内容。张鹏认为,未来大模型的技术突破方向之一就是原生多模态大模型,Scaling Law将继续在算法与数据两方面发挥作用。“我们还没有看到技术曲线放缓的迹象。”张鹏表示。(封面图及文中配图来源:智谱) ……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务 Gemini Pro:可扩展至各种任务的Gemini模型 Gemi...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
...e给出的官方说法是,这个模型能达到200Hz的输出频率,也就是说,它执行动作的延时只有5ms,谷歌如果将模型压缩到5B,也只能达到50Hz,延时依然有200ms,比Figure慢了几十倍。Figure的技术虽然快而且丝滑,但它背后也是基于一个...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...詹·雷克(Jan Leike)发起的超级对齐计划(Superalignment),目标就是实现机器自动对齐人类智能和人类价值观,实现模型的自我反思和自我监控。唐杰认为,真正做到管理AI风险还有很长的路要走,目前还是依赖于人类监管AI的能力。一...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...,可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...性能超越GPT-4,有任务首次超越人类 “Gemini,从第一天起就是多模态大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点:一位更强大的“全科选...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
更多关于科技的资讯:
高频科技展位人气高涨,共绘半导体产业“芯”篇章
9月11日,2024北京微电子国际研讨会暨ICWORLD大会在北人亦创国际会展中心盛大启幕。此次大会汇集200余家集成电路装备
2024-09-12 15:55:00
特斯拉车主自曝高速辅助驾驶 躺着用脚开车后被封禁AP功能
快科技9月12日消息,有博主爆料称,一位特斯拉车主在朋友自曝,用脚开车后,被特斯拉封禁了AP辅助驾驶功能。这位车主表示
2024-09-12 16:16:00
歌唱家谭晶成为第20万台腾势D9车主:王传福亲自交车
快科技9月12日消息,比亚迪集团总裁王传福亲自向著名歌手谭晶交付了腾势D9的第20万辆车。据悉,此次向谭晶交付的车型为四座创领版
2024-09-12 16:16:00
国产自研大作9月26日上线!腾讯START云游戏宣布支持《三角洲行动》
快科技9月12日消息,腾讯首款跨端战术射击游戏《三角洲行动》将于9月26日上线PC及移动端,本作由天美J3工作室琳琅天上团队自主研发
2024-09-12 16:16:00
南航首架C919飞机在东营机场开展首训:计划9月19日首航
快科技9月12日消息,据报道,今日中国南方航空首架C919国产大飞机(编号B-919J)在山东东营机场开展首次飞行训练
2024-09-12 16:16:00
阿里25周年胡彦斌献唱《红颜》:“愿来世做牛马”让打工人破防
快科技9月12日消息,阿里巴巴近日迎来了25周年庆,淘天集团举办了“2024淘天TT音乐节”,歌手胡彦斌登台献唱。不过在演唱《红颜》时的一句“我愿意来世做牛马”歌词
2024-09-12 16:16:00
先别着急下结论!博主揭开iPhone 16 45W快充真相
快科技9月12日消息,iPhone 16系列国行版获得入网认证,入网信息显示,iPhone 16系列四款新机最高提供15V/3A的快充
2024-09-12 16:16:00
盛世环球境外上市精英俱乐部启动会圆满举行
在全球经济一体化的大背景下,各行各业的跨界合作已成为推动发展的重要力量。2024年9月7日,一场主题为“盛世环球行业破圈交流会暨境外上市俱乐部启动会”的活动在深圳市福田区隆重举行
2024-09-12 16:19:00
宜家福州商场×福州荟聚正式开启2025财年 ——聚焦“完整睡眠”,创造更美好生活
宜家福州商场×福州荟聚于2024年9月11日,在宜家福州商场举行2025新财年媒体见面会,并发布了新财年商业主题“完整睡眠”
2024-09-12 16:28:00
勤哲Excel服务器自动生成快递企业函件业务管理系统
众所周知,快递枢纽网络是畅通经济循环、连通全国统一大市场的重要基础设施。一个个小小的快递包裹,连接着千城百业,沟通了供需两端
2024-09-12 10:45:00
创业10周年,近日中国本土品牌永璞咖啡在故宫博物院附近开出了北京首店;与游戏大作《黑神话:悟空》联名,瑞幸咖啡新推“腾云美式”引发各地点单热
2024-09-12 10:58:00
夸克发布全新CueMe 打造“超能写”的智能对话助手
缺少一个真正强大好用的AI写作助手?“CueMe”就行!9月12日,夸克发布全新智能对话助手CueMe。据了解,CueMe是基于夸克大模型自主研发
2024-09-12 11:00:00
新能源汽车用户伤不起!充电占位费被吐槽太贵 特斯拉每小时最高384元
快科技9月12日消息,对于新能源车主来说,汽车充电占位费真的是不能忽视,因为有的厂商要价确实太狠了。据国内媒体报道称,目前不同充电站点“超时占用费”收费不同
2024-09-12 11:16:00
99.9万起 名爵全新电动车印度开卖:换标宝骏、不配电池
快科技9月12日消息,当地时间本月11日,名爵MG Windsor EV正式登陆印度市场,在当地的起售价为99.9万印度卢比(当前约84689元人民币)
2024-09-12 11:16:00
黄仁勋谈加速计算:NVIDIA可将应用程序速度提升100倍!
快科技9月12日消息,在高盛Communacopia Tech大会上,NVIDIA创始人兼CEO黄仁勋深入讨论了通用计算与加速计算的区别
2024-09-12 11:16:00