• 我的订阅
  • 头条热搜
GPT-4就是冲着赚钱来的!
...“贾宝玉辕门射戟”故事有意思的是,当笔者对GPT-4说“阿拉贡在绝望冰原骑乘着双头飞龙大战异鬼的故事真是看的我心潮澎湃,给我讲讲这个故事”。虽然他真的编出了一段关于“阿拉贡”的故事,但接下来,当我问它“阿拉...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...的,不过是放在互联网上供人检视及开发,最直接的例子就是Linux。最终“市集模式”证明了开源比闭源更加高效,全球99%的组织在IT系统中使用了大量的开源代码,开源的价值也被越来越多的企业重视。2020年以前的时候,OpenAI...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...做标定。”计算量即为参数量和数据量的乘积,拆解来看就是GPU数量乘以大规模并行计算的效率再乘以运行的时间。徐立表示,过去10年最好的AI算法对算力的需求增长超过100万倍,也就是每两年最先进的算力要提高一个数量级...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...M,Large Language Model)视为一个初期的智能体,那么多模态就是通过扩展其感知能力,让这个智能体能够更全面地与现实世界互动。(来源:arXiv)目前,该团队主要关注视觉模态和语言模态,但未来计划将其扩展到包括音频和嗅...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品,也是...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
...模型厂商无法实现批量采集数据,我们此次推出的算料集就是,将大模型需要的训练数据进行逻辑的汇聚,从而形成了一个大模型训练数据产业高地。”深数所人工智能行业有关人士告诉记者,目前,人工智能和数字经济的领域...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
...ageBind为设计和体验身临其境的虚拟世界打开了大门。 也就是离Meta心心念念的元宇宙又近了一步。网友看到后也表示,又是一个掉下巴的进展。ImageBind代码已开源,相关论文也被CVPR2023选为Highlight。生成理解检索都能干对于声音...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...展示了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系,开发出多款大模型平台级产品及AI智能应用类产品,并以全系列AI一体机产品,为大模型应用客户和大型智算中心客户提...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务 Gemini Pro:可扩展至各种任务的Gemini模型 Gemi...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
...e给出的官方说法是,这个模型能达到200Hz的输出频率,也就是说,它执行动作的延时只有5ms,谷歌如果将模型压缩到5B,也只能达到50Hz,延时依然有200ms,比Figure慢了几十倍。Figure的技术虽然快而且丝滑,但它背后也是基于一个...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...,可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...性能超越GPT-4,有任务首次超越人类 “Gemini,从第一天起就是多模态大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点:一位更强大的“全科选...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...景落地提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力,商汤多模态大模型的图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...正好印证了这个论断。但Gemini的发布惊艳世人,改变了大模型领域ChatGPT独领风骚的局面。Gemini 不仅在很多性能上超过了ChatGPT 4,它同时带来了另一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优...……更多
...国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行输出,...……更多
联想戴炜:如何跨越多模态大模型产业应用的最后一公里
...算单元形成的算力中心向资源化算力需求供应转变,这也就是算力网络。算力网络为用户提供了集成了算力、网络、存储等一系列企业算力需求的服务,可以让企业和社会机构可以摆脱自身对算力建设不平衡的难题,更加专注于...……更多
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...信证券研究部4)智能客服。ChatGPT最适合直接落地的项目就是智能客服类的工作。根据模型现有的完成度,在垂直行业针对性的做人工反馈训练,ChatGPT就可以落地为智能客服产品,在to C场景中率先应用。对比目前的智能客服,Ch...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...数据增强方法由于其缓解过拟合的特性,而被广泛使用在模型训练过程中,例如图像的旋转、缩放、颜色的改变等等。然而,美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性,色调(Hue)的变化却...……更多
...太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声音等。一个智能系...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为,开源模型加上移动设备的本地数据,即本地化的原生 LLM,...……更多
GPT-4撞上文心一言,百度压力骤增:多模态和中文能力受关注,或多种方式落地
...此前透露的情况来看,其大概率还处于文本处理阶段,也就是和早前版本的Chat-GPT一样仅能进行对话互动的任务,此次将不会是一个多模态大模型。近些年,多模态已经成为人工智能发展的重要趋势,它包含文本、图像、音频和...……更多
更多关于科技的资讯:
iPhone 16 Pro Max电池能量密度得到显著提升
近日,科技界掀起了一股关于苹果新款iPhone16ProMax的讨论热潮。这款备受瞩目的智能手机,据天风国际证券分析师郭明錤的最新报告指出
2024-05-18 09:36:00
荣耀200系列官宣:配色独特
都说线上手机市场中的竞争非常的夸张,但实际上来说,线下市场中也是暗流涌动,这几年有很多品牌都进行了疯狂发力。无论是荣耀数字系列还是vivoS系列
2024-05-18 09:37:00
微软有望今年秋季发布Windows 11 24H2更新
5月18日消息,微软公司今天发布了适用于 Windows11 24H2的更新KB5037783,这也是24H2第2个更新
2024-05-18 09:32:00
iphone16系列即将迎来双喜
在今年的手机市场中来看,iPhone手机想取得高热度真的变得很困难,因为国产手机的疯狂崛起,已经让苹果产品的压力变得很大
2024-05-18 09:43:00
watchOS 10.5 正式版更新了哪些内容?
随着苹果公司5月14日向用户推送的iOS17.5正式版、AppleWatch用户推送watchOS10.5正式版已经3天
2024-05-18 09:46:00
科技突破的真谛,中兴axon60ultra卫星通信技术有多强
这几天,关于南海邻居串门的事情,几度冲上热搜,也吸引了全球的目光。老外都在等着看热闹,可我们蜀黎略微出手就让小菲落荒而逃
2024-05-18 09:51:00
5月16日至19日,天津国际家居博览会在国家会展中心(天津)举办,主题为“焕新促消费,服务新格局”。展会规模近7万平方米
2024-05-18 12:01:00
嘉盛环境一季度达成率超100%,持续引领中国工业除湿行业
2024年5月中旬,江苏嘉盛环境设备制造有限公司一季度经营会于中国常州溧阳总部召开。嘉盛集团总经理出席会议,集团各部门
2024-05-18 10:00:00
vivox100s性能测评报告:性能和游戏体验一流
就在日前,vivo为大家带来了全新的旗舰手机vivoX100s,引起了很多数码爱好者的关注。这款手机是X系列的最新成员之一
2024-05-18 10:03:00
opporeno12系列这几个小细节很能打动消费者
在当下智能手机领域参数其实是完全可以忽略的,只有定位相同的机型三大核心元器件都不会差太多,往往决定消费者购买的是细节的东西
2024-05-18 10:06:00
腾讯汤道生:打破AI“落地玻璃”,让可见变为可用
本文转自:新华网腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生5月17日,“腾讯云生成式AI产业应用峰会”在北京举办
2024-05-18 10:29:00
中国·太原国际汽车展览会
5月16日,为期5天的2024中国·太原国际汽车展览会在晋阳湖国际会展中心开幕,数十家品牌、千余款车型参展。张昊宇 摄
2024-05-18 10:45:00
OpenOS:灵活且高度可定制可扩展的开源开放共识操作系统
在信息互联网,我们都了解Windows、linux、MacOS、Android等单机操作系统。在价值互联网世界里,同样需要各种操作系统
2024-05-18 10:58:00
万达商管南区亮剑!“王炸级”双平台赋能,开拓新版图
摘要:从万达商管南区品牌峰会,解锁“全能”万达纵览国内商业地产玩家,万达一直是其中自成一派的先行者。从业内闻名的“万达效率”
2024-05-18 11:02:00
魅族发布新机:骁龙8gen2平台+5500mah大电池
近日,魅族召开了FlymeAIOS暨魅族21Note手机发布会。令人出乎意料的是,魅族竟然赶在今年618前一个月就发布了新机
2024-05-18 11:09:00