• 我的订阅
  • 头条热搜
GPT-4就是冲着赚钱来的!
...“贾宝玉辕门射戟”故事有意思的是,当笔者对GPT-4说“阿拉贡在绝望冰原骑乘着双头飞龙大战异鬼的故事真是看的我心潮澎湃,给我讲讲这个故事”。虽然他真的编出了一段关于“阿拉贡”的故事,但接下来,当我问它“阿拉...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...M,Large Language Model)视为一个初期的智能体,那么多模态就是通过扩展其感知能力,让这个智能体能够更全面地与现实世界互动。(来源:arXiv)目前,该团队主要关注视觉模态和语言模态,但未来计划将其扩展到包括音频和嗅...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品,也是...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
...模型厂商无法实现批量采集数据,我们此次推出的算料集就是,将大模型需要的训练数据进行逻辑的汇聚,从而形成了一个大模型训练数据产业高地。”深数所人工智能行业有关人士告诉记者,目前,人工智能和数字经济的领域...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...展示了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系,开发出多款大模型平台级产品及AI智能应用类产品,并以全系列AI一体机产品,为大模型应用客户和大型智算中心客户提...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务 Gemini Pro:可扩展至各种任务的Gemini模型 Gemi...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
...e给出的官方说法是,这个模型能达到200Hz的输出频率,也就是说,它执行动作的延时只有5ms,谷歌如果将模型压缩到5B,也只能达到50Hz,延时依然有200ms,比Figure慢了几十倍。Figure的技术虽然快而且丝滑,但它背后也是基于一个...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...詹·雷克(Jan Leike)发起的超级对齐计划(Superalignment),目标就是实现机器自动对齐人类智能和人类价值观,实现模型的自我反思和自我监控。唐杰认为,真正做到管理AI风险还有很长的路要走,目前还是依赖于人类监管AI的能力。一...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...,可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...性能超越GPT-4,有任务首次超越人类 “Gemini,从第一天起就是多模态大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点:一位更强大的“全科选...……更多
...形机器人。爆发节点接受采访时,王仲远常强调的一件事就是,智源研究院要做企业没做过的事,要做“不可能”,要做真正的技术突破和原始创新,王仲远说,这是智源的一个重要使命。对原始创新的追求贯穿于研究始终。比...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...景落地提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力,商汤多模态大模型的图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...正好印证了这个论断。但Gemini的发布惊艳世人,改变了大模型领域ChatGPT独领风骚的局面。Gemini 不仅在很多性能上超过了ChatGPT 4,它同时带来了另一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...」的意思。相比AlphaFold系列,ESM3有什么竞争优势?首先就是Meta团队轻车熟路的——开源。 虽然模型API仍处于内测阶段,需要申请试用资格,但模型代码已经放到了GitHub上。而且公司还会与AWS和英伟达云计算平台合作,方便开...……更多
...国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行输出,...……更多
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...信证券研究部4)智能客服。ChatGPT最适合直接落地的项目就是智能客服类的工作。根据模型现有的完成度,在垂直行业针对性的做人工反馈训练,ChatGPT就可以落地为智能客服产品,在to C场景中率先应用。对比目前的智能客服,Ch...……更多
联想戴炜:如何跨越多模态大模型产业应用的最后一公里
...算单元形成的算力中心向资源化算力需求供应转变,这也就是算力网络。算力网络为用户提供了集成了算力、网络、存储等一系列企业算力需求的服务,可以让企业和社会机构可以摆脱自身对算力建设不平衡的难题,更加专注于...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...数据增强方法由于其缓解过拟合的特性,而被广泛使用在模型训练过程中,例如图像的旋转、缩放、颜色的改变等等。然而,美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性,色调(Hue)的变化却...……更多
更多关于科技的资讯:
枣庄高新投资集团完成枣庄市首单数据产品全国挂牌及数据资产入表
当前,数据已成为与土地、劳动力、资本、技术并称的五大生产要素之一,具有巨大的开发潜力。为进一步释放数据要素价值,近日,枣庄高新投资集团在全国性数据交易平台——北京国际大数据交易所完成了枣庄市首单数据产品挂牌
2024-07-01 08:46:00
夏普发布lcd屏新机,华为平板来了
不知道还有多少在坚守LCD屏幕手机的小伙伴?经常每隔一段时间就能看到有小伙伴感慨机圈很少看到LCD屏,诚然,目前LCD主要集中在中低端手机市场上
2024-07-01 08:42:00
redmik70至尊版、iqooneo9spro+亮相
根据行业的信息RedmiK70至尊版、iQOONeo9sPro+都将在7月份正式商用。这两款机型虽然现在的信息不多,但是亮点却提前曝光出来
2024-07-01 08:42:00
妈妈是清华的儿子也是清华的 网友点赞:优秀
7月1日消息,微博话题“妈妈是清华的儿子也是清华的”上了热搜榜。据国内多家媒体报道,在清华大学2024年本科生毕业典礼上
2024-07-01 09:11:00
红米turbo3再次优惠,性价比之最
今年的618也刚刚结束不久,从手机的整体销量情况来看,性价比依然占据主流,也就是说性价比高的手机依旧是很多人的第一选择
2024-07-01 08:49:00
真我13pro+海外版核心参数彻底曝光
6月30日,真我13Pro+海外版入网,其核心参数彻底曝光:和真我12Pro+相比,性能和续航组合都有提升,并且机身变得更轻更薄
2024-07-01 08:48:00
夏普推出5.7英寸lcd小屏手机
最近几年,小屏LCD手机逐渐淡出大众视野,智能手机似乎被大屏、高性能旗舰机型主导。然而,夏普却反其道而行之,最新推出5
2024-07-01 08:55:00
华为matex5夏日特惠,带来三重惊喜
当夏日的激情与科技创新相遇,华为MateX5折叠屏旗舰手机以一场别开生面的夏日特惠,引领智能设备的新风尚。这款集超前设计
2024-07-01 08:51:00
中国经济网北京7月1日讯美股上周五收跌,截至收盘,道指跌45.20点,跌幅为0.12%,报39118.86点;纳指跌126
2024-07-01 09:22:00
AI苦工卷向高学历,美国博士正在抢走印度人工作
美国人马特拥有通信博士学位,他最近喜提一份自由职业:成为Scale AI公司的一员,在家训练AI模型。“通信博士”“训练AI模型”
2024-07-01 08:55:00
骁龙8gen3到底贵不贵?三个维度告诉你答案
最近,有的厂商发布了新机,是一款骁龙8Gen3手机,配置齐满,售价3199元起。其实到了618之后,再等3个月,苹果、骁龙的新机就都该陆续出现了
2024-07-01 08:50:00
AI正在抢走谁的工作?一个人使用ChatGPT取代了60名员工
新智元报道编辑:庸庸 乔杨【新智元导读】ChatGPT发布一年多来,总是有人担心自己的工作会被取代,但最后总是演变成「狼来了」的故事
2024-07-01 08:56:00
年销售15694.6万台!董明珠回应小米空调销量第一底气:格力空调国内常年第一
快科技7月1日消息,近日,董明珠公开回应小米空调销量超格力:称小米“空调第一”不实。近期网上有一些文章和短视频说小米空调销量超过了格力空调
2024-07-01 09:11:00
Meta低头,库克认错,XR回归第一性原理
图片|Photo by Maxim Hopman on Unsplash©自象限原创作者丨罗辑2024年,XR的故事应该怎么讲
2024-07-01 08:56:00
中兴天机a41,降价幅度高到让人难以想象
说到性价比手机,各位可能对今年618期间红米手机降价印象深刻,可互联网如此之大,有些事情各位如果不去挖掘,是根本不会发现惊喜的
2024-07-01 09:05:00