• 我的订阅
  • 头条热搜
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
AIGC工具测评:生成式AI的产品表现如何
...力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格,其简洁的设计语言和优化的...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
科大讯飞股价跌停,市值蒸发120亿元
...升9%,其次是逻辑推理(8%),文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时,七大能力大幅度提升,其中语言理解能力提升78%,文本生成、知识问答、数学能力等提升也超70%,逻辑推理能...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...任务、中英双语、针对大语言模型长文本理解能力的评测基准)测试中,360选择其中与中文长文本应用最密切相关的中文单文档问答、多文档问答、摘要、Few-shot等任务进行评测,360Zhinao-7B-Chat-32K模型取得了平均分第一的成绩。...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,检测是否发生危害。 研究过程Anthropic在工具使用和多模态的工作,为AI识别和解释图像奠定了基础。在此基础上,Claude还需要推理如何以及何时根据屏幕内容执行操作。为此,研究者训练Claude准确计算像素,从而完成命令,...……更多
产品角度分析GPT-4的更新及影响
...现之间是有区别的,一定要弄清楚这个概念!!虚假的多模态LLM:LLM本身不理解图像,我们先用一些图转文的工具(例如CLIP),把图片转成文字,再将这个文字拼接进Prompt中,例如“我刚给你发了一张图,图的内容是一只黑色...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多...……更多
生成式AI在金融行业的应用及思考
...金融行业也有广泛应用。值得一提的是,张呈刚强调了多模态场景在金融行业的应用趋势。传统的人机交互方式是文本,但现在人们越来越倾向于使用图像、语音等多模态方式与生成式人工智能进行交互,这给金融行业带来了新的机...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...精准,也让智能化辅学更有针对性更高效;也结合本次多模态能力升级了百科问答功能,星火大模型理解并融合了大量图书知识,对于孩子的奇思妙问等复杂问题,“爱因斯坦”和他的大咖虚拟人朋友都能回答,让孩子们在趣味...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力,特别是题目包含图像的考题 —— 这对医疗人工...……更多
星火大模型v3.5发布,带来七大能力提升
...为教师的“AI助手”。据官方介绍,星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”,教师使用粉笔在智慧黑板旁边的传统黑板上书写时,板书内容可以同步...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...的?后训练功不可没从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以...……更多
...家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
...四川省两会新闻报道的专业大模型。“Chat两会”通过多模态理解、内容生成、智能交互的AI核心能力,提供“智库型”两会热点问答服务。智能对话、深度交互,不少代表委员感叹,这个工具“太香了”。“Chat两会”也获得AI业...……更多
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...精力进行解析,能够识别出其中的文本、图表、图片等多模态内容,同时将这些图表、图片信息做了相应的检索库。此外,天工AI还构建并搭载了分钟级的信源收录系统,能够更快地收集全网高价值信息;构建了自研搜索引擎、...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...期版本,并接近最新版本的表现。此外,GLM-4还增强了多模态能力,其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store,为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多
更多关于科技的资讯:
三星启动hbm4开发,采用DRAM制程的基础裸片
据韩国媒体MK报道,三星已经启动了HBM4的开发,并且可能将为Meta和微软这两大AI云服务巨头提供定制的HBM4内存
2024-11-16 19:25:00
新款redmik80系列定位提升,采用居中开孔直屏
Redmi张一帆预热K80系列,称K80系列超强的产品力,这次又又又稳了。据悉,新款RedmiK80系列包括RedmiK80和RedmiK80Pro两款手机
2024-11-16 19:25:00
南海网11月16日消息(记者 梁振文)11月16日,记者从儋州市商务局获悉,儋州积极响应消费品以旧换新的号召,聚焦新能源汽车
2024-11-16 19:27:00
雷军发文感谢消费者,安卓手机销量冠军
11月12日消息,在刚刚过去的双11购物狂欢节中,小米公司再次取得了令人瞩目的销售业绩。据小米官方发布的数据,全渠道累计支付金额已突破319亿元
2024-11-16 19:30:00
努比亚z70ultra正式发布,搭载一块1.5K真全面屏
努比亚官方今天正式宣布,将于11月21日14:00召开新品发布会,推出新旗舰——努比亚Z70Ultra。官方预热海报贴出了“反孔精英AI战神”的Slogan‌
2024-11-16 19:31:00
小米手机副总裁金凡预告,ios“打破生态间隔”的功能
2024年9月,iOS18正式发布。因在多个功能上与国内Android系统走得很近,大有“心有灵犀”的感觉,iOS18也被不少人称作“抄袭安卓”
2024-11-16 19:34:00
疑似OPPO Reno13系列镜组布局曝光
在今天与网友的互动中,数码博主数码闲聊站曝光了疑似OPPOReno13系列手机的镜组布局图片。根据该图片来看,OPPOReno13系列采用小面积矩阵镜组设计
2024-11-16 20:03:00
骁龙 8 至尊版 2 代芯片迎超前爆料
近日首批骁龙8至尊版旗舰机型陆续发布,凭借不俗的性能表现赚足眼球。与此同时,外媒爆料人士Jukanlosreve带来了关于骁龙8至尊版2代芯片的超前爆料
2024-11-16 20:03:00
荣耀 300 Pro 配置曝光
在今天与网友的互动中,数码博主数码闲聊站透露了荣耀300Pro的主要配置。据悉,荣耀300Pro将会搭载高通骁龙8Gen3处理器
2024-11-16 20:03:00
一加 Ace 5 更多配置细节曝光
次旗舰机型中,一加Ace系列凭借不俗的性能配置以及大电池方案一直有着较高的市场关注度。而在近日数码博主数码闲聊站对一加Ace5的更多配置细节再度进行了相关爆料
2024-11-16 20:04:00
小米 15 Ultra 镜组布局图曝光,超大面积四摄方案加持
近日,一张疑似小米15Ultra的镜组布局图被曝光出来。该图展示了小米15Ultra在无背面盖板下的布局方案,可以看出
2024-11-16 20:04:00
荣耀 300 系列更多配置曝光
今天晚些时间,数码博主数码闲聊站表示,荣耀多项旗舰级规格配置下放,预计将会应用在即将发布的荣耀300系列手机上。具体规格包括“荣耀下放1
2024-11-16 20:04:00
OPPO Reno13 系列真机正面曝光,超窄边直屏方案
今天,数码博主数码闲聊站曝光了OPPOReno13系列手机的正面照。根据图片来看,OPPOReno13系列正面采用了同级别少见的极窄边框
2024-11-16 20:04:00
iQOO Neo 10 系列进入官方预热阶段
近日,各大安卓阵营的首批新一代旗舰机型已经陆续登场,不过此波新机潮尚未结束,多款子系列次旗舰机型、线下机型的发布计划也在有序推进中
2024-11-16 20:04:00
卢伟冰回应小米15pro售价:3开头的价格还是交给redmi
小米15Pro售价公布后,卢伟冰在发布会上不小心将5299元说成“3000”,引起现场一片欢呼。近日,他在直播中对此事进行了回应
2024-11-16 20:05:00