• 我的订阅
  • 头条热搜
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
...染处理、感知交互、多人协作、网络传输和虚实融合等多模态人机交互专业技术的能力。专家表示,扩展现实技术(XR)包含了虚拟现实(VR)、增强现实(AR)以及混合现实(MR)等多个概念,目前,XR技术在游戏、电影等娱乐...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...,零一万物已经启动100B以上参数规模的模型训练,而多模态大模型团队已经集结了十多个人。“几周之内我们就有新的发布和大家分享。”李开复透露,“Yi”的定位是通用底座,同时,Yi系列量化版本、对话模型、数学模型、...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...与图像处理于一体的集成化SDK,提供AR视频技术、基于多模态感知与驱动的交互技术和基于重建的虚拟形象技术),持续以AI辅助、重塑社交环节,提升社交的效率和质量。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话...……更多
美的集团首席AI官唐剑:AI和智能机器人是家电行业巨大的机遇|新质生产力·AI Partner大会
...制,回答用户在家居领域的各类问题,以及与用户进行多模态交互,这就是所谓自然交互的能力。简单展示自然交互基于大模型自然交互落地案例,这个是实录视频,第一个视频是空调现控器,控制中央空调在内的各款空调在内...……更多
...GPT助手的,新的GPT支持图像、语音等很可能影响那些做多模态的,更遑论那些开发AI智能体或者做知识库扩充的等等。对中国的AI创业者来说,他们所面对的,也早已不是互联网和移动互联网时期的有路径可循。他们必须重新思...……更多
当生成式人工智能走向战场
...场景。目前,以ChatGPT-4.0为代表的生成式AI已经实现对多模态内容进行自动处理,能够针对不同的对话场景生成特定的文本、图片、音频等信息,还可以根据上下文自动生成与人类语言类似的对话,与用户进行密切交流。可以说...……更多
...究才取得了重大进展。该项目通过研究深度强化学习、多模态感知融合和智能决策等关键技术,通过构建无人机模拟器和物联网测试平台,优化无人机在复杂物联网环境中的路径规划、数据收集和抗干扰能力,提升无人机的自主...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...可导航价值。 直觉价值地图(Intuition Value Map):利用多模态大模型判断全景图中最适合移动的区域,并赋予更高可导航价值。 轨迹价值地图(Trajectory Value Map):赋予远离现有轨迹的区域更高的可导航价值。 通过对多源价值...……更多
3大品类 6大新品,AI贴近未来家庭 2024萤石春季新品发布会圆满落幕
...入户产品。萤石AI全自动三摄人脸视频锁DL60FVXPro首次将多模态交互系统融入智能锁领域,采用高算力芯片,实现了AI智能检测与云端协同的无缝对接。无论包裹到达或是儿童单独出门,本地模型即时响应,云端模型深度过滤,第...……更多
ChatGPT联合大数据分析脑机接口的研究热点与未来发展方向
...可塑性的发展,以提高脑机接口的适应性和稳定性。3. 多模态融合研究:目前脑机接口主要通过记录脑电信号来实现交互,但单一信号源的信息有限。为了更好地理解人脑活动和实现更精确的控制,未来的研究将探索多种模态信...……更多
对话科大讯飞刘聪:中美大模型的差距在缩小,GPT-5提升更多是在局部
...等。“不可能每一项都做到第一。”刘聪表示,讯飞在多模态方面将更加关注语音和OCR等,文生图优先级较低,文生视频不会专门去做,但会去做虚拟人。他提到,讯飞做大模型的目标和逻辑是做到第一梯队的头部,同时要把最...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...为 Llama 3 开发过程的一部分,Meta 团队还开发了模型的多模态扩展,使其具备图像识别、视频识别和语音理解的能力。这些模型仍在积极开发中,尚未准备好发布,但论文展示了对这些多模态模型进行初步实验的结果。7、Meta 更...……更多
...过手机移动端望舌面、问信息,采用人工智能算法进行多模态特征分析,即可出具详细的中医体质辨识报告,还能借助中医体质辨识理论增强大模型,提供健康信息的在线咨询服务,并给出体质与疾病(如肿瘤等)的专业资料参...……更多
本周(4.8-4.14)AI界发生了什么?
...源:论文论文链接:AI界前线马斯克旗下xAI发布其首款多模态大模型4月13日消息,马斯克AI初创公司xAI推出了其首款多模态大模型Grok-1.5V。除文本功能外,Grok现在可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
智能算力与通用算力的区别
...创新,尤其有利于自然语言处理大模型、视觉大模型和多模态大模型等高算力消耗模型的构建。除了大模型研发和创新,对于众多企业而言,他们还面临如何将大模型落地行业,解决现实复杂、琐碎场景中的应用问题。IDC调研显...……更多
外滩大会观察:AI产业实践呈现六大趋势 下一代超级应用是智能体
...的发展走向。端智能成 AI 应用的关键引擎。更专业的多模态小模型,在行业应用中取得比通用大模型更好的效果,硬件设备集成小模型,端侧AI逐步成熟,为超级应用的出现创造条件。异构算力助力抢跑大模型应用之战。AI时代...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
...在人工智能领域的主要产品是聚焦在自主研发的千亿级多模态通用人工智能大模型底座上的,该大模型具备文本、图像、音频、视频的深度理解与生成能力。”李涛告诉记者,APUS大模型已经应用于多个垂直领域,覆盖电商、医...……更多
AI大模型驱动周期演进加速,3D视觉感知打开机会空间
...。业界认为由此开启了机器视觉的GPT时刻,将推动跨视觉模态的场景应用,如自动驾驶、安防监控等。“在去年(2023年)上半年我还有一些顾虑甚至危机感:当AI厉害到输入什么数据都能得到很好的效果,是否可能就不需要我们3D...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
...过手机移动端望舌面、问信息,采用人工智能算法进行多模态特征分析,出具详细的中医体质辨识报告,还能借助中医体质辨识理论增强大模型,提供健康信息的在线咨询服务,并给出体质与疾病(如肿瘤等)的专业性资料参考...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
...还要对这些数据进行收集、清洗、整理;最后,应收集多模态数据,将不同数据归纳到一套语言体系中。“人工智能的模型架构仍需不断完善,数据集也要不断进化。应加强算力硬件设施建设,提升算法和算力水平。”刘良说,...……更多
中国科技创新“乘”数直上
...火V3.5在逻辑推理、语言理解、文本生成、数学答题、多模态等方面的能力均显著提升。同时,讯飞还发布了星火语音大模型和开源大模型。“大模型带来了语音技术发展的全新机会。”刘聪说。让机器具备学习、推理和决策的...……更多
视频应用或有惊喜!微软高管透露将于下周推出GPT-4
...亚斯·布劳恩透露,微软将在下周推出GPT-4,它是一个多模态模型,可以处理文本、图像、音频和视频。他表示,大型语言模型(LLM)已经适用于几乎所有语言,可以在一种语言中提出问题,然后在另一种语言中得到答案。[#zolspl...……更多
...科技界乃至全社会的关注热点。大众在对大语言模型、多模态混合模型等出色表现赞叹的同时,也对深入理解人工智能产生了浓厚兴趣,希望了解其原理、应用和发展趋势。目前,多家出版社都推出了人工智能相关图书,涵盖从...……更多
【科技早报】OpenAI 发布多模态预训练大模型 GPT-4;微软将推进1万人裁员计划
...1000亿元机器人关联产业规模。【大厂要闻】OpenAI 发布多模态预训练大模型 GPT-4。今日凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。据悉,GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字...……更多
更多关于科技的资讯:
奇瑞瑞虎8卓越版上市,推出多重购车福利
9月29日消息,今日奇瑞瑞虎8卓越版上市,官方指导价10.99万元至11.99万元。注意到,奇瑞还推出多重购车福利:限时购车至高享20000元现金红包
2024-09-30 02:54:00
壳牌宣布暂停挪威低碳蓝氢项目
9月29日消息,全球能源巨头壳牌公司宣布,其计划在挪威西海岸建设的低碳蓝氢项目将被搁置。该公司表示,做出这一决定的主要原因是市场需求不足
2024-09-30 02:58:00
《苍翼:混沌效应》手游首发入驻华为应用市场
9月29日消息,2D动作rogue游戏《苍翼:混沌效应》手游今日发售。本作采用免费下载,内容买断的形式,游戏内容包含当前PC版除联机协作外的几乎所有内容
2024-09-30 03:01:00
中国联通与诺基亚贝尔成立下一代光网络联合实验室
9月29日消息,中国联通与诺基亚贝尔在9月27日的第32届中国国际信息通信展览会上正式宣布,成立“下一代光网络联合实验室”
2024-09-30 03:06:00
腾讯《王者荣耀:世界》将于10月北京举办线下试玩体验
9月29日消息,腾讯游戏《王者荣耀:世界》官方今日发文宣布,将在10月北京王者荣耀周年庆的现场举办一场线下试玩体验活动
2024-09-30 03:07:00
比亚迪腾势d9“熊猫版”将登场,增加大面积熊猫涂装
9月29日消息,比亚迪旗下腾势汽车今天宣布,腾势D9“熊猫版”将于明天(30日)12:30-14:00正式登场。官方放出的预告图显示
2024-09-30 03:10:00
《彩虹六号》国服官网已上线,并放出“国服集结中”的宣传标语
9月29日消息,由腾讯代理、育碧研发的游戏《彩虹六号》国服官网现已上线,并放出“国服集结中”的宣传标语。游戏《彩虹六号》国服官方今年8月发文称
2024-09-30 03:13:00
minisforum铭凡展示迷你主机i/o接口配置
9月29日消息,MINISFORUM铭凡官方X平台账户北京时间本月26日展示了EliteMiniAI370迷你主机的外部I/O接口配置
2024-09-30 03:16:00
德国首款工业无人机投入批量生产,主要用于巡检场景
9月29日消息,德国大陆工程服务公司(CES)宣布旗下X4工业无人机已投入批量生产,号称是德国首款工业无人机。IT之家获悉
2024-09-30 03:21:00
漫步者花再halo2.0se音箱开售,支持3种音源输入方式
9月28日消息,漫步者花再Halo2.0SE多媒体音箱现已在京东开售,这款音箱号称拥有万种深渊灯光颜色,支持3种音源输入方式
2024-09-30 03:32:00
《easportfc25》正式发售,终极版448元
9月28日消息,EA足球游戏《EASPORTFC25》现已正式发售,登陆PC、PS4、PS5、XboxOne、XboxSeriesX|S和任天堂Switch平台
2024-09-30 03:40:00
山灵ua6便携解码耳放亮相,配备1.3英寸彩屏
9月29日消息,山灵UA6便携解码耳放今日亮相,该款耳放配备1.3英寸彩屏,拥有3.5mm和4.4mm双接口,售价1198元
2024-09-30 03:42:00
《死亡搁浅 2》计划于2025年发售,登陆PS5平台
9月29日消息,在今日的2024东京电玩展上,小岛工作室公布了《死亡搁浅2》游戏的新预告和CG预告,以及照片模式演示。《死亡搁浅2》计划于 2025年发售
2024-09-30 03:46:00
华为watchgt5系列手表弦月窗功能更新
9月29日消息,在9月24日下午的2024华为秋季全场景新品发布会上,华为WATCHGT5系列手表国行版正式发布,该系列手表拥有标准版和Pro版两款
2024-09-30 03:49:00
英伟达ceo黄仁勋:核电是一种出色的可再生能源
9月29日消息,据彭博社北京时间昨日报道,英伟达CEO黄仁勋在接受彭博电视台采访时表示,核电是满足数据中心节节增长能源需求的一种优秀选择
2024-09-30 03:50:00