• 我的订阅
  • 头条热搜
文博会观察:大模型为文化产业发展提供新机遇
...前来互动。“面向文化创作领域,腾讯混元正积极发展多模态模型,以进一步加强文生图、文生3D以及文或图生视频能力。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏举例子表示,面对内容制作行业多样化需求,腾讯混元在...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...文件上传,而此前是只能进行文字输入,也就是新增了多模态理解,不过网页搜索功能仍未上线,这点倒是让人感到遗憾。对于o1满血版的提升,OpenAI的CEO奥特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
不要小看「实而不华」的腾讯 AI
...未来的战略思路。01模型侧:基础模型能力升级,构建多模态能力首先是基础模型方面,5 月 17 日的峰会上,腾讯混元介绍了其多尺寸的 LLM 模型矩阵。其中,最大模型已拓展至万亿级参数规模,并在 1B、3B、7B、13B 等不同参数量...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...云自主研发了首个专注于气候变化适应领域的水-能-粮多模态推理大模型——洛书。该模型集成训练并整合了科研人员自主研发的可解释AI驱动水能耦合模型“思源”,通义千问最新推理模型Qwen-QwQ和通义千问多模态大模型Qwen2.5-V...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...现得更好吗? Q2: HOVER 能比其他训练方法更有效地训练多模态仿人机器人控制器吗? Q3: HOVER 能否在真实世界的硬件上实现多功能多模态控制?与专家策略的对比该团队在不同控制模式下比较了 HOVER 和相应专家策略的表现。以 ExB...……更多
基于昇腾AI的大模型联合创新正式启动,华为携手26家行业领军企业、高校及科研院所共促产业数智化升级
...用。中科院自动化所发布基于昇腾AI的“紫东太初”2.0全模态大模型,在语音、图像和文本三模态的基础上,加入视频、信号、3D点云等模态数据,研究突破了认知增强的多模态关联等关键技术,具备全模态理解能力、生成能力...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图...……更多
大模型如何开始生成一个全新时代
...了关于大模型的基本共识:大模型是大语言模型,也是多模态模型,或者是生成式预训练转换模型。GPT是大模型的一种形态,引发了人工智能生成内容技术的质变。大模型是人工智能赖以生存和发展的基础。现在,与其说人类开...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
...智能性、安全性等维度开展,涵盖语言、语音、视觉等多模态领域,旨在建立大模型标准符合性名录,引领人工智能产业健康有序发展。【来源:凤凰网科技】返回搜狐,查看更多责任编辑: ……更多
提质降价,国产大模型加速奔跑
...主任工程师程莹认为,国产大模型技术在语言、视觉、多模态等领域持续突破,在文本、音频、视觉、3D等数据方面实现多模态统一,持续突破人工智能感知、理解和推理世界的能力边界。这些,拓展着大模型与各行各业融合的...……更多
分子之心公布达尔文大模型新进展
...模型拥有百万级参数,学习了万亿级高质量、多层次、多模态的大数据,融合自然语言与蛋白语言,力图高精度、低门槛、高通用性地满足创新药设计、合成生物学等真实产业应用需求,大幅提升蛋白质设计的效率和成功率。New...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
...融(以下简称“海尔消金”)以AI技术为利刃,深度挖掘多模态数据价值,实现信用评估与业务增长的双向赋能。通过构建“AI信用”体系,海尔消金打造了一条风控与增长的高质量发展路径。海尔消金的AI实践以多模态融合为核心...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多
...域发挥更大作用。作为我国首个存储千亿参数的图文音三模态大模型,第一代紫东太初人工智能大模型在2021年问世时实现了无标识的图像、文字、语音的识别能力,这次发布的新一代大模型则升级融入了视频、传感信号、3D点云...……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...社交音乐舞蹈类AIGC应用 具体来说,鹦鹉人是一款基于多模态AI大模型PARO构建的,聚焦虚拟数字人形象、虚拟唱歌、虚拟舞蹈、虚拟陪伴和语聊的消费级AIGC应用。用户上传照片后,即可在鹦鹉人APP中生成个性化的3D虚拟形象。系...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现智能涌现。”刘庆峰表...……更多
刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI
(图片来源:林志佳拍摄)国内活跃度最高的AI大模型应用正走向“多元化”。12月3日消息,钛媒体AGI获悉,字节跳动豆包日前上线了一项实用功能——图片理解。目前,豆包APP及豆包PC新增照片及相机按钮,上传图片后可识别...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...或者语音的交互。这促使我们思考:如何构建具有更丰富模态的3D自主角色呢?要实现这个目标,主要面临两个挑战:1. 3D角色需要准确观察和理解用户行为信息,并基于上下文和角色设定通过语音、肢体动作和表情做出合适的回应...……更多
自主研制!我国发布“全球首个”
...。 “空天·灵眸”2022年首次推出,是我国:首个面向多模态遥感数据生成式基础模型;首个专为遥感领域打造的专业基础模型。今年3月起,研究团队基于中国算力网“鹏城云脑II”枢纽节点,历时数月攻关完成了在4亿张国产化...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...模和处理,提升模型的准确性和专业能力,更好地适应多模态数据及复杂/特定任务计算。二是根据任务的需求灵活选择并组合适宜的专家模型,使得模型能够动态地适应不同的输入样本和任务场景,提高模型的灵活性、可解释...……更多
...大模型则是 OpenCSG 算法团队正在研发中的开源大模型、多模态大模型和垂类模型系列,优势在于开源协议友好、工具链完整,并针对特定垂类场景进行优化。除了建设开源社区,OpenCSG过去数月还在多个行业推出大模型应用解决...……更多
依图科技“天问”大模型赋能安防,智慧应急跨越式发展
...防行业正经历着前所未有的变革。作为应用人工智能和多模态大模型的先锋领域,安防行业不仅展示了其强大的产业基础,更在发展新质生产力方面彰显出卓越的能力和潜力。依图科技,作为AI领域的先行者和创新者,多年来一...……更多
紧握根技术竞速大模型
...幅竹林水墨画……峰会上,中科院自动化研究所发布的全模态大模型“紫东太初”2.0现场展示的图像生成能力令人惊叹。除了支持图像生成,“紫东太初”2.0还支持多轮问答、文本创作、3D理解、信号分析等跨模态任务,例如在...……更多
让甲骨文“开口说话”:AI技术赋能文化传承
...)发布博文,宣布该校团队正尝试利用人工智能(AI)多模态大模型,结合甲骨文的音、形、义等多元信息,辅助专家进行更高效的甲骨文考释工作。甲骨文简介IT之家援引博文介绍,甲骨文也被称作“殷墟文字”,距今已有三...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
更多关于科技的资讯:
剪映专业版助力创作提效,90后四川小伙靠剪辑月入10万
过去几年,四川小伙王星程每天坚持分享自己的剪辑日常。得益于剪映专业版的方便易上手,“半路出家”的他很快就摸索出一套剪辑窍门
2025-08-08 15:27:00
天津,这座古老而又现代的城市,多元文化在建筑中显现、沉淀、交融。近年来,天津着力讲好建筑承载的故事,不仅使老建筑“重获新生”,更展现了天津厚重的人文底蕴与独特的城市魅力。
2025-08-09 07:44:00
温特纳科技:为压力扫描阀和气动探针提供一站式校准服务
从航空航天到汽车动力,从风洞实验到无人机飞行测试,精确的流场测量和压力数据采集是确保产品设计和研发进度的重要保障。很多科研工作者在采购压力扫描阀和气动探针后
2025-08-08 15:27:00
智能饮品革命:东方慧影如何用“零成本”方案破解餐饮行业人工困局
一、餐饮行业的成本之痛,政策改变迫使餐饮商家做出调整截至2025年,餐饮行业人工成本高达32.7%,较疫情前上升了8%
2025-08-08 15:27:00
官方数据首度公开!TikTok Shop跨境日本、欧洲五国新市场大促双爆发
近日,TikTok Shop新市场捷报频传!日本站点开放仅一个月,首场大促便斩获“开门红”;与此同时,欧洲五国德法意西
2025-08-08 15:27:00
当连锁药房遇上“好老板”,通联支付助力“为了你”健康药房升级收银服务
药店买药免排队、秒支付!近日,通联支付与当地邮政联合,为云南“为了你健康药房”上线“好老板”轻应用,助力连锁药店升级一站式智慧收银平台
2025-08-08 15:27:00
追求健康美食的你,是否渴望一种便捷烹饪方式?空气炸锅正是你的理想选择!它利用高速循环热风,无需大量油脂就能烹饪出酥脆可口的食物
2025-08-08 15:27:00
格力高上海工厂探访:本土化研发与智能智造驱动市场领跑
近日,格力高首次向媒体开放其位于上海的智能化生产基地,揭秘这家百年食品企业如何通过“本土化研发+智能智造”双轮驱动,实现从消费者需求洞察到产品快速落地的高效转化
2025-08-08 15:27:00
效率跃升18倍!曙光超智融合引领生命科学新范式
当前,海量生物数据的处理与分析能力已成为制约行业发展的关键瓶颈。近日,依托曙光超智融合技术建设的华东某全国产计算中心,与单细胞测序领域代表性企业墨卓生物达成战略合作
2025-08-08 15:27:00
传奇再启:赛德斯签约品牌强国新品即将来袭
2025年8月5日,中国知名电竞音频品牌赛德斯(SADES)在广东深圳正式签约“品牌强国·自主品牌优选工程”,成功入选该国家级项目成员单位
2025-08-08 15:27:00
餐饮行业在服务消费中地位举足轻重。当下的中国餐饮行业正在经历从“速度增长”到“效率竞争”的结构性转变。根据中国烹饪协会发布的《2024年全国餐饮业发展回顾与2025年展望》(以下简称“报告”)数据显示
2025-08-08 15:27:00
名众集团首创的基因枪无创草本抗衰技术,历经7年研发60万例临床,再次突破
名众集团自2018年自主研发首创了“四维形气美学”“草本0创还原术”后,历经7年研发60万例临床,再次实现重大技术突破
2025-08-08 15:27:00
视源股份投屏黑科技:3秒丝滑连接,比掏手机还快!
会议室的桌面上总缠着一堆线缆 ——VGA 线、DP 线、HDMI 线像乱麻一样,某企业高管曾因笔记本找不到匹配接口,让二十多位参会者等了十来分钟
2025-08-08 15:32:00
G视觉|全球首创!贵州嘉尚百米智能隧道窑日产40吨正极材料
走进贵州嘉尚新能源材料有限公司全球首创的100米全自动化隧道窑生产车间,自动化设备高效运转,机械臂精准作业,智能系统实时监控着从投料到产出的全过程
2025-08-08 15:42:00
千万粉丝主播“秀才”复活?抖音:仍在封禁状态,不存在“借壳复活”
8月7日上午,“网红秀才疑似借壳复出”的词条,冲上微博热搜榜单。据媒体8月6日报道,2023年被封禁的千万粉丝网红秀才疑似“借壳复出”
2025-08-08 15:46:00