• 我的订阅
  • 头条热搜
...能沉浸式体验3D生成、音视频生成、智能编码等十余项多模态模型如何一步步化作生产力。“值得一提的是,由生数科技团队打造的首个国产纯自研视频大模型Vidu将进行公开展示。”刘湘雯介绍,大会也邀请到十余家多模态模型...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...犀大模型,经过不断升级,已从单一的语言处理走向了多模态能力,涵盖了语言、语音、图像、视频和数字人等。这一跨越,得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多
AI智能体将迎爆发点,市场空间近300亿美元!中科金财6天5
...系统,以大型语音模型(LLM)作为核心引擎,基于复杂多模态数据的处理能力,他们可以感知环境,做出决策,并执行任务以实现特定目标。目前,国内外科技巨头都在加速布局AI智能体领域。其中,OpenAI计划在明年1月发布一款...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
迎着应用爆发的曙光,百度将推出新版文心大模型
...,张冠李戴的幻觉现象普遍存在,这也是为什么今天的多模态大模型还没有什么成规模应用跑出来的原因。今年年初时,在整个中文互联网都为Sora而捶胸顿足的时候,百度决定解决图像生成的幻觉问题。百度最新发布的检索增...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
2024世界计算大会论道:万兴科技大模型加速改变音视频内容生产的成本结构
本文转自:人民网-湖南频道朱雯雯分享音视频多媒体大模型的应用探索与实践。受访单位供图人民网长沙9月25日电 9月24日,2024世界计算大会在湖南长沙开幕。大会汇聚全球顶尖的计算产业专家、学者、企业家,多维度探讨国...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
对抗“AI换脸”等风险欺诈,外滩大会首办全球Deepfake挑战赛
...最年轻的一位是来自东南大学的大三学生唐楚杰,擅长多模态内容生成,即将被保研,目前正在暑期实习。王博毕业于北京大学,他说:“我本身就是学计算机专业的,对网络攻防很有兴趣,区别于黑客、木马病毒等传统信息安...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
清华大学孙富春:大模型+机器人可能会导致失业,未来80%的人工劳动会被取代
...通用的方向发展。“大模型能提高机器人的交互能力、多模态融合感知与任务规划能力,能让机器人实现多任务,进而实现通用化。”孙富春表示。不过,这还需要做很多研究。比如大模型与知识图谱结合,提高机器人的推理能...……更多
Infocomm China2024见闻:大家每天忙于开会,却还没吃透怎么用好AI
...是人物讲话、视频内容、共享屏幕还是会议纪要,都是多模态大模型重要的信息来源。”今年,腾讯会议已经将其混元大模型能力融合到会议场景中,以类似于“AI助理”的方式呈现。不仅是腾讯会议,钛媒体还注意到,今年的I...……更多
国内首个音视频多媒体大模型万兴“天幕”发布:支持AI剪辑
...伟1月30日,万兴科技正式发布了国内首个音视频多媒体大模型“天幕”。同时,公司宣布将设立大模型研发中心落户马栏山。据悉,“天幕”以音视频生成式AI技术为基础,支持全球不同语言,并引领了音视频创作闭环解决方案...……更多
百国百业联手深速达智能 为数字农业插上智慧翅膀
...视角的音视频信息传输到部署于全球的视频集群,通过多模态识别技术,匹配跨模态的知识图谱,对自然语音和视频图像进行分析推理,并将推理结果实时推送给用户,进而构建人机混合的多方协作,实现人工智能的真正落地,赋能各行...……更多
观薇智能“玄黄大模型”发布,展示AI+健康领域创新实力
...志力等嘉宾,共同开启中医中药+精准营养为垂直应用多模态大模型——“玄黄大模型”。玄黄大模型基于庞大语料词元预训练而成,学习了中国中医科学院中医药信息研究所整理的中医药知识图谱、文献医案,并结合了观薇智...……更多
Sora还未公测,“清华博士”李一舟卖AI课年赚5000万!
...表之一,李一舟何许人也?他的抖音介绍贴了几个标签:清华大学博士,三家科技公司创始人,融资数千万,职业经理人,擅长解决AI人工智能,商业模式,知识IP和流量问题。据科创板日报,记者了解发现,李一舟出自清华美...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
... CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
...级别智能交通技术的世界级人工智能企业。公司专注于多模态感知、AI算法算力、自动化控制及多模态大模型技术等智能科学发展新范式的研发与应用,致力于为用户提供高级别智能交通产品全栈技术和解决方案,其人工智能产...……更多
华为陈海永:创新引领5G-A话音网络演进之路
...G的VoLTE和5G的VoNR,本质都是语音、视频、文字等信息的单模态通信。当前,运营商话音业务正走入新通话时代,新通话在传统通话基础上叠加了高清、智能、交互的能力,通过多模态通信和AIGC带来语音到文字、语音到图片、语...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...为设计下一代专门用于推理的AI模型提供了概念框架。 清华叉院姚期智、袁洋领衔这篇论文由清华交叉信息研究院姚期智、袁洋领衔,论文第一作者为张伊凡。张伊凡张伊凡2021年本科毕业于于北京大学元培学院,现为清华大学...……更多
AI视野:iPhone16将引入生成式AI;百度AI编程工具限时免费;
...演模式。????‍????????????聚焦开发者清华系ChatGLM3发布,多模态挑战GPT-4V智谱AI发布了清华系ChatGLM3,全自研、适配国产芯片,多模态模型挑战GPT-4V,搭载国产Code Interpreter,实现代码交互能力。元象大模型向全社会开放元象信息科...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
更多关于科技的资讯:
在“双碳”目标引领绿色变革的时代浪潮中,晋西车轴始终将节能降碳作为企业转型升级、实现可持续发展的核心战略,聚焦单位产品能耗精益管理
2025-07-06 18:48:00
在国家核心技术自主可控战略的推动下,安全可靠的信创办公软件已成为政企数字化转型的基石。它们不仅提供基础的文档处理能力,更深耕业务场景
2025-07-06 15:03:00
连锁超市创业黑马!3年18家店,宋洪伟上演教科书级创业神话
“回想当时刚开始创业的时候,我没想到资金成了我最大的问题。让我至今难忘的是,我的兄弟们竟自发凑钱支持我,当时还有个员工把自己攒了多年的10万块钱
2025-07-06 15:04:00
厦门网讯(厦门日报记者 林露虹)昨日,华为在福建的最高规格门店——华为智能生活馆(厦门万象城店)正式开业,为我市“首店经济”注入新活力
2025-07-06 08:05:00
穿越记忆虫洞与AI巴别塔的思辨之旅杭州日报讯 7月1日,中心美术馆2025“ECP-星星策展人”计划的两场入选展览,“记忆为核——千禧一代的‘怀旧技术’与‘技术怀旧’”与“巴别瓶
2025-07-06 07:08:00
7月4日,位于绍兴上虞的杭州湾具身智能创新中心启用,两台智元G1机器人在模拟工业场景中上演了一场“智能作业秀”——面对动态障碍物
2025-07-06 07:39:00
西班牙巴斯克地区产学研代表来宁“走亲戚”——“每次来南京,我就像回家一样”□南京日报/紫金山新闻记者 张甜甜南京这座创新之城
2025-07-06 07:49:00
国内首个光子专用大模型启动升级,挑战业内空白“00后”聚焦产业需求勇“开荒”□南京日报/紫金山新闻记者 张安琪刚刚过去的二季度
2025-07-06 07:50:00
厦门新型显示产业再添新军 项目位于火炬(翔安)产业区
“厦门路维光电高世代高精度光掩膜”项目效果图。(路维光电 供图)厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)厦门新型显示产业再添新军
2025-07-06 08:05:00
DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究
DeepSeek R1横空出世第128天,已经把整个大模型市场搅得天翻地覆!首先,它以一己之力把推理模型的价格打下来,OpenAI六月更新的o3价格相比o1直接打了2折
2025-07-05 10:58:00
河南即将“涮”出一家上市公司?
大河网讯火锅市场,即将“涮”出又一家IPO!经过24年的深耕,发轫于河南的火锅餐饮品牌巴奴毛肚火锅,以“产品主义”为核心标签
2025-07-05 12:10:00
中新经纬7月5日电 题:“首店经济”打破“千商一面”作者 洪涛 中国消费经济学会副理事长、北京工商大学商业经济研究所所长近期
2025-07-05 21:36:00
日照科技职业学院信息工程学院:育高端产业英才,融产教助力就业
齐鲁晚报·齐鲁壹点 隋忠伟 刘涛 厉昕月近日,齐鲁晚报·齐鲁壹点记者对日照科技职业学院信息工程学院刘贤喜院长进行了专访
2025-07-05 22:31:00
经济大省挑大梁丨加强产供对接 外贸优品选品中心加速企业转型
面对对美贸易的不确定性,今年以来,浙江充分挖掘原有电商选品中心的资源,大力培育外贸优品选品中心,帮助外贸企业加速转型。走进1688永康五金选品中心
2025-07-05 21:24:00
2025“活力中国调研行”丨蚌埠:全力打造智能传感产业新高地
大皖新闻讯 自2021年安徽省首次提出打造“中国传感谷”战略构想以来,蚌埠市积极响应,加速推进传感器产业发展。记者跟随2025年“活力中国调研行”安徽主题采访团走进蚌埠
2025-07-05 14:21:00