• 我的订阅
  • 头条热搜
字节跳动为企业提供极具性价比的多模态大模型能力
...的火山引擎Force大会上,字节跳动正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生成将成为新一代生产方式,带来行业发展的新机遇。肖欣延分别从图片生成与...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...赢家!一篇是Rich Human Feedback for Text-to-Image Generation,受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等,共同一作华南农业大学校友Youwei Liang、清华校友……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外的英伟达、OpenAI...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...Zhang (https://zhangyuanhan-ai.github.io/),主要研究领域为将基础模型适配于开放世界。本文的指导老师为 Ziwei Liu 教授 ((https://liuziwei7.github.io/) 和 Chunyuan Li 博士 (https://chunyuan……更多
OpenAI CEO又创办了一家AI健康公司
...术动态(一)可灵网页版上线快手可灵网页版上线,基础模型升级,新增首尾帧控制和镜头控制等功能,文生视频开放到10秒,同时可图开源。快手拥有包括可灵、可图、快意等在内的大模型矩阵,并搭建了数字人全流程AIGC服务...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...洁分别作主题演讲。本届论坛干货满满,演讲嘉宾围绕大模型技术的最新进展及未来趋势、生成式AI输入的探索创新以及生成式AI赋能输入内容生态等话题,共同仰望宇宙星河。此外,现场还重磅发布讯飞输入法13.0,正式开启“...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
Meta最新 6模态大模型,让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现在AI也可以。尽管画面中没有出现人类,AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多
应用大模型 飞书钉钉金山开卷
...式对外公布了全新的AI智能助手“My AI”。而拥有自研大模型文心一言的百度,则于4月17日宣布在内部应用智能工作平台“如流”,涵盖文本和图片生成、代码推荐两大场景。协同办公领域开卷,大模型在国内加速向支持应用层...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...搜索引擎,也未推出GPT-4.5或GPT-5,而是发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。此前OpenAI公司CEO奥尔特曼(Sam Altman)就已经否认了公司将会发布GPT-5,他表示新版GPT非常“神奇”。...……更多
雷军杀入大模型
“全力以赴、坚决拥抱”,雷军为小米大模型发展定调!继任命栾剑担任技术委员会AI实验室大模型团队负责人后,雷军于4月14日晚间在微博发文,首度谈及小米对大模型和AIGC的看法。除了定下发展基调,雷军还透露,对于大...……更多
百度发布两款大模型,对标DeepSeek、聚焦多模态
...日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1一半...……更多
...性等方面具备惊人效果……近日,OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领...……更多
谷歌绝地反击:新模型部分能力超GPT-4,Bard将支持中文,打响和微软AI之战
...谷歌CEO桑达尔·皮查伊(Sundar Pichai)正式发布全新大语言模型PaLM 2,称其在部分任务上已超过GPT-4,并已用在旗下超过25款产品和应用上。此前演示翻车、对标ChatGPT的AI聊天机器人Bard基于PaLM 2迎来更多功能升级,同时在更多地区...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-mo...……更多
第二届全球数贸会 | 文心一言成唯一入驻中国馆大模型
...以下简称“数贸会”)在杭州开幕。百度知识增强大语言模型文心一言,应商务部邀请入驻数贸会“中国馆”,是唯一入驻中国馆的大模型产品,现场吸引众多观展人员驻足体验。第二届全球数贸会百度展馆。 华龙网特派记者 ...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强大的可迁移性。多模态对比学习(如CLIP)...……更多
...果、微软,苹果推出Apple Intelligence AI系统等等。而在AI大模型方面,最主要事件则是OpenAI推出多模态大模型ChatGPT-4o,这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力,被誉为技术上一个巨大突破。事实上,中...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...检索策略,这种设计不仅提高了检索效率,也显著增强了模型生成内容的准确性。为评估OmniSearch,研究团队构建了全新Dyn-VQA数据集。在一系列基准数据集上的实验中,OmniSearch展现了显著的性能优势。特别是在处理需要多步推理...……更多
...自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突破,进一步加速了“AI物理化”进程,也让人形机器人从“预设摆拍”“遥控操作”进化到拥有更强的“大脑”和自主执行能力本报...……更多
李彦宏:大模型已基本解决幻觉问题 发布两大“超级有用”AI技术
“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
智东西7月26日报道,今天一早,大模型独角兽智谱AI正式发布视频生成工具清影,可支持文生、图生6秒时长的视频,即日起在PC端、手机App端以及小程序端面向所有C端用户免费开放。先来看看效果,以下是几个官方放出的文生...……更多
AIGC工具测评:生成式AI的产品表现如何
...这一年,AI展现出了前所未有的发展势头,无论是在基础模型能力、实际应用场景,还是资本投入方面都取得了显著进展。特别是在2022年11月30日,OpenAI发布了ChatGPT,标志着AI技术的一个新纪元。紧接着,在2023年1月,ChatGPT的月...……更多
贵州大数据企业为130万家用户提供AI营销方案
...是一枝梅与成都任我行软件股份公司共同开发的多模态大模型应用。“依托于完全自研、有自主知识产权的Drawing多模态大模型,一个管家婆智能体相当于为企业提供3位精通文秘、美工、视频的新媒体营销‘数字员工’,助企业...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...挺有趣:生成式AI让世界有了一个统一的语言——Token。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。 接下来,我们试图就这...……更多
软通智慧数智成果发布暨战略合作签约仪式举行
...力框架体系:策渊AI平台、卧龙智能体应用平台,打通大模型应用“最后一公里”——策渊平台是集模型训练和智能能力演示于一体的人工智能平台,具备文本、图像、知识图谱、AIGC大模型的全场景智能能力,集语料、算法、标...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
更多关于科技的资讯:
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00
从优篮子到 JOBY:唯迹科技的全球化成长之路
在摄影配件行业,“速生速死” 是常态 —— 产品迭代快、价格战频发,多数企业陷入内卷困境。而深圳市唯迹科技有限公司却走出了一条 “反常识” 的发展路径
2025-09-26 12:07:00
让AI规划假期行程,告别烧脑做攻略比价;戴上耳机,和自己的专属AI讲解员一起边逛边聊,拍展品听讲解,拍景点听典故,拍建筑听历史……这种全新的旅行体验
2025-09-26 12:08:00