• 我的订阅
  • 头条热搜
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...成机器人可操作、可执行的控制指令,如指令拆解、代码生成等控制层面的调优工作。若愚科技与哈工深联合研发了语言大模型基座---立知和多模态大模型基座---九天,总参数规模达130亿,训练数据超1500B tokens, 能完成多任务、...……更多
...到生成式人工智能,人们首先想到的是生成对话、图片、视频等酷炫的能力。事实上,与这些表现形式相比,GAI成功的技术路线和全新的应用生态更值得关注。GAI由大模型、大数据、大算力融合驱动,具备规模性、涌现性以及通...……更多
谷歌发博文介绍vloggerai模型可让人物“动起来”
...名人物肖像,以及累计超过2200小时的影片,从而让VLOGGER生成不同种族、不同年龄、不同穿着、不同姿势的肖像影片。研究人员表示:“和此前的多模态相比,VLOGGER的优势在于不需要对每个人进行训练,不依赖于人脸检测和裁剪...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...中的奖励来自于校准的自我奖励:LVLM对于每句话的自我生成概率 + 结合视觉约束奖励,用于奖励校准。2. 基于每一轮构造的偏好数据在线通过DPO迭代学习。实验CSR相较于数据驱动的偏好学习对齐方法和模型自我反馈的方法均有...……更多
阿里Q3财报:核心业务收获稳健增长,“AI驱动”潜力初现
...经推出,社交媒体上就有了各路网友“跳起”网红舞蹈的视频,形成病毒式传播。AI电商掀起“效率革命”:商家经营率先提效季度内,淘宝天猫推出一系列AI工具助力商家经营提效,目前,淘天AI工具箱已覆盖商家开店装修、设...……更多
豆包电脑版,原地封神了!
...据。但每次你搜索时,却被海量的结果淹没;与此同时,视频讲解也过于冗长,你没时间看完却又不想错过重点。这样的情境是不是很熟悉?无论是在工作中还是学习中,我们总是希望能更高效地完成任务,但往往却被繁琐的步...……更多
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
...全面升级至Sora同款的DiT架构,具备了多轮绘图能力。在视频生成领域,蒋杰指出,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,视频生成长度可达16秒。预计在三季度推出的下一代文生视频...……更多
...态圈。据了解,APUS大模型具备处理文本、图像、音频、视频等多种类型数据的深入理解和生成能力,可赋能多个行业和场景,提升智能化水平。目前,APUS大模型已与我省政府部门及多家企业携手共创AI应用。在智慧电商领域,AP...……更多
人工智能热度攀升市场广阔
今年以来,人工智能产业热度持续攀升。文生视频软件Sora、文生音乐软件Suno等人工智能应用不断涌现,带给人们冲击的同时,也在影响着千行百业。本报今起推出“聚焦人工智能发展”系列报道,围绕人工智能相关市场、安全...……更多
小米“小爱同学”与阿里云通义大模型展开合作
...爱同学”已与阿里云通义大模型展开合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地。以最新推出的小米汽车SU7为例,车上的“小爱同学”可遵从乘客的自然语言指令,在车...……更多
利润增长超2倍!福建这家由80后掌舵的民营企业有何“干货”?
...的成绩单,来自911万的付费订阅用户。但他也焦虑。文生视频SORA发布当天,“心里受到冲击,‘这是真的吗?’,夸张点说就是惊掉下巴。”他回忆起那一天的反应,迄今都记忆犹新。争分夺秒的竞争环境里,他坦言,技术爆...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图...……更多
全国首个 成都创新团队发布机器人多模态模型
...图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,这是人形机器人具有自主思考能力的关键核心技术。目前,成都人形机器人创新中心发布的中国首个机器人多模态模型,可以相对明确地将水果和非...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力,是大模型时代的“超级应用”。其中,“天工3.0”AI音乐生成大模型SkyMusic还将在4月2日面...……更多
Meta等成立AI联盟对抗OpenAI;春晚吉祥物“龙辰辰”被疑AI生成 | 图灵周报
...理文本内容,还可以无缝丝滑地处理代码、音频、图像和视频等多种模态的信息。据介绍,这是谷歌目前规模最大、能力最强的大模型。业内多名人士都对Gemini大模型表达了祝贺与赞美。根据谷歌给出的基准测试结果,Gemini大模...……更多
文化元宇宙四大共性技术打造沉浸式虚拟场景
...融合的方式讲述历史文化故事。姜文波表示,随着超高清视频和音频、互联网、人工智能、5G、大数据等技术的快速发展,为视听媒体虚拟制作提供强有力的支持,VR/AR/XR/VP等技术应用越来越普遍,不仅提升了视听媒体的视频及...……更多
2023开年热词「大模型」「出海」,现在怎么样了?
...大模型之战,已经从文本生成蔓延到文生图、语音处理、视频处理、代码处理,并在办公、学习、医疗、零售、金融、制造等多领域应用实践。AI视频生成、AI剪辑、AI作画、AI编程等应用产品在国内市场海量井喷,妙鸭相机等产...……更多
马斯克说人类愿赌服输!OpenAI首个文生视频模型炸街,哪些行业又将颠覆
Sora生成视频展示 澎湃新闻编辑 秦盛(03:23)人工智能(AI)巨头OpenAI在龙年伊始就扔出了杀手锏。当地时间2月15日,OpenAI宣布,正在研发“文生视频”模型Sora,可以创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机...……更多
送技术支持送资源!联发科携手产业伙伴启动天玑AI先锋计划
...移动生态领域的先锋厂商和开发者参与。与会者围绕端侧生成式AI技术与生成式AI手机的未来趋势展开深入探讨,同时,联发科展示了其天玑AI生态战略以及终端生成式AI应用开发的一站式解决方案——“天玑AI开发套件”。此外...……更多
...上发布了通用AI新模型Project Astra,可实现跨文本、音频、视频多模态实时推理。对标GPT-4的国产大模型也在快速迭代升级,如4月23日发布的商汤日日新SenseNova 5.0,其综合性能全面对标GPT-4Turbo;又如5月9日发布的通义千问2.5,阿里...……更多
阅读软件也应用AI,掌阅科技股价一字板后再迎涨停
...资产价值,并引领数字阅读从单一的文字向文字、图片、视频相互结合的多模态演变。经营情况方面,掌阅科技近年来的业绩出现了一定程度的下滑。数据显示,该公司在2018-2022年间的营业总收入虽然保持了比较良好的增长势头...……更多
AI正在改变物理世界!2024云栖大会开幕 AI硬科技集结 共创“无法计算的价值”
...物的Yi系列大模型齐聚一堂,另有图片生成、3D生成、音视频生成、智能编码等10多家多模态模型,共同打造沉浸式交互体验。计算馆则展示了中国先进的云计算产业链全景,从底层硬件到数据创新,从云计算基础设施到数据管理...……更多
CCBN2024|讯飞星火大模型助力产品创新,引领广电视听新体验
...“技术创新赛道”一等奖。目前通过讯飞智作AIGC创作的视频配音、新闻视频、培训视频、广告视频已经广泛应用于媒体新闻、企业宣传、智慧文旅、教育培训、智慧政务、IP运营等多个领域,并与学习强国、新华社、南方电网、...……更多
加速落地 京东云大模型已支持数百个场景
...场景应用,进行了深入探索,从虚拟数字人主播、到AIGC生成的营销物料,从商家运营的全面智能化、到智能配送车稳定运营,大模型应用落地京东数百个应用场景,已服务数十万商家,让商家和用户全方位感受到大模型带来的...……更多
“Sora目前仍不够可靠,应用场景受限”
...段短片利用了AI规划分镜并绘制图片,再辅以“图片生产视频”软件让图片“动起来”。视频作者冯先生在接受媒体采访时表示,这段视频如果人工制作至少需要半年,而自己在AI的帮助下用时一周就完成了。值得一提的是,上...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...以来,外界对3D大模型赛道的关注度都稍逊于语言模型和视频模型。然而,全球3D大模型选手们则都在暗中较量、默默发力,从a16z押注的Yellow,到李飞飞的World Labs,3D大模型的迭代速度是没落下一点。就在刚刚,国内3D大模型头...……更多
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;
...效率提升Facefusion是一款人工智能项目,可以实现图片、视频和直播的实时换脸。最新1.3.1版本更新提升了性能,速度,用户界面,并引入了高性能版本和面部增强技术。 聚焦开发者微软研究员推LoRAShear技术:高效对大语言模型结...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...一项研究中,张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)...……更多
...行内容生产,下游应用供给多点开花,涉及绘画、写作和视频等领域;从需求端看,在文娱碎片化、轻量化驱动下,用户内容消费需求指数级增长,传统生产方式导致行业成本压力剧增,急需通过人工智能生产内容来降本增效。...……更多
更多关于科技的资讯:
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00
从优篮子到 JOBY:唯迹科技的全球化成长之路
在摄影配件行业,“速生速死” 是常态 —— 产品迭代快、价格战频发,多数企业陷入内卷困境。而深圳市唯迹科技有限公司却走出了一条 “反常识” 的发展路径
2025-09-26 12:07:00
让AI规划假期行程,告别烧脑做攻略比价;戴上耳机,和自己的专属AI讲解员一起边逛边聊,拍展品听讲解,拍景点听典故,拍建筑听历史……这种全新的旅行体验
2025-09-26 12:08:00