• 我的订阅
  • 头条热搜
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...I技术的广泛落地。6.首提时空架构,谷歌爆肝7个月祭出AI视频大模型Lumiere谷歌经过7个月的密集研发,推出了名为Lumiere的AI视频大模型,与传统的AI视频生成模型不同,Lumiere能够在一个连贯的过程中生成整个视频,显著提升视频...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
图源:天幕文生样板视频截图Sora爆火两月之后,国内迅速有A股上市公司做出跟进,推出同样具备文生视频能力的多媒体大模型。4月28日,A股数字创意软件龙头万兴科技(300624.SZ)旗下天幕大模型开启公测。据万兴科技此前介...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...反馈的开源检索增强框架SearchLVLMs。该框架主要包括查询生成、搜索引擎调用、分层过滤三个部分。 以视觉问答为例,该框架会基于问题和图片生成查询关键词,并调用搜索引擎查找相关信息,再由粗到细地对检索结果进行过...……更多
AI智能体引擎加持:天玑9400让「完全体」AI手机提前问世了
...,终于迎来了一次能力突破。今年刷爆整个科技圈的 AI 视频生成,不打招呼就落地到了手机上。很多大厂还在邀请测试中的 AI 短视频生成能力,现在用手机算力就可以本地搞定了。大模型的训练,现在也可以在端侧完成:勾选...……更多
王炸级3nm安卓AI芯片发布,生成视频不用联网
...侧DiT架构支持,无需联网就能在手机上体验Sora同款架构视频生成。【视频请移步公众号】还有业界首发的端侧LoRA训练,可以高效离线训练专属于自己的LoRA生图模型,同时保证隐私不泄露。大模型方面,天玑9400能够运行的模型...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...OpenAI的GPT-3.5更强大。苹果也正在试验Siri增强功能、生成视频和图像的软件,以及处理图像、视频和文本的多模式人工智能技术。此前,由于苹果一直比竞争对手更加谨慎,将隐私置于功能之上,导致Siri落后于Alexa、Google Assistan...……更多
文心大模型4.0发布!李彦宏:相比GPT-4毫不逊色
...,迅速生成了一组广告海报、五条广告文案以及一条营销视频。据介绍,基于这一系列能力,百度已经推出了AIGC营销创意平台擎舵,让“一个人就成为一支AI营销队伍”。同时,他还通过解数学题、总结知识点等场景,展示了大...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...发布中,Gemini终于揭开了面纱——展现了其文本、图像、视频、音频和代码的五大能力,一口气推出了大中小三个版本,从云上到手机、平板都可以跑。并且,Gemini还有大量的酷炫用例:AI对一段视频可以做出准确反应,AI能和...……更多
WAIC 2024观察 | 大模型需要颠覆性应用,必然是技术与产业积累的结合
...、大批量、高精准的用户对话交互。京东超市通过言犀AI视频外呼技术,让代言人张若昀为用户送上生日祝福。对比普通语音外呼,转化率提升70%以上,GMV提升290%以上。此外,视频外呼还可结合言犀数字人短视频技术,自动化、...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...的突破?2024年2月16日凌晨,OpenAI在官网发布了最新的文生视频模型Sora。Sora不仅突破了现有文生视频模型10秒左右的连贯性局限,而且展示出了更精细的画质、多角度多镜头切换中保持一致性等能力。最重要的是,Sora较好地表现...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智能(AGI,General Artificial Intelligence)的追求——这一点也一直是他们的研究主线和研究理想,...……更多
火山引擎发布大模型训练视频预处理方案 已应用于豆包
10月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...oyunfeng@jiqizhixin.com本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决...……更多
...信达证券指出,受益于全球生成式 AI 持续发展,文生图/视频/音乐/代码等多方面应用的迭代更新有望长期给诸多行业带来降本增效。多家A股公司披露视频生成模型领域的业务情况据不完全统计,包括万兴科技、博汇科技、当虹...……更多
OpenAI CEO又创办了一家AI健康公司
...基础模型升级,新增首尾帧控制和镜头控制等功能,文生视频开放到10秒,同时可图开源。快手拥有包括可灵、可图、快意等在内的大模型矩阵,并搭建了数字人全流程AIGC服务,还在APP评论区上线了智能体“AI小快”。快手坚持...……更多
生成式人工智能新时代
...角。 生成式AI是什么?张亚林介绍,文本、音频、图像、视频、游戏生成,跨模态、多模态的生成,虚拟人的生成等,都可以通过各种素材的生成进行互换,这对我们周围的传统媒体带来巨大冲击。怎样支撑生成式AI大模型的发...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
记者 黄寿赓2月16日,OpenAI发布首个文生视频模型Sora,可快速制作长达一分钟的视频,由此引爆A股Sora概念,据同花顺数据,截至2月21日收盘,Sora概念累计涨幅达35.57%,安诺其、因赛集团等录得连板。概念“三连阳”的同时,个...……更多
...成能力;(2)消费图片的生成和自动化修改能力;(3)视频内容自动生成及剪辑能力;(4)多模态输入理解能力;(5)从多模态中提炼情感倾向能力等。 ……更多
华为harmonyosnext重塑全新“星盾”安全架构
...实现了质的飞跃。它不仅能够更精准地理解文本、图片、视频等传统模态,还能处理雷达、红外、遥感等新型模态数据,为物理世界的数字化呈现提供了更丰富的视角。在内容生成方面,盘古5.0能够生成符合物理世界规律的多模...……更多
百融云创荣获“2024大模型创新应用奖”
...环节中沉淀下大量数据,涵盖文本、表格、图片、音频和视频等多模态格式。知识库可以说是企业的“独家配方”,具有机密性、专业性和规模化的特点。知识库不仅是大模型发挥能力的核心“语料”,更是大模型真正在产业发...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...多个实际场景中得到应用。例如,在游戏中为 NPC 配音,视频创作中进行方言配音等。通过这一技术,游戏和视频内容能够更加贴近地域文化,提升用户的沉浸感和体验感。未来,随着端到端语音交互大模型的进一步发展,这项...……更多
商汤徐立内部信:生成式大模型AI的普及和商业化需要降低生产和使用成本
...随着尺度定律(Scaling Law)在大语言模型、多模态模型、视频生成模型以及慢思考推理过程中得到验证,生产和使用大模型的成本可以直接等价于算力资源的消耗。简言之,生成式大模型AI的普及和商业化,需致力于降低大模型...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...而更长的上下文使模型处理的信息更多,例如长文档、长视频,这种能力同样为更多现实世界的应用程序提供了所需的功能。然而,目前面临的问题是一些工作已经启用了长上下文视觉语言模型(VLM),但通常是采用简化的方法...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...技术的发展方向。正如互联网时代从文字到图片、语音、视频的创作方式演变,未来AI时代人类与大模型的交互也一定不会局限于文字。借助“中文逍遥”大模型,中文创作者将更早获得无边界思想盛宴的快乐。任何作者都希望...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以...……更多
天风证券:视频AIGC加速突破 多模态应用发展正当时 【天风证券:视频AIGC加速突破 多模态应用发展正当时】财联社12月4日电,天风证券表示,文生视频是一个年轻的方向,该领域面临多方面的挑战,包括高算力成本、缺乏高质...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...界,就需要将各种模态能力打通,例如文本-图像、文本-视频等跨模态甚至全模态的综合能力。再往后发展,AI将从虚拟的世界里走向真实的世界。AI能够进入真实的世界,捕捉真实世界的各个场景的和和视频音频等等的和人交互...……更多
高通aihub正式发布:支持75个ai模型
...以为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。开发者只需选择应用所需的模型以及其开发应用所使用的框架,然后确定目标平台,例如一款特定型号的手机、或者...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是一个重要的里程碑」!现已可在官网上体验Le Chat的使用。体验地址:h...……更多
更多关于科技的资讯:
2025世界制造业大会|超聚变全栈数智化方案,为安徽建设“制造强省”贡献力量
大皖新闻讯 9月20日至23日,以“智造世界 创造美好”为主题的2025世界制造业大会主在合肥举行。记者在采访中注意到
2025-09-23 13:16:00
新品首销,烟台联通胜利路营业厅人气火爆
9月19日上午8时,iPhone 17系列新品在烟台联通胜利路营业厅正式首销,现场人气火爆,众多消费者一早前来,共同体验新一代旗舰产品的魅力
2025-09-23 13:36:00
PITAKA自研PitaTap™拍照按键,重新定义手机壳交互体验
近日,在2025年德国柏林IFA展会上,PITAKA凭借其自研的PitaTap™拍照按键的创新突破,一举夺得两家国际权威科技媒体SlashGear与BGR颁发的Innovation Awards奖项
2025-09-23 11:40:00
MOVA生态链企业获数千万融资,瞄准海外电动工具赛道、预计2025年营收破亿|硬氪首发
作者|黄楠编辑|袁斯来硬氪获悉,沃庭科技(苏州)有限公司(以下简称“沃庭科技”)近日完成数千万元天使轮融资,本轮资金将用于加大技术研发投入
2025-09-23 06:51:00
刘强东,正悄悄孕育“山姆杀手”
前不久,刘强东现身宿迁,又给老家人送上了一份大礼:四家京东折扣超市。有人问,这不是赚老乡钱吗,算什么礼物?因为这些超市主打的
2025-09-22 10:23:00
近日,合众人寿秦皇岛中支开展“鎏金岁月,匠心相伴”主题金箔手作沙龙活动,通过沉浸式手工体验,为参加客户呈现了一场融合艺术鉴赏与情感联结的特别回馈
2025-09-22 10:32:00
东港股份转型科技先锋 AI具身机器人深耕为民服务
海报新闻记者 宋嵩 张彤彤“您好,我是小智,有什么可以帮助您?”在政务大厅、大型展馆、学校可以看到忙碌的“小家伙”,它们各司其职
2025-09-22 10:33:00
“人拉肩扛”到“云端挖矿” 山东黄金的数智蜕变
海报新闻记者 张彤彤三山岛金矿的井下巷道里,5G信号正穿梭于岩壁之间,中控室的大屏上,矿石流动的情况与千米深的矿洞数据实时变化
2025-09-22 10:33:00
从莱阳田野到国际餐桌 春雪食品引领鸡肉调理品行业高质量发展
海报新闻记者 宋嵩故事的起点,要追溯到2012年。彼时,山东春雪食品有限公司在莱阳设立莱阳春雪食品有限公司,最初只是一家区域性的鸡肉加工企业
2025-09-22 10:37:00
大窑饮品重磅推出“宜养说” 植物蛋白赛道再添“实力派”
当下消费者正变得前所未有的理性,这一趋势在饮品市场尤为明显:“好喝”是基础,“健康”已成为新门槛。基于对“轻养生”需求的深度洞察
2025-09-22 10:38:00
近日,西贝创始人贾国龙与网红企业家罗永浩就预制菜价值展开的公开论战,将这一话题推向了舆论漩涡。这场争论背后,折射的正是全社会对食品安全认知的深化——从单纯的“无害”向更高层次的“真实
2025-09-22 10:38:00
从鼓房到健身房:无人值守场景重塑消费体验
本报记者 胡 静 □ 陈跃佳中午十二时,李先生步入街角的24小时无人便利店,扫码开门、自选商品、刷脸支付,全程耗时不足两分钟
2025-09-22 10:39:00
鱼竿里的“大国重器” 光威复材以碳纤维技术书写国产突围之路
海报新闻记者 宋嵩 张彤彤“以前用玻璃纤维竿,钓条十斤的鱼就胳膊酸,这碳纤维的又结实又轻,真是材料不一样了!” 威海的老钓手王师傅喜欢“炫耀”他的新鱼竿
2025-09-22 10:40:00
南山智尚:纤维经纬织就智造之路
大众网·海报新闻记者 康洁一条条线可以让提线木偶惟妙惟肖的表演,而一根根强度高、耐磨损的纤维可以实现机器人手部灵巧的运动
2025-09-22 10:41:00
刚拿到新iPhone就提示设备空间不足?微信员工回应:有bug
日前,iPhone 17系列开售,很多拿到新机的用户第一时间就是转移数据。但最近有微信用户发现,在向新iPhone导入聊天记录时
2025-09-22 10:51:00