• 我的订阅
  • 头条热搜
视频大模型 快手美图殊途同归
...a早成立一个月,主要业务集中在图像、3D、视频等原生多模态大模型的研发。2024年4月,生数科技联合清华大学发布的视频大模型Vidu,支持一键生成16秒、分辨率1080P的高清视频内容。6月初,生数科技宣布,已完成数亿元Pre-A轮...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在美开售,库克称将很快登陆中国脑机接口公司Neuralink完成首例人脑植入手术 Hugging Face推出可定制AI个人助手苹果发布2024年Q1财报...……更多
AI如何落地智慧交通?网新IN-TRANS产品给你答案
...十倍级效率提升的核心优势。 网新系统研发总监沈巍多模态交通算法引擎In-TransAI,通过图像识别和语义理解算法,将基石化为沃土,赋予数据意义。能对海量异构数据进行高效、智能地识别分析,将静态数字转变为动态知识...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...内首个所见即所得的模型——商汤“日日新5o”,实时多模态流式交互对标GPT-4o,开启了全新的AI交互模式。此外,商汤也加入了大模型价格战,近期推出了“大模型0元Go”计划,凡是“日日新”的新注册用户,都可获得涉及调...……更多
苹果大模型,不藏了
...模型领域的步伐。上个月,苹果先是推出了名为Ferret的多模态大语言模型,图像处理技术堪称惊艳;而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...基于预训练GPT-2提出了一种新的注意力机制,来衔接不同模态之间的语义差异,无需大量图像-文本数据训练,就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造,基于新的编解码器架构C-V...……更多
江苏银行依托大模型,创新打造数字金融新场景
...,这一直制约着授信审批效率。江苏银行基于大模型“多模态”理念,准确识别用户意图,自动运用音频分析、外部图像处理等功能,实现扫描件、语音、电子表格和文本等多种类型素材的自动化提取,打通多类信息载体间的壁...……更多
生成式人工智能新时代
...?张亚林介绍,文本、音频、图像、视频、游戏生成,跨模态、多模态的生成,虚拟人的生成等,都可以通过各种素材的生成进行互换,这对我们周围的传统媒体带来巨大冲击。怎样支撑生成式AI大模型的发展?张亚林说,我们...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
腾讯云公布多项大模型产品进展
...的回答表现上,数学、推理等能力上均有较大提升。在多模态能力方面,混元大模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测...……更多
“平替版Midjourney”,上线1年超700万用户,生成图片超7亿张
...像后能继续微调,如图像放大增强、去除背景。另有两项实时修改功能,“实时生成”允许用户一边输入提示词,一边生成新图。“实时画布(Realtime Canvas)”可以让用户一边更改草图一边生成高质量渲染图。Magnific AI创始人Javi...……更多
谷歌发博文介绍vloggerai模型可让人物“动起来”
...表情地朗读音频内容。VLOGGERAI是一种适用于虚拟肖像的多模态Diffusion模型,使用MENTOR数据库进行训练,该数据库中包含超过80万名人物肖像,以及累计超过2200小时的影片,从而让VLOGGER生成不同种族、不同年龄、不同穿着、不同...……更多
大模型重塑智能硬件!人手一个智能助手的时代来了?
...一起聊聊烦恼、疑惑和心事……可以预见,更智能化的多模态大模型赋予了智能硬件新的生命。就在上周六,RTE 2024第十届实时互联网大会IoT分论坛圆满结束。多位AI智能硬件赛道的资深人士齐聚一堂,共同探讨如何让“智能硬...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...期版本,并接近最新版本的表现。此外,GLM-4还增强了多模态能力,其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store,为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
谷歌之后,OpenAI也要给新闻网站付费了?
...,大模型愈发像人一样可以创作文字、图片、音视频等多模态内容。包含社交娱乐到工作学习等场景的内容生成,能力越来越强的大模型,将深刻改变未来世界。快速发展背后,大模型侵权问题频繁爆发。01今年4月末,包括《纽...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加深,Amazon ...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...犀大模型,经过不断升级,已从单一的语言处理走向了多模态能力,涵盖了语言、语音、图像、视频和数字人等。这一跨越,得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多
AI PC是噱头还是更快的马车?
...有了AI助手,这就是一句话的事。理解较长的上下文、多模态输入等等,这些都必须依赖大语言模型的能力,但其实是在本地运行的,而非借助云端的推理能力。讲真,应该没有人会认为整理文件名这种本地文件系统的操作还需...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。为了提高端...……更多
年轻人的好友列表,AI越来越多
...字人,还可以实时进行沉浸式语言、肢体互动。“以前多模态交互是一个连续生成过程,会有延时,Soul 现在语音对话延迟不到 200 毫秒,因为我们已经推出了端到端大模型能力——过去先生成文本/图像再转换为语音,现在能将...……更多
全球同频变现最快,AI赋能广告营销的道与术
...i正式发布,作为Google迄今为止规模最大、能力最强的AI多模态模型,业内认为Gemini将对整个广告营销行业带来巨大的变化。目前,微软也正通过与OpenAI的密切合作,去抢占未来数字广告市场。比如基于必应搜索中的微软广告创建...……更多
当GPT-4o 成了网恋平替
...会上推出的新一代旗舰生成模型 GPT-4o具有强大的实时多模态交互性能:它可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。这意味着,GPT-4o可以直接理解、直接生成音频或者视频...……更多
前商汤通用模型负责人打造3D大模型「Tripo」,3D生成迈入「秒级」时代 | 早期项目
...VAST团队认为通过统一表示、模型和数据,以及借鉴其他模态的成功经验,可以有效地解决当前3D内容生成面临的挑战,实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
更多关于科技的资讯:
再创纪录!《哪吒2》票房超《蜘蛛侠:英雄无归》 跻身全球票房榜第7
快科技3月1日消息,据灯塔专业版全球票房榜显示,截至3月1日,影片《哪吒之魔童闹海》全球票房(含预售)突破141.60亿
2025-03-01 01:07:00
本文转自:人民日报周超男委员——为发展智算产业贡献力量(改革再深化 奋进新征程·代表委员履职故事)本报记者  马  晨前不久
2025-03-01 05:46:00
找矿用上哪些“黑科技”(瞰前沿)
本文转自:人民日报本报记者  常  钦图①:“航空地质二号”直升机。图②:科研人员正在运用地球化学技术开展研究。图③:技术人员正在放飞无人机执行勘探任务
2025-03-01 05:47:00
我为设备做“数字体检”(探一线)
本文转自:人民日报讲述人:广汽埃安智能生态工厂数字化设备管理工程师  饶含韬图为智能生态工厂的柔性化生产线。广汽埃安供图我负责智能生态工厂中汽车总装线上轮胎
2025-03-01 05:47:00
这家智能工厂,五十三秒下线一台车(探一线)
本文转自:人民日报张自初图为智能生态工厂里的机器人正在工作。罗 珣摄生产效率提高50%,交付时间缩短33%,一次验收合格率提高8%
2025-03-01 05:49:00
81.49万元的小米SU7 Ultra纽北限量版 并没有挑战纽北
快科技3月1日消息,在27日晚的小米发布会上,雷军不仅发布了小米SU7 Ultra,还发布了小米SU7 Ultra纽北限量版
2025-03-01 07:38:00
把算法从世界上删掉 生活会不会变好
去年,差评君刷到个视频,视频中有位鄂伦春族奶奶正唱着一种叫赞达仁的歌。赞达仁,是鄂伦春族的传统民歌。歌曲歌词有些是即兴编创
2025-03-01 07:38:00
全球电商 双向奔赴
2月28日,2025第十五届(杭州)全球新电商博览会在杭州大会展中心开幕。为期三天的本届新电商博览会以“新数字、新经济
2025-03-01 07:41:00
AMD官宣RX 9060系列显卡:二季度大战RTX 5060系列
快科技2月28日消息,AMD终于正式发布了新一代RDNA 4 RX 9070系列高端显卡,RX 9070 4499元起
2025-02-28 22:07:00
RTX 5090D挑战3A游戏多开:实测结果出乎意料
今年硬件的最大亮点无疑是RTX 5090 D,这款显卡不仅凭借Blackwell架构和GDDR7显存实现了性能的飞跃,更通过DLSS 4技术彻底改变了游戏体验的极限
2025-02-28 22:07:00
定位中大型六座SUV!昊铂HL将于3月18日预售:预计售价35万元
快科技2月28日消息,近日,广汽昊铂官方宣布,昊铂HL将于3月18日正式开启预售。新车定位为六座中大型SUV,提供纯电和增程两种动力版本
2025-02-28 22:37:00
大量账号恶意造谣!尊界法务:涉案谭某某等被依法处置
快科技2月28日消息,今晚,尊界汽车法务官微发文,称近期发现网络上大量账号恶意造谣、恶意诋毁尊界,严重歪曲事实、误导公众
2025-02-28 23:07:00
芯片之母!国产EDA大厂芯华章大地震:CEO、CTO、COO全部换人 官方回应
快科技3月1日消息,EDA被视为“芯片之母”,是设计芯片不可或缺的重要环节,一直被国际企业所垄断,但国产势力也正在迅速崛起
2025-02-28 23:07:00
华为设计师激进!鸿蒙全新形态手机来袭:一款友商想不到的产品
华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东在微博发布了一段视频,公布了华为接下来将在手机领域的新动作——华为三月将发布一款“别人想不到的”产品
2025-02-28 23:07:00
理想5月推出L系智驾焕新版:升级单Thor-U芯片
与往年一样,理想汽车提前对外公布了今年新款车型升级改动,为广大消费者们提供更透明主动地购车决策。理想汽车副总裁刘杰在微博表示
2025-02-28 23:07:00