• 我的订阅
  • 头条热搜
Meta开源多感官人工智能模型,整合文本、音频视觉等六类数据
Meta公司发布了一个新的开源人工智能模型ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成...……更多
...推“双子座” 号称最强AI模型安峥本报记者 安峥在美国人工智能(AI)初创公司OpenAI发布ChatGPT、引发人工智能开发竞赛一年后,美国谷歌公司于当地时间12月6日推出一款全新人工智能模型“双子座(Gemini)”。“多感官”特点...……更多
电影里的人工智能照进现实?GPT-4o挑战苹果Siri
...式是自己用过的最好的计算机界面。“感觉就像电影里的人工智能一样;我仍然有点惊讶它是真的。事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”奥特曼还提到,OpenAI的重要使命之一就是免费(或以优惠...……更多
微软推出全能型人工智能模型 Kosmos-1
...处理文本、音频、图像和视频等内容,构建一个全能型的人工智能,可以像人类思维一样来处理任务。研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1论文中的...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...型技术,体验远超Siri。OpenAI发布应用,恰恰说明应用在人工智能领域大有可为。目前看来,GPT-5可能还要‘难产’一段时间。”猎豹移动董事长兼CEO傅盛表示。近期业内对大模型在既有参数下推动应用落地、商业变现多有讨论。...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型...……更多
《2023人工智能赋能网络视听产业观察报告》在青发布
...新技术浪潮下的智能视听步入深度变革新阶段——2023年人工智能赋能网络视听产业观察报告》。《报告》围绕综合视频、短视频、网络直播和网络音频四种视听形态梳理了2023年人工智能赋能网络视听创新应用的典型案例,以及...……更多
...。OpenAI CEO山姆・奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...PU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速度明显快于v4 TPU。一年前,在人工智能开发机构OpenAI发布聊天机器人ChatGPT后,创...……更多
海康威视(002415)新增【人工智能大模型】概念
...根据市场公开信息整理,5月19日海康威视(002415)新增【人工智能大模型】概念。新增概念原因:公司从几年前就开始研发视觉大模型,现在已经到了多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及...……更多
微软发布ai声音生成工具vall-e
1月10日消息,微软最近发布了一款名为VALL-E的人工智能工具,只需3秒音频即可模仿人说话。该工具经过60000小时英语语音数据的训练,并使用特定语音的3秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E可以复制说话...……更多
OpenAI发布GPT-4o,人工智能AIETF涨0.85%
...应时间,已经达到了人类的级别!受消息面的催化,今日人工智能AIETF(515070)开盘冲高,截至发稿,人工智能AIETF(515070)涨0.85%,持仓股中恒玄科技领涨超6%,中科创达、云从科技、神州泰岳、全志科技等个股跟涨。总结下来...……更多
谷歌宣布向云计算客户开放Gemini Pro,开发者可用其构建应用
12月14日消息,美国时间周三,谷歌宣布了一系列升级的人工智能(AI)功能,旨在为其云计算客户提供更好的服务。这家科技巨头正试图赶上竞争对手,比如微软和OpenAI,它们都在积极利用人工智能的热潮。据报道,谷歌发布...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...研究所“紫东.太初”大模型研究中心常务副主任、武汉人工智能研究院院长王金桥在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架。借用Hugging Face...……更多
谷歌发布音乐AI工具MusicFX:一句话就能生成一首音乐
...代表了AI发展过程中的趋势,用户在帮助企业完善和塑造人工智能方面的作用变得越来越重要,通过在早期阶段让用户参与进来,谷歌不仅增强了技术,还主动解决了潜在的道德问题。此外,MusicFX的出现可能会降低音乐创作的门...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
封面新闻记者 马晓玉 边雪2022年底的人工智能的热潮是OpenAI的ChatGPT带来的,而2023年底,谷歌带着它的Gemini高调杀回人工智能圈。美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...、机械臂,还有NLP对话和视觉生成等,进一步加速了通用人工智能的进度。PhysDiff 是英伟达推出的人体运动生成扩散模型,进一步解决了AI人体生成中漂浮、脚滑或穿模等问题,教会AI模仿使用物理模拟器生成的运行模型,并在...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...Carthy)等人在具有传奇色彩的“达特茅斯会议”上创造“人工智能”这个术语,被认为标志着 AI 技术的正式诞生。之后半个世纪当中,计算机技术飞速进步,AI 也影响了全球经济和社会发展。直至今日,全球共经历了三次 AI 浪...……更多
规范深度合成技术中国走在全球前列(专家解读)
...。”《华尔街日报》网站报道称,所谓深度合成,就是由人工智能软件生成或编辑内容,可以让人们看起来完成了一些从未做过的事情。深度合成技术是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频...……更多
...日报客户端王云娜3月14日,湖南省工信厅发布2024年全省人工智能大模型技术应用项目建设计划,21个项目入选,总投资超9.4亿元。21个项目聚焦文本生成、视频生成、音频生成、数字人等应用场景,涵盖工业制造、自动驾驶、医...……更多
...tGPT在哪些方面“更像人”新华社记者 陈丹 袁原美国开放人工智能研究中心(OpenAI)13日展示最新版本ChatGPT:与使用者展开语音对话、识别图像并展开讨论、翻译……相比先前版本,它与使用者对话基本无延迟,会倾听,能唠嗑...……更多
...模型API,或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配,推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。阿里云CTO周靖人表示,开源...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型, Sora能够根据文本指令创造出既逼真又富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI 官网展示的众多案例我们可以看到...……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...聊天机器人ChatGPT于2022年11月推出加持,2023年成为了AI(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GPT-4o的“o”取自Omni(全能),它...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...多模态的意义在于,为AI应用带来更多的可能性,是通用人工智能发展的关键。因此,Gemini上线是AI产业发展的里程碑事件,原生多模态AI有望拓展大模型的应用场景和边界。国盛证券分析称,Gemini的问世将为业界贡献大模型泛化...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...产业分析、产品对比等各类复杂需求,带来全新的颠覆式人工智能体验。「天工SkyMusic」是目前国内首款且唯一公开可用的AI音乐生成大模型,其采用音乐音频领域类Sora模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches ...……更多
APUS李涛阐述AI战略:为中国定制AI大模型,让大模型应用与价值创造接轨
...“AI向新 智领未来”为主题,以多年互联网从业经验和对人工智能发展的分析研判为锚点,深入剖析AI对于人类社会发展的意义、产业前景及当前行业转型痛点,并提出AI大模型价值创造“六要素”等创新观点。演讲以行业洞察...……更多
用AI当导演,一个人就能拍电影?
2022年11月,OpenAI研发了人工智能技术驱动的自然语言处理工具 ChatGPT,开启了一种全新的检索信息和交流方式,它可以与人类互动,甚至能撰写影视脚本、文案、代码、论文等工作。ChatGPT 短短上线2个月,月活跃用户就已成功过...……更多
...报技术狂飙突进,共识规则亟待建立——访华东政法大学人工智能与大数据指数研究院院长高奇琦周丹旎本报记者 周丹旎最近,OpenAI推出的文生视频大模型Sora引爆全网,因其模拟逼真场景的强大能力,被视为“颠覆性”的存在...……更多
更多关于科技的资讯:
5月29日三只松鼠上海全域生态大会 将重磅发布线下新店型
5月15日晚,三只松鼠创始人、CEO章燎原在其视频号里公布了线下门店全新店型矩阵,并透露将于5月29日在上海举办全域生态发布会
2024-05-17 20:09:00
直播预告|宠粉福利来袭!南海网25周年将联动王府井海垦广场开启“520回馈季”专场直播
>>点击提前收藏直播页面<<新海南客户端、南海网、南国都市报5月17日消息(记者 杜倬荷)当椰风海韵牵手京圈名牌
2024-05-17 20:22:00
瓜分千万大奖!XbotMan—2024明月湖硬科技创业者大赛火热报名中
你想得到创业大咖的指导吗?你想拥有资本的青睐吗?这场硬科技创业者大赛正在报名中。5月17日,上游新闻记者从重庆市两江新区获悉
2024-05-17 20:10:00
谷歌展示了电话反诈功能,基于本地运行的大语言模型来实现
2024年5月14日,谷歌如期举办了2024年的GoogleI/O大会。会议上谷歌重点宣传了其最新最先进的AI技术,并展示了大部分功能的应用场景
2024-05-17 20:42:00
三星HBM3E尚未通过英伟达验证,卡在台积电审批环节
此前有报道称,美光、SK海力士和三星先后在去年7月底、8月中旬、以及10月初向英伟达提供了8层垂直堆叠的HBM3E(24GB)样品
2024-05-17 20:42:00
敢为定有可为 ——平安人寿新疆分公司“财富康养保险规划师项目”正式发布!
新疆网讯(记者张佳元 通讯员写徐新雯)为顺应行业和市场发展趋势,赋能队伍高质量转型,加大“优+”人才招募力度, 5月17日
2024-05-17 20:57:00
加速拥抱鸿蒙,哪吒汽车APP启动鸿蒙原生应用开发
5月17日,由上海市经济和信息化委员会指导的“千帆竞发启航共筑鸿蒙生态——HDD上海站·鸿蒙原生应用专场”活动举办。在鸿蒙原生应用启动仪式上
2024-05-17 21:42:00
本文转自:中国新闻网中新社香港5月17日电 (记者 刘大炜)“国际材料学会国际电子材料年会2024”17日在香港会议展览中心开幕
2024-05-17 21:54:00
本文转自:人民日报客户端沈文敏5月17日,为期一个月的2024上海信息消费节拉开帷幕。开幕式上,对寻找最好的“上海制造”——推进上海市工业企业数智化工作实施方案的阶段性成果进行了展示
2024-05-17 22:07:00
本文转自:新华网近年来,随着互联网经济的进一步纵深发展,电子商务继续保持增长态势。在各种形态的电商经营模式之中,跨境电商更是一枝独秀
2024-05-17 22:13:00
本文转自:人民日报客户端沈文敏5月17日,上海随申行智慧交通科技有限公司与华为技术有限公司签署鸿蒙生态合作协议,将共同推动智能应用技术突破
2024-05-17 22:28:00
本文转自:中国新闻网近日,上海市崇明区消防救援支队长兴特勤站李勇、郎强强和施方良三名指战员研发的“消防梯防坠落保护装置”
2024-05-17 22:54:00
南京雨花台区“惠动雨花 焕新嗨购”2024“美好焕新”首场活动人气爆棚
5月15日-17日,首场“惠动雨花 焕新嗨购”2024“美好焕新”雨花台区消费活动走进南京东久创新中心,拉开了雨花“焕新”消费的序幕
2024-05-17 23:00:00
老年人也爱木玩? “银发经济”促浙江云和产业焕新机
本文转自:中国新闻网中新网丽水5月17日电(邵燕飞 傅飞扬 王凤凤) “老年木玩游戏有趣又好玩,练手脚还要动脑筋。”日前
2024-05-17 23:04:00
本文转自:中国新闻网中新网梧州5月17日电(覃祝 柯亮)近日,在广西梧州综合保税区梧州综保电子商务有限公司的仓库内,燕麦
2024-05-17 23:04:00