• 我的订阅
  • 头条热搜
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...域。我们认为ChatGPT中短期内产业化的方向主要分为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块。ChatGPT的成功,预示着人工智能(AI)无论在经济性与可获得性上都达到了支持普及的水平。同时,ChatGPT...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
万字长文:产品经理视角下的AI绘画全解析
...果几乎一致。话归正题,OpenAI的这次开源,提供了一条多模态通道,让“以文生图”的效果得到进一步提升(以前不是没有类似的模型,但没有这个效果好)。现在,当我们说“画一个牛油果椅子”,计算机就会将这句话通过CLI...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编码-解码网络结构,并引入基于用户反馈的强化学习(RLHF)和细粒度的提示-隐变量对齐技术,提高了模型对图像多尺度信息的建模能力,...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者
...品 | 搜狐科技作者 | 潘琭玙OpenAI在3月15日凌晨正式发布多模态大模型GPT-4,作为深度学习的新里程碑,据OpenAI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
Meta最新 6模态大模型,让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现在AI也可以。尽管画面中没有出现人类,AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...的。现在试想,如果上传的商品信息既能在文字、图像等模态上保持不变,又能够与文字、图片、视频等模态模型实现很好的融合,从而为商家产出AI商品图、海报、短视频,甚至是3D交互内容,这个市场需求是很大的。今年,...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
...家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声...……更多
AIGC产业图谱发布 影谱科技打开AIGC垂直领域应用新思路
...覆盖文本、图像、音频、视频、3D模型、触觉等跨越多种模态的内容理解和转换生成业务中。据悉,其跨模态开放任务处理能力可为元宇宙会展、智慧媒体、智慧科教、智慧文娱、数字商业等通用场景任务提供AI感知、理解和数...……更多
最快六月露面!GPT-5七大震撼能力首次揭秘
...GPT-5最具变革性的能力。1音频和视频处理——更强大的多模态处理能力GPT-5比GPT-4更加强大的数据理解能力,可以在多模态理解方面表现更出色。它将延续GPT-4的文本和图像处理功能,同时加入音频和视频的处理服务,从而能够准...……更多
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力,特别是题目包含图像的考题 —— 这对医疗人工...……更多
Sora爆火96小时国内大模型进场
...车面临不小的难度。碾压同行2月16日,谷歌发布新一代多模态大模型Gemini 1.5 Pro,在性能上超越OpenAI的GPT-4 Turbo,堪称业界最强大模型。然而,OpenAI在同一日发布Sora大模型,风头直接盖过谷歌,仅需通过文本即可自动生成视频,...……更多
“大模型”时代 路凯智行如何Rock AI
...型,随着近几个月SORA的横空出世,融合语言与视觉的多模态模型也已初露峥嵘,但目前市面上的通用大模型并非“万金油”,面向垂直领域内的各类生成式AI应用还需要结合场景需求积累数据和构建定制化的模型。矿山无人驾驶...……更多
产品角度分析GPT-4的更新及影响
...现之间是有区别的,一定要弄清楚这个概念!!虚假的多模态LLM:LLM本身不理解图像,我们先用一些图转文的工具(例如CLIP),把图片转成文字,再将这个文字拼接进Prompt中,例如“我刚给你发了一张图,图的内容是一只黑色...……更多
...能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,...……更多
英国ai初创公司wayve公布gaia-1最新进展
...驶车辆的行为和场景特征进行细致的控制,且由于GAIA-1多模态的性质,能够从多种提示模式和组合中生成相关视频。▲图源Wayve官方提到,GAIA-1可对环境进行学习,从而提供结构性的环境理解,协助自动驾驶系统做出明智的决策...……更多
打破视觉壁垒!GPT-4发布,概念股走低,对产业有何影响?企业回应
...低。当地时间3月14日,ChatGPT开发商Open AI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4“给它看张草图,一秒生成网站”的惊人表现被称为“王炸”产品。GPT-4发布后,A股市场的ChatGPT概念股并没有延续数月前的疯...……更多
前商汤通用模型负责人打造3D大模型「Tripo」,3D生成迈入「秒级」时代 | 早期项目
...VAST团队认为通过统一表示、模型和数据,以及借鉴其他模态的成功经验,可以有效地解决当前3D内容生成面临的挑战,实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核...……更多
AIGC工具测评:生成式AI的产品表现如何
...力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格,其简洁的设计语言和优化的...……更多
出门问问内测探索大模型“序列猴子”,为个人与企业打造专属CoPilot
...力AGI“降临”出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。大会上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生成将成为新一代生产方式,带来行业发展的新机遇。肖欣延分别从图片...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
AI拜年火了,通义千问上线一张照片生成拜年视频
...技公司争相入局大模型的研发,大模型也逐渐从单一文本模态,向语音、图像、视频等多模态方向演进,这些前沿技术不再遥不可及,展现了巨大的应用潜力,改变千行百业的同时也开始走进千家万户。作为国产大模型产品的代...……更多
“百模大战”,国产 GPT 大全
...om/紫东太初紫东太初是中国科学院自动化研究所研发的跨模态通用人工智能平台。实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。现已...……更多
这周,5家公司发了AI新品 | 最前线
...力,钉钉个人版对目前企业版进行了“瘦身”,在提供多模态交互的AI能力的同时,整合了wolai知识库、阿里云盘以及视频会议、通讯等基础功能。接入“通义千问”后,钉钉个人版对个人办公流程的最大改造之处,在于用敲入...……更多
更多关于科技的资讯:
发布全球首款ALL-in-ONE全能激光大灯
4月25日,2024北京国际汽车展览会正式拉开帷幕,作为今年国内首个国际A级车展,吸引了国内外众多知名汽车品牌、零部件企业及科技公司高规格参展
2024-04-26 22:25:00
本文转自:中国新闻网4月26日,2024中关村论坛年会脑机接口创新发展与应用论坛在北京举办,清华大学长聘教授高小榕在会后接受采访时表示
2024-04-26 23:19:00
广交会观察:海外市场逐步回暖 中国“好礼”礼遇世界
本文转自:中国新闻网中新社广州4月26日电 题:广交会观察:海外市场逐步回暖 中国“好礼”礼遇世界中新社记者 蔡敏婕伴随礼品市场消费不断升级
2024-04-26 23:14:00
本文转自:中国新闻网中新社北京4月26日电 (记者 陈杭 吕少威)脑机接口创新发展与应用论坛26日在京举办。作为2024中关村论坛年会的平行论坛之一
2024-04-26 23:24:00
本文转自:中国新闻网中新社北京4月26日电 (记者 刘育英)中国的智能制造已经进入重点行业骨干企业普及发展新阶段。在26日举行的中关村论坛智能制造创新发展论坛上
2024-04-26 23:24:00
看,计算机在练“分身术”
本文转自:新华社飞驰的人工智能需要“飞驰的算力”一边是越来越复杂的计算问题另一边是增长乏力的算力供给传统计算机已经不够用了再者超级计算机是“吞电巨兽”目前世界上最大的超级计算机耗电量相当于一个小型火力发电站的发电量如何节省更多能源
2024-04-26 23:59:00
本文转自:新华网脑机接口是人或动物脑与外部设备间创建的直接连接通路,如同大脑与机器的“直接对话”。近年来,脑机接口技术飞速发展
2024-04-26 23:54:00
日前,麦积区举办以“创新、体验、成长
本文转自:天水日报日前,麦积区举办以“创新、体验、成长”为主题的首届中小学生创客编程人工智能暨智能机器人大赛。参赛选手通过编程
2024-04-27 00:15:00
本文转自:海东日报□新华社记者 丁乐 王聿昊进场排队、等摆渡车排队、合作洽谈排队……第135届广交会正在广州火热举行,展馆内外人气十足
2024-04-27 00:16:00
本文转自:大连日报本报讯(大连新闻传媒集团记者郑鸿)昨日,大连海外华昇电子科技有限公司高端微/纳米级电子材料产业化一期项目在金普新区落成投产
2024-04-27 00:18:00
“智慧”就业服务 助力大学生快速入职
本文转自:劳动午报求职季,在上海,高校毕业生择业对接会首次设置智慧就业专区,能“刷脸”投简历的“1号求职机”吸引不少人尝试……近期
2024-04-27 00:30:00
本文转自:劳动午报如今,说起短视频,几乎没人不知道。在10多亿网络用户中,短视频应用的用户黏性最高,一些地方的人均单日使用时长达151分钟
2024-04-27 00:30:00
本文转自:南通日报政策稳定、服务给力,入园企业乐当“红娘”——企业“朋友圈”集聚产业链“来这里找朋友时,发现环境非常好
2024-04-27 00:34:00
“趣”享运动快乐 凝聚奋进力量
本文转自:周口日报4月26日上午,周口日报社、周口移动公司迎“五一”职工趣味运动会在周口移动公司举行。拔河比赛、篮球比赛、跳绳比赛……现场紧张又热烈,妙趣横生,每项运动不仅考验参
2024-04-27 00:53:00
本文转自:陇东报2024年德国汉诺威工业博览会26日闭幕。展会期间移动通信技术专家表示,目前正处于研发阶段的第六代移动通信技术(6G)将带来显著性能提升以及附加功能
2024-04-27 00:58:00