• 我的订阅
  • 头条热搜
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...域。我们认为ChatGPT中短期内产业化的方向主要分为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块。ChatGPT的成功,预示着人工智能(AI)无论在经济性与可获得性上都达到了支持普及的水平。同时,ChatGPT...……更多
万字长文:产品经理视角下的AI绘画全解析
...果几乎一致。话归正题,OpenAI的这次开源,提供了一条多模态通道,让“以文生图”的效果得到进一步提升(以前不是没有类似的模型,但没有这个效果好)。现在,当我们说“画一个牛油果椅子”,计算机就会将这句话通过CLI...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...研究员成立。与Stability AI类似,黑森林致力于研发优质多模态模型并开源,目前已完成3100万美元(约合人民币2.25亿元)的种子轮融资。黑森林还预告不久之后将发布SOTA(当前技术指标第一)视频模型。从其放出的Demo来看,无...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编码-解码网络结构,并引入基于用户反馈的强化学习(RLHF)和细粒度的提示-隐变量对齐技术,提高了模型对图像多尺度信息的建模能力,...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者
...品 | 搜狐科技作者 | 潘琭玙OpenAI在3月15日凌晨正式发布多模态大模型GPT-4,作为深度学习的新里程碑,据OpenAI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
...。AIGC不仅提升了新闻采编工作的效率与质量,还通过多模态、多渠道的新闻生产、整合、分发重塑新闻传播业态。AIGC助推报道效率与质量“双提升”AIGC在新闻报道中的应用体现在自动化内容生成和数据驱动的深度分析两个方面...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
Meta最新 6模态大模型,让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现在AI也可以。尽管画面中没有出现人类,AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...的。现在试想,如果上传的商品信息既能在文字、图像等模态上保持不变,又能够与文字、图片、视频等模态模型实现很好的融合,从而为商家产出AI商品图、海报、短视频,甚至是3D交互内容,这个市场需求是很大的。今年,...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
...7.21705项目地址:https://ali-videoai.github.io/tora_video/一、三种模态组合输入,精准控制运动轨迹Tora支持轨迹、文本、图像三种模态,或它们的组合输入,可对不同时长、宽高比和分辨率的视频内容进行动态精确控制。轨迹输入可以...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
...家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声...……更多
AIGC产业图谱发布 影谱科技打开AIGC垂直领域应用新思路
...覆盖文本、图像、音频、视频、3D模型、触觉等跨越多种模态的内容理解和转换生成业务中。据悉,其跨模态开放任务处理能力可为元宇宙会展、智慧媒体、智慧科教、智慧文娱、数字商业等通用场景任务提供AI感知、理解和数...……更多
最快六月露面!GPT-5七大震撼能力首次揭秘
...GPT-5最具变革性的能力。1音频和视频处理——更强大的多模态处理能力GPT-5比GPT-4更加强大的数据理解能力,可以在多模态理解方面表现更出色。它将延续GPT-4的文本和图像处理功能,同时加入音频和视频的处理服务,从而能够准...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力,特别是题目包含图像的考题 —— 这对医疗人工...……更多
Sora爆火96小时国内大模型进场
...车面临不小的难度。碾压同行2月16日,谷歌发布新一代多模态大模型Gemini 1.5 Pro,在性能上超越OpenAI的GPT-4 Turbo,堪称业界最强大模型。然而,OpenAI在同一日发布Sora大模型,风头直接盖过谷歌,仅需通过文本即可自动生成视频,...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
“大模型”时代 路凯智行如何Rock AI
...型,随着近几个月SORA的横空出世,融合语言与视觉的多模态模型也已初露峥嵘,但目前市面上的通用大模型并非“万金油”,面向垂直领域内的各类生成式AI应用还需要结合场景需求积累数据和构建定制化的模型。矿山无人驾驶...……更多
更多关于科技的资讯:
“数”领未来,天翼云TeleDB助力企业制胜数字时代
近日,第15届中国数据库技术大会(DTCC2024)在北京召开。大会以“自研创新数智未来”为主题,重点围绕向量数据库与向量检索技术实践
2024-09-04 22:45:00
亨通集团首期海外产业公司优秀员工总部研修班开营
本文转自:人民网-江苏频道亨通集团首期海外产业公司优秀员工总部研修班现场。9月2日,亨通集团首期海外产业公司优秀员工总部研修班在苏州开营
2024-09-04 23:07:00
智界R7为爆款而来!迎击特斯拉Model Y
智界S7上市后所面临的一些教训和打击,不会出现在智界R7身上。8月底,在鸿蒙智行新品发布会中,余承东首次亮相智界R7,公布了该车一些核心参数配置
2024-09-04 23:08:00
DXO手机人像照片调研出炉:华为Pura 70 Ultra满意度第一
快科技9月4日消息,日前,评测机构DXOMARK在上海进行手机人像照调研,此次调研由80名手机用户、10位摄影师组成多元化小组
2024-09-04 23:38:00
本文转自:人民日报海外版《 人民日报海外版 》( 2024年09月05日 第 09 版)本报电 (记者刘峣)近日,在第二届“领航杯”工业软件科技创新设计大赛决赛上
2024-09-05 04:44:00
本文转自:人民日报海外版《 人民日报海外版 》( 2024年09月05日 第 09 版)记者9月3日从黑龙江省鹤岗市召开的天然石墨高质化利用成果发布会上了解到
2024-09-05 04:44:00
上汽大众发布全新帕萨特pro“黑武士”官图
9月4日消息,上汽大众今天发布了全新帕萨特 Pro“黑武士”运动套件车型的官图,主要针对外观进行黑化处理。从外观来看,新车除了黑色车漆以外
2024-09-04 21:24:00
小鹏汽车monam03爆单,何小鹏亲自给员工送上下午茶
9月4日消息,根据博主@小吕斯基9月3日发布的视频,小鹏汽车MONAM03爆单,何小鹏亲自给员工送上下午茶。视频中,何小鹏将一份份点心送至员工手上
2024-09-04 21:25:00
武建飞研究员研发出新型硫化锂正极材料
9月4日消息,据中国科学院青岛生物能源与过程研究所官方8月29日消息,该所武建飞研究员带领的先进储能材料与技术研究组,研发出用于全固态锂硫电池的新型硫化锂正极材料
2024-09-04 21:25:00
2023年安徽省工业软件产品收入超过60亿元
大皖新闻讯 9月4日,安徽省工信厅组织省内知名工业软件研发企业负责人和高校相关专家学者以及工信厅相关业务处室负责人举行关于工业软件发展互动会
2024-09-04 21:27:00
梦想与勇气的化身:国弘团队高鑫龙的创新投资之旅
高鑫龙,这位拥有清华大学双硕士学位的才俊,以其卓越的智慧与无畏的胆识,正在为商业投资注入新的活力和方向。在一次深度访谈中
2024-09-04 22:05:00
微星X870系列主板来了:适配锐龙9000系列、显卡快拆设计
快科技9月4日消息,微星X870系列主板将于9月30日上市开售,首发4个型号。据悉,微星X870系列包括PRO X870-P WIFI
2024-09-04 22:08:00
小米14系列总销量将破千万台 小米15有望冲击1500万台
【CNMO科技消息】在雷军喊了数年“米冲高”后,小米的旗舰手机销量似乎真的快要迎来春天了。小米14近日,有数码博主分享了一张来自知名财经平台雪球的一张截图
2024-09-04 22:24:00
华为宣布9月10日举办发布会:正面硬刚苹果,三折屏手机将亮相
万众期待的华为秋季新品发布会在今天正式官宣,华为终端今天上午宣布,华为见非凡品牌盛典及鸿蒙智行新品发布会将于9月10日14点30分举办
2024-09-04 22:24:00
小米10月发布会新品种类曝光 除了小米15系列还有这些
【CNMO科技消息】近日,小米下一代旗舰机型小米15系列正式入网的消息在网络上引发了不少人关注,而有博主透露,除了小米15系列外
2024-09-04 22:25:00