• 我的订阅
  • 头条热搜
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...域。我们认为ChatGPT中短期内产业化的方向主要分为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块。ChatGPT的成功,预示着人工智能(AI)无论在经济性与可获得性上都达到了支持普及的水平。同时,ChatGPT...……更多
万字长文:产品经理视角下的AI绘画全解析
...果几乎一致。话归正题,OpenAI的这次开源,提供了一条多模态通道,让“以文生图”的效果得到进一步提升(以前不是没有类似的模型,但没有这个效果好)。现在,当我们说“画一个牛油果椅子”,计算机就会将这句话通过CLI...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编码-解码网络结构,并引入基于用户反馈的强化学习(RLHF)和细粒度的提示-隐变量对齐技术,提高了模型对图像多尺度信息的建模能力,...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者
...品 | 搜狐科技作者 | 潘琭玙OpenAI在3月15日凌晨正式发布多模态大模型GPT-4,作为深度学习的新里程碑,据OpenAI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
...。AIGC不仅提升了新闻采编工作的效率与质量,还通过多模态、多渠道的新闻生产、整合、分发重塑新闻传播业态。AIGC助推报道效率与质量“双提升”AIGC在新闻报道中的应用体现在自动化内容生成和数据驱动的深度分析两个方面...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
Meta最新 6模态大模型,让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现在AI也可以。尽管画面中没有出现人类,AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...的。现在试想,如果上传的商品信息既能在文字、图像等模态上保持不变,又能够与文字、图片、视频等模态模型实现很好的融合,从而为商家产出AI商品图、海报、短视频,甚至是3D交互内容,这个市场需求是很大的。今年,...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
...家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声...……更多
AIGC产业图谱发布 影谱科技打开AIGC垂直领域应用新思路
...覆盖文本、图像、音频、视频、3D模型、触觉等跨越多种模态的内容理解和转换生成业务中。据悉,其跨模态开放任务处理能力可为元宇宙会展、智慧媒体、智慧科教、智慧文娱、数字商业等通用场景任务提供AI感知、理解和数...……更多
最快六月露面!GPT-5七大震撼能力首次揭秘
...GPT-5最具变革性的能力。1音频和视频处理——更强大的多模态处理能力GPT-5比GPT-4更加强大的数据理解能力,可以在多模态理解方面表现更出色。它将延续GPT-4的文本和图像处理功能,同时加入音频和视频的处理服务,从而能够准...……更多
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力,特别是题目包含图像的考题 —— 这对医疗人工...……更多
Sora爆火96小时国内大模型进场
...车面临不小的难度。碾压同行2月16日,谷歌发布新一代多模态大模型Gemini 1.5 Pro,在性能上超越OpenAI的GPT-4 Turbo,堪称业界最强大模型。然而,OpenAI在同一日发布Sora大模型,风头直接盖过谷歌,仅需通过文本即可自动生成视频,...……更多
“大模型”时代 路凯智行如何Rock AI
...型,随着近几个月SORA的横空出世,融合语言与视觉的多模态模型也已初露峥嵘,但目前市面上的通用大模型并非“万金油”,面向垂直领域内的各类生成式AI应用还需要结合场景需求积累数据和构建定制化的模型。矿山无人驾驶...……更多
科大讯飞副总裁刘聪:认知智能大模型的技术阶跃及颠覆式影响|WISE2023颠覆AIGC产业发展峰会
...亚于PC或互联网诞生”;GPT-4发布后大家非常关注它的多模态能力,客观来讲其在很多语言能力上的提升更加值得重视;谷歌大脑与DeepMind合并,并且推出了PaLM2,效果也值得持续关注。认知大模型展现出的智能涌现推动了通用人...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...的?后训练功不可没从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以...……更多
产品角度分析GPT-4的更新及影响
...现之间是有区别的,一定要弄清楚这个概念!!虚假的多模态LLM:LLM本身不理解图像,我们先用一些图转文的工具(例如CLIP),把图片转成文字,再将这个文字拼接进Prompt中,例如“我刚给你发了一张图,图的内容是一只黑色...……更多
...进一步回应36氪称,HiDream.ai希望围绕视觉,打造生成式多模态基础模型及应用。当前在生成式AI视觉领域,Midjourney、Stable Diffusion已在去年走红,并被视作全球代表性产品。而梅涛表示,这类产品普遍存在优化空间,HiDream.ai的目...……更多
...能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,...……更多
英国ai初创公司wayve公布gaia-1最新进展
...驶车辆的行为和场景特征进行细致的控制,且由于GAIA-1多模态的性质,能够从多种提示模式和组合中生成相关视频。▲图源Wayve官方提到,GAIA-1可对环境进行学习,从而提供结构性的环境理解,协助自动驾驶系统做出明智的决策...……更多
打破视觉壁垒!GPT-4发布,概念股走低,对产业有何影响?企业回应
...低。当地时间3月14日,ChatGPT开发商Open AI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4“给它看张草图,一秒生成网站”的惊人表现被称为“王炸”产品。GPT-4发布后,A股市场的ChatGPT概念股并没有延续数月前的疯...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多
更多关于科技的资讯:
吴芳 北京舞蹈学院人工智能是智能时代的产物,是推动各领域智能化发展的核心技术,将之应用到舞蹈康复疗法中,不仅能够解决许多舞蹈康复治疗问题
2024-07-12 23:12:00
党辉妮 陕西医药控股集团实业开发有限责任公司摘要:在大数据、云计算、人工智能等技术的推动下,传统档案管理方式已难以满足现代社会对信息高效处理
2024-07-12 23:12:00
王璐 河南农业投资集团有限公司办公室企业文化与企业战略的协同效应是现代企业管理中备受关注的话题。随着全球化进程的加速和市场竞争的日益激烈
2024-07-12 23:12:00
颜国贤 对外经济贸易大学国际商学院激励理论作为管理心理学和组织行为学的核心组成部分,在企业管理中占据举足轻重的地位。本文深入探讨了激励理论的发展历程
2024-07-12 23:12:00
孙若岩 对外经济贸易大学国际商学院摘要:中小企业作为经济活力的重要来源,在管理模式的选择上面临诸多挑战。本文旨在探讨中小企业在快速变化的市场环境中
2024-07-12 23:12:00
白阳 韩国草堂大学在中华文化的浩瀚星空中,鼓声如同璀璨的星辰,既是音乐的灵魂,也是文化的载体。由严昌洪和蒲亨强合著的《中国鼓文化研究》一书
2024-07-12 23:12:00
iPhone 16系列要卖爆!苹果信心十足
媒体发布博文表示,苹果公司已经通知富士康等其他供应商和合作伙伴,2024年iPhone 16系列机型的出货量目标要比iPhone 15系列(8100万台)增长10%
2024-07-12 23:13:00
苹果Vision Pro今日上架英澳法多国 可能仍难扭转销售颓势
自今年2月苹果的混合现实头显Vision Pro在美国上市之后,苹果正将这款产品推广到更大的海外市场——尽管这可能无法扭转其总体惨淡的销量情况
2024-07-12 23:13:00
男生看毕业典礼被高个女生霸气抱起:有爱的一幕
7月12日消息,据媒体报道,山东一学校举行毕业典礼,全校同学在操场观看,一名三年级男生来晚了站在后排蹦跳围观。旁边女孩看了一眼后
2024-07-12 23:43:00
意大利版沙县小吃上热搜!萨莉亚靠卖预制菜年销近百亿元
7月12日消息,微博话题“萨莉亚靠卖预制菜年销近百亿元”冲上热搜榜。据媒体报道,萨莉亚公布了2024财年前三季的财报,公司在报告期内的销售额达到1632亿日元(约合人民币74
2024-07-12 23:43:00
苹果抢台积电2nm首发权:iPhone 17系列稳了
据科技媒体报道,苹果芯片的主要制造商台积电计划于下周启动对2nm芯片的测试生产工作,并计划于明年将这一先进技术应用于苹果的新芯片生产中
2024-07-12 23:43:00
苹果微软同时放弃OpenAI董事会席位 真有这么巧?
【CNMO科技消息】7月10日,CNMO注意到,据财联社消息,英国金融时报称,苹果不会在OpenAI董事会担任观察员角色
2024-07-12 20:22:00
真我GT6大爆京东成交额排名第8 可以和苹果掰手腕
【CNMO科技消息】真我GT6发布后大受欢迎。据数码博主透露,该机成交额直接干到了京东第8,可以和苹果掰掰手腕了,“GT5Pro之后第二个爆款出现了”
2024-07-12 20:22:00
服务器定制备料分分钟完成!浪潮信息超大智能立体仓库投入运营
浪潮信息服务器智能工厂发出了订单生产的备料需求,仓库管理系统(WMS)接到需求随即分解下发到各台操作设备,几百米外智能立体仓库的多台堆垛机快速启动
2024-07-12 20:23:00
三星发布会新品汇总 折叠屏稳步迭代 智能戒指很受欢迎
【CNMO科技】北京时间7月10日21点,三星在法国巴黎正式召开了GalaxyUnpacked活动。此次活动上,三星带来了多款重磅新品
2024-07-12 20:23:00