• 我的订阅
  • 头条热搜
AI拜年火了,通义千问上线一张照片生成拜年视频
...技公司争相入局大模型的研发,大模型也逐渐从单一文本模态,向语音、图像、视频等多模态方向演进,这些前沿技术不再遥不可及,展现了巨大的应用潜力,改变千行百业的同时也开始走进千家万户。作为国产大模型产品的代...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
“百模大战”,国产 GPT 大全
...om/紫东太初紫东太初是中国科学院自动化研究所研发的跨模态通用人工智能平台。实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。现已...……更多
这周,5家公司发了AI新品 | 最前线
...力,钉钉个人版对目前企业版进行了“瘦身”,在提供多模态交互的AI能力的同时,整合了wolai知识库、阿里云盘以及视频会议、通讯等基础功能。接入“通义千问”后,钉钉个人版对个人办公流程的最大改造之处,在于用敲入...……更多
GPT-4就是冲着赚钱来的!
...本相似,主要提升了语言模型方面的能力,并添加了“多模态”的图片识别功能。此外,GPT-4 将“单词最大输出限制”提高到了 25000 个单词,比基于GPT-3的ChatGPT更强大,在对问题的理解和回答方面,GPT-4也显得更聪明,更像人了...……更多
多模态AI午前大涨,游戏ETF半日涨幅近4%
今日午前,多模态AI题材午前崛起,Sora方向领涨,其中,游戏ETF(516010)和游戏ETF(159869)半日涨幅分别达到3.95%和3.93%,领涨整个ETF市场。投资逻辑方面,日前,谷歌发布了基础世界模型Genie,Genie是一个110亿参数的基础世界模...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
2023 的人工智能之年
...的情感和情绪。Google 在 Bard 聊天机器人中融入了基于多模态数据集训练的 Gemini,它被誉为目前“最强大”的 AI 模型,是 OpenAI 的 ChatGPT 最强的竞争对手之一。Grok:Elon Musk 的创业公司 xAI 展示了其对 AI 开发的承诺,并可能与 Open.……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...字小说的内容生成能力;•多,图生小说、文生插图等多模态交互能力;•长,一次读懂长达100万字小说的内容理解力。大:全球首个万字创作大模型,一键生成万字小说唐太宗办亚运会,孙悟空遇到钢铁侠,皮卡丘闯入天空之...……更多
中国首个人工智能艺术设计教育超级计算平台升级上线
...PT、Sora,ARTIDesigner1.0支持文生图、图生图、文生视频等多模态创作,用户只需输入图片或描述性文字,便可以生成多种示范应用场景。ARTI Designer1.0上线4个月来,用户人数突破34万,覆盖中国362所高校和企业。其间,蔡新元团队...……更多
开源证券:多模态AI赋能影视板块,建议继续布局IP、动画板块
...动从文生视频、图生视频,到文生音频、视频生音频、多模态图像识别的多模态AI能力持续提升及应用持续落地,Sora的推出或进一步提升AI视频生成能力,助力文字、创意、剧本等快速生成视频,多模态AI应用有望大幅降低短剧...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
双十一与AI“联姻”:激活电商第二春的新密码?
...平台、产品特点和目标客群等生成文字、图片、视频等多模态的个性化社媒营销内容,节省创作时间和创作成本,并提高营销内容的针对性和吸引力。可以说,在电商领域AI持续赋能以降本增效,覆盖多应用场景,基本上可以贯...……更多
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑
...竟发生了 180° 转变。昨天,谷歌在 X 上展示 Gemini 原生多模态能力的 6 分半钟视频下,几乎是清一色的赞扬:而到了今天,Gemini 还是那个 Gemini,但网友已经不买账了:发生了什么,才会让人们的态度一夜转变?原因在于那个 6 ...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...“文心百中”。去年,阿里达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破。其中使用 512 卡 V100 GPU 实现全球最大规模 10 万亿参数多模态大模型 M6,同等参...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...时间,苹果低调的在arxiv.org网站上发布论文,官宣了在多模态大模型领域的最新成果。在论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...供互联网实时资讯问答以及更好的数学计算等服务。在多模态大模型的视觉能力方面,工作人员分别提供了不同场景的视频和图片,“元景看见”迅速对视频、图像画面进行实时识别理解,并以文字描述方式呈现出来。除通用视觉能...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...Demis Hassabis)在发布会上表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍,在训练后期,Gemini在各类任务上都表现优异。例如,MMLU(大规模多任务语...……更多
从GPT-4、文心一言再到Copilot,AIGC的长期价值被逐渐确立
...的长期影响GPT-4一经发布,展示了其在图片语义理解等多模态场景下的优势。“看到GPT-4能理解图片,我觉得挺惊讶的”,一位投资人对数科星球(ID:digital-planet)这样说。在他看来,以往计算机在图片语义理解上进展龟速,而...……更多
从AI画画到“用声音做视频”,全球掘金AIGC | 焦点分析
...了个华丽的返场——登台的新宠儿名为“AIGC”,又称“生成式AI”(Generative AI)。这一领域正以令人侧目的速度发展,将创新和技术再度拉回到世界舞台的焦点。今年4月,一家名为Open AI的公司公布旗下的DALL-E 2模型,其用文字...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...与图像处理于一体的集成化SDK,提供AR视频技术、基于多模态感知与驱动的交互技术和基于重建的虚拟形象技术),持续以AI辅助、重塑社交环节,提升社交的效率和质量。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法:“在过去的几年里,好的多模态模型一直是许多大型技...……更多
更多关于社会的资讯:
本文转自:法治时报□ 本报记者 潘从武□ 本报通讯员 王娟今年3月,张某驾驶的网约车与王某驾驶的私家车发生交通事故,车辆受损严重
2024-06-02 01:33:00
本文转自:兰州晚报低价购买加油卡 结果被骗2万元省公安厅发布一周典型电诈案件预警兰州晚报讯 近日,A先生从朋友圈看到一则充值加油卡赚差价的广告
2024-06-02 01:34:00
本文转自:法治时报□本报记者 罗莎莎□本报通讯员 吴潇斌 贺俊丽“只要两台手机、一条对录线和两张手机卡,日入两到三千元钱
2024-06-02 01:38:00
本文转自:法治时报□本报记者 王春□本报通讯员 戚亚平近日,浙江省杭州市临平区一名头戴鸭舌帽身穿黑色外套的中年男子来到银行窗口前
2024-06-02 01:38:00
本文转自:法治时报□本报记者 战海峰□本报通讯员 梅念章签订门市转让协议后,听信风水大师的意见,认为门市风水不好要求退租
2024-06-02 01:38:00
本文转自:成都日报未来三年内成都将在“一带一路”沿线城市设立100个供应链服务站本报讯 (成都日报锦观新闻记者 杨富) 近日
2024-06-02 01:55:00
本文转自:安徽日报■ 史良高(安庆)我在安庆生活了大半辈子,市里的集贤路过去不叫集贤路,叫大庆路。大庆路于我,最初的印象源于48年前
2024-06-02 02:55:00
本文转自:凉山日报“2024新一线城市魅力排行榜”发布凉山榜上有名 位列四线城市本报讯(凉山日报全媒体记者张崇宁)5月30日
2024-06-02 03:19:00
本文转自:新华日报江苏盆景、观赏鱼、户外用品等日益成为海外消费者的新宠“小众商品”闯进国际大市场□ 本报记者 宋晓华近日
2024-06-02 04:15:00
本文转自:浙江日报一“码”刷遍长三角解民忧杭州医保:“数智分析”为跨省异地就医直接结算按下快进键张梦月 黄蕾 刘颖人在外省(市)
2024-06-02 05:37:00
本文转自:扬子晚报6月1日上午,南京海底世界特别举办了一场情趣多多的“跳水挑战赛”。俄罗斯国家跳水队队长谢尔盖,队员阿列克谢
2024-06-02 06:17:00
25个“山里娃”聚榕欢度六一
本文转自:福州晚报在“爱心妈妈”余英组织安排下25个“山里娃”聚榕欢度六一“爱心妈妈”余英抱起孩子。众人欢乐合影。福州晚报讯 昨天是六一
2024-06-02 08:14:00
本文转自:福州晚报福州晚报讯 记者从省公安厅交警总队福州高速公路支队获悉,6月3日6时至6月7日24时,交管部门将对G15沈海高速部分路段实施临时交通管制
2024-06-02 08:14:00
本文转自:福州晚报交警严查“飙车炸街”、非法改装8人被拘留两窝点被罚福州晚报讯 高考临近,连日来,福州交警持续保持高压态势
2024-06-02 08:14:00
11个月大的小萌娃徒步大赛中过“六一”
本文转自:哈尔滨日报本报记者 孙莹 文/摄 一个娇小稚嫩的身影,自己推着乳白色的婴儿车,在徒步大军中分外抢眼。这个小女孩名叫牧牧
2024-06-02 08:17:00