• 我的订阅
  • 头条热搜
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...。全自研技术All in 大模型的智谱 AI,很早就开始部署多模态生成式 AI 模型。从 2021 年开始,智谱 AI 先后发布了 CogView(NeurIPS’21)、 CogView2(NeurIPS’22)、CogVideo(ICLR’23)、Relay Diffusion(ICLR’……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势,行业专家们也给出了一些...……更多
四川省首批8个人工智能高质量数据集发布
...量等方面符合相关要求,以文本、图像、音频、视频等多模态呈现,可直接用于开发和训练人工智能模型的数据集,包含行业通识和行业专识数据集。四川省首批人工智能高质量数据集充分利用全省海量数据资源、严格按照国家...……更多
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...选择基于扩散模型、文本和掩码的图像编辑方法、以及多模态大型语言模型(MLLMs) 进行实现,并设计了简约实用的用户界面。MagicQuill的具体构成一起来看看MagicQuill系统的具体构成是什么样的。主要分为3个部分:1.编辑处理器...……更多
2023 的人工智能之年
...的情感和情绪。Google 在 Bard 聊天机器人中融入了基于多模态数据集训练的 Gemini,它被誉为目前“最强大”的 AI 模型,是 OpenAI 的 ChatGPT 最强的竞争对手之一。Grok:Elon Musk 的创业公司 xAI 展示了其对 AI 开发的承诺,并可能与 Open.……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...的整体性方案,不仅包含了文档大模型能力,还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机,基于垂直模型能力和软硬件相互配合,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
... CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...“文心百中”。去年,阿里达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破。其中使用 512 卡 V100 GPU 实现全球最大规模 10 万亿参数多模态大模型 M6,同等参...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
字节版Sora火爆24小时,同名论文再次被热议
...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型,支持文生/图生视频,时长可达10s。以PixelDance为例,其最大特色在于多主体交互,一致性多镜头生成。啥意思??——直接来看几个官方demo。First kill,现在手上有这...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...他的作品。为了解决这一难题,行空板引入了MultinomialNB模型——一种用于文本分类的机器学习模型,朴素贝叶斯分类器的一种。通过这一模型,行空板实现了古诗词作者的快速识别,不仅提升了古诗词的互动性,还为诗词爱好...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...算法至关重要,以便进行准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。此前OpenAI公司CEO奥尔特曼(Sam Altman)就已经否认了公司将会发布GPT-5,他表示新版GPT非常“神奇”。根据OpenAI官方网站介绍,GPT-4o中的“o”代表Omni,也...……更多
厦大教授团队自主研发的思源大模型“霸榜”权威榜单,“优等生”是怎样炼成的?
...型榜单客观能力评测中排名第一(2024年1月);在腾讯多模态大模型榜单中排名第一(2023年11月)。事实上,在过去十年里,许多AI头部企业的主打产品都有思源大模型团队的技术加持。目前,思源大模型团队已与华为、腾讯等...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
...还需要哪些技术支持?司马华鹏称:“我们的大模型是多模态的,是文本生成、声音生成和数字人生成的结合。其实很多人在反馈,他(刘强东)声音和节奏感与他原来讲话不太一样。这很可能克隆的是平时的语速,但是直播(...……更多
更多关于科技的资讯:
OPPO Pad3上手:生产力工具实至名归
在当今数字化工作与学习日益普及的时代,平板电脑已经从单纯的娱乐设备进化为不可或缺的生产力工具,长时间使用需求也让显示素质成为了选购产品时的重要指标之一
2024-11-26 18:01:00
国产版劳斯莱斯!鸿蒙智行尊界S800亮相:星汉灿烂大灯、星空顶上车
快科技11月26日消息,今天下午举办的华为Mate品牌盛典上,尊界S800正式亮相。余承东介绍,尊界S800采用天地人和的设计理念
2024-11-26 18:01:00
22.98万起!华为智界新S7正式上市 12月1日开启交付
快科技11月26日消息,新款智界S7已正式上市,售价22.98-31.98万元,提供Pro、Max、Max RS三款车型
2024-11-26 18:01:00
全系800V 智界新S7入门就配82度大电池:能跑705km
快科技11月26日消息,在今日举办的华为发布会上,余承东带来了智界新S7,该车定位于纯电轿跑,一共有Pro、Max和Ultra三种版本
2024-11-26 18:01:00
华为Mate X6标准版和典藏版有啥区别 一文看懂
快科技11月26日消息,华为正式发布了旗下第4款横向内折机Mate X6系列,带来了Mate X6和Mate X6典藏版
2024-11-26 18:01:00
突然!任天堂国行Switch 2026年停止运营:多款游戏无法联机
快科技11月26日消息,今日,腾讯官方宣布任天堂国行Switch将于2026年3月31日起至2026年5月15日,逐步停止Nintendo e商店和其他网络相关运营服务
2024-11-26 18:01:00
极越CEO回应抄袭特斯拉:理念相似并非抄袭
快科技11月26日消息,极越汽车CEO夏一平最近在视频中回应了关于公司抄袭特斯拉的争议。他明确指出,极越的设计灵感来源于自家的全球首款AI智驾超跑ROBO X
2024-11-26 18:01:00
100-150万元!华为百万豪车尊界S800预售:意向金2万
快科技11月26日消息,由华为和江淮合作打造的尊界品牌首车尊界S800正式开启预售,价格为100-150万元,意向金2万元
2024-11-26 18:01:00
长春机场完成“96665”自助语音系统升级
为了进一步提升“96665”自助语音系统的稳定性和安全性,确保为旅客提供更加优质和高效的问询服务,11月24日,长春机场顺利完成了“96665”自助语音系统的全面升级工作
2024-11-26 18:26:00
玄奘之路“宏才戈友会”成立大会暨宏才千人盛典年会盛大起航
宏才戈友会成立大会暨2024年宏才同学年会,于11月24日圆满落下帷幕!大会特邀玄奘文旅集团创始人张文峰、玄奘文旅集团联合创始人兼赛事总监张晓菲
2024-11-26 18:28:00
中国人民银行近日公布2023年度金融科技发展奖获奖项目名单。山西证券及其子公司山证科技申报的“FICC数字资产管理平台”项目获二等奖
2024-11-26 18:29:00
499元起!大疆发布DJI Mic Mini迷你无线麦克风:可400米传输
快科技11月26日消息,大疆今晚发布了DJI Mic Mini迷你无线麦克风,售价499元起!DJl Mic Mini 发射器小巧轻便
2024-11-26 22:01:00
比5.5G还快!华为Mate 70 Pro+网速实测:比Mate 60 Pro快一倍
快科技11月26日消息,今天,华为正式推出了备受期待的Mate 70系列手机。在发布会上,华为消费者业务CEO余承东特别强调了该系列手机在通信技术方面的卓越表现
2024-11-26 22:01:00
听歌APP会员到期将扣1800元 女子差点被骗365万元
快科技11月26日消息,近日,杭州上城一女子遭遇冒充客服的电信网络诈骗。在银行工作人员与民警的共同努力下,她账户中的365万元被成功保住
2024-11-26 22:31:00
中国汽车流通协会:全年预计关停4S店数量将达4000家
快科技11月26日消息,中国汽车流通协会副秘书长郎学红预测,今年将有约4000家4S店退网,下半年退网数量可能超过上半年的1500家
2024-11-26 22:31:00