• 我的订阅
  • 头条热搜
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
近日,清华大学硕士生徐冬阳和所在团队,为了助力自动驾驶技术的进一步发展,他们提出一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类...……更多
自研视频生成模型实现升级,「CreativeFitting」即将面向海外市场发布AI短剧APP | 早期项目
...作内容的门槛,一些具有AI生成特点——有想象力的、多模态的——内容会聚集起来形成新一代ToC超级内容平台,CreativeFitting就在打造这样的平台。”其实,朱江对于公司的长远规划是,创业前期,先专注在研发针对高质量情节...……更多
生成式AI时代:AI服务器前景广阔,浪潮信息营收大增8成
...37亿激活参数性能对标LLaMA3-700亿。浪潮信息人工智能首席科学家吴韶华表示:当前业界大模型在性能不断提升的同时,也面临着所消耗算力大幅攀升的问题,对企业落地应用大模型带来了极大的困难和挑战。源2.0-M32是浪潮信息...……更多
...大模型Soul X,该模型具备条件可控生成、上下文理解、多模态理解等能力,能够实现有情感、有温度的交互。同时,Soul正在围绕用户需求和社交场景推进“模应一体”落地。 ……更多
AI十二谈 | 清华教授梁正:争论ChatGPT是否有创意能力,背后是人类优越感作祟
...狐科技作者 | 潘琭玙编辑 | 杨锦“界定剽窃的唯一标准是生成后新信息的含量。” 2月16日,清华大学人工智能国际治理研究院副院长梁正教授在搜狐科技《AI十二谈》节目中,隔空回应了乔姆斯基教授提出的观点——“ChatGPT本...……更多
...点和复杂的行业发展变化态势进行了回顾:生成式AI、多模态大模型的浪潮开始席卷音乐行业,AI音乐作品迎来快速突破的阶段;音乐演出的热潮仍旧持续,并进一步向高质量方向发展。同时,2023年华语数字音乐行业在发展中继...……更多
世界音乐人工智能大会在央音举办,专家探索音乐与AI跨界融合
大脑如何处理音乐?当艺术遇上AI,将会有哪些可能性?10月28日至10月30日,第二届世界音乐人工智能大会(The Second Summit on Music Intelligence)在中央音乐学院举办,大会汇聚音乐人工智能、音乐与脑科学等领域具有影响力的人物...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现智能涌现。”刘庆峰表...……更多
大厂 XR 业务线“躁动”,AIGC 能救场吗?
...里达摩院 XR 实验室,迎来了一场高层人事动荡,其首席科学家谭平以及多位高管也相继离职。2 月 16 日,成立 8 个月的腾讯 VR 部门,几乎裁撤了该业务线全部的 300 多人,腾讯的对外回应是:将变更硬件发展路径,不再做砸钱...……更多
你好,AI 中国移动乘“峰”逐浪,描绘“AI+”数字之美
...等各种科技,基于数据沉淀和智能算法,它还开发出了多模态大模型等能力,能满足家庭多元化需求。算力时代,AI无所不在。中国移动在现场展示了AI硬件设备:AR眼镜通过无界互联技术,能轻松实现通信、翻译、导航等多种应...……更多
喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会
...雅语音大模型不可或缺的“数据引擎”。据喜马拉雅首席科学家、珠峰实验室负责人卢恒介绍,“喜马拉雅语音生成式大模型目前已经取得了显著的突破,在音色定制方面实现了5秒内的‘极速克隆’声音。通过极少量的数据,...……更多
大模型激战:能否再造20年前互联网盛景
...创业公司“光年之外”的A轮投资,并出任董事。前Google科学家李志飞在2月底的一次媒体访谈中表示,短期目标是在明年6月做出一个60分的通用大模型。前搜狗CEO王小川也表示,将进入中国版OpenAI的战场,并向媒体承认项目在“...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编码-解码网络结构,并引入基于用户反馈的强化学习(RLHF)和细粒度的提示-隐变量对齐技术,提高了模型对图像多尺度信息的建模能力,...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...计算力。”针对GPT-4o强大的多模态能力,英伟达高级研究科学家JimFan发表长文表示,从技术角度来看,这需要对标记化和架构进行一些新的研究,但总体上是一个数据和系统优化问题。在JimFan看来,GPT-4o很可能是GPT-5的一个早期...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...议关注券商、银行。(三)券商行业掘金 开源证券:多模态模型再迎新突破,继续布局AI应用及算力1、OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长...……更多
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...炼中不断演化。在GPT-4发布之时,人们震惊于它强大的多模态交互,通过一张图片即能生成网站堪称奇观。而文心一言不仅在中文内容上有优势,在多模态能力上也是“人有我优”,不同于GPT-4的多模态输入,文心一言能够做到...……更多
...创新空间。”王平久认为,要积极推动艺术家、创作者与科学家、工程师的联动,加强探索人工智能在工业化体系建设的应用,切实推动人工智能在降本增效、优化行业管理水平等方面发挥积极作用,成为推动中国电影高质量发...……更多
...总裁曹衡康,波士顿咨询合伙人兼董事、中国区首席数据科学家窦德景,中科曙光副总裁、曙光云总裁关宏明,第四范式副总裁、主任科学家涂威威做主题演讲。峰会上,在中国互联网协会、中国软件行业协会指导下,天津市人...……更多
“冷门歌手”孙燕姿的新困扰
...另有创作者上传的AI孙燕姿合集已获得超300万播放量。QQ音乐甚至出现了AI孙燕姿歌曲合集,网易云音乐播客板块出现了AI孙燕姿翻唱合集。时代周报记者注意到,不少这类翻唱歌曲的创作者都会标注使用AI工具so-vits-svc模型并列出...……更多
阅读软件也应用AI,掌阅科技股价一字板后再迎涨停
...打造新的更具互动性、个性化的数字阅读业态。第三,多模态拓展,增加内容生产的多样性,将数字阅读行业的IP低成本、高质量、多模态衍生,从而提升IP的无形资产价值,并引领数字阅读从单一的文字向文字、图片、视频相...……更多
文化元宇宙四大共性技术打造沉浸式虚拟场景
...写实数字人资产数据,以及数字人动作表情数据,构建多模态大模型学习的数据库。此外,制作超写实数字人还需要自然语言对话系统和多模态数字人实时驱动与交互呈现系统。在姜文波看来,大场景3D扫描与重建是构建虚拟场...……更多
周鸿祎AI课开讲!谈苹果放弃造车、谈Sora、谈Siri......
...近一些科技圈大佬也下场推出了自己的AI课。2月29日,AI科学家、出门问问创始人李志飞在自己的公众号“飞哥说AI”上发布了一则会员招募文章,开始销售自己的AI课程。宣传页面显示,课程费用为2999元一年,包含会员专属研讨...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
星火智慧黑板:让黑板从板书工具跃迁为教师Al助手
...,在科学课上,李白、爱因斯坦等众多海内外历史名人或科学家通过虚拟人形象走进了课堂,用易于理解的语言,回答学生的奇思妙问,守护他们的好奇心。智慧化录课与分享,让师生更高效地回顾课堂重点授课过程中的声音、...……更多
2023 的人工智能之年
...的情感和情绪。Google 在 Bard 聊天机器人中融入了基于多模态数据集训练的 Gemini,它被誉为目前“最强大”的 AI 模型,是 OpenAI 的 ChatGPT 最强的竞争对手之一。Grok:Elon Musk 的创业公司 xAI 展示了其对 AI 开发的承诺,并可能与 Open.……更多
全球同频变现最快,AI赋能广告营销的道与术
...i正式发布,作为Google迄今为止规模最大、能力最强的AI多模态模型,业内认为Gemini将对整个广告营销行业带来巨大的变化。目前,微软也正通过与OpenAI的密切合作,去抢占未来数字广告市场。比如基于必应搜索中的微软广告创建...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
AI拜年火了,通义千问上线一张照片生成拜年视频
...技公司争相入局大模型的研发,大模型也逐渐从单一文本模态,向语音、图像、视频等多模态方向演进,这些前沿技术不再遥不可及,展现了巨大的应用潜力,改变千行百业的同时也开始走进千家万户。作为国产大模型产品的代...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0...……更多
...公司阶跃星辰联合创办,前微软全球副总裁姜大昕任首席科学家。公司围绕金融信息服务、智能投顾、智能投研等场景,助力金融机构打造新质生产力。 ……更多
更多关于科技的资讯:
鸡肉米、猪肉米吃过吗?“米肉合一”是怎么研发出来的
米饭自带鸡肉、猪肉的味道?据媒体报道,北京食品科学研究院未来食品研究团队成功研发出鸡肉、猪肉系列米制品——鸡肉米、猪肉米系列食品
2024-06-27 08:57:00
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
癌症一直是人类面临的最具有挑战性的疾病之一,据统计每年有超过 1900 万的新发病例和 1000 万死亡病例。早期检测出癌症同时结合已有的治疗手段
2024-06-27 08:48:00
“AI+5G”开启移动AI时代,机遇背后仍存诸多挑战
6月26日至28日,2024年上海世界移动通信大会(2024MWC上海)在上海新国际博览中心举行。上海世界移动通信大会也被业内称为“小巴展”
2024-06-27 09:12:00
36氪研究院 | 2024年“AI+出行”行业研究报告
2024年6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区一飞冲天,成功完成了京津冀地区的首次载人低空飞行。这一里程碑事件
2024-06-27 09:12:00
Nothing CMF Phone 1 手机配置、价格曝光,15999 卢比起
IT之家 6 月 27 日消息,Nothing 旗下的 CMF 近期释出了即将推出的智能手机、智能手表和耳机的预告片,展示了一些关于它们外观方面的信息
2024-06-27 09:10:00
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
来源| 量子位 公众号 ID:QbitAI作者| 金磊、梦晨家人们,撰写和修改病历这事儿,那个让无数医生耗时耗力的环节——病历内涵质控
2024-06-27 09:11:00
2024上海世界移动通信大会上,又一批信息通信“黑科技”亮相
不必去欧洲杯现场,在家也能搭建一个“VIP观赛包厢”,身临其境地感知绿荫场上的角逐;继手机直连卫星后,汽车也能直连卫星
2024-06-27 09:12:00
OpenAI断供API 套壳公司何去何从
IC供图6月25日,部分开发者收到了来自OpenAI官方的邮件,邮件称:“我们的数据显示,您的组织有来自OpenAI目前不支持的地区的API(接口)流量
2024-06-27 08:57:00
5G加个A到底有什么变化
2024年世界移动通信大会(MWC)·上海现场听过5G-A吗?要知道,当下正火的低空经济、裸眼3D、车路协同等都与它息息相关
2024-06-27 09:14:00
“南翔元谷”开园,探索文体旅融入元宇宙新场景
“南翔元谷”开园仪式暨“2024上海国际AIGC创作大赛”发布会近日在嘉定融创西环中心举行。真人主持与数字虚拟主持联袂为嘉宾发放“数字人身份入场券”
2024-06-27 09:14:00
一年两针100%阻断HIV感染,人类抗击艾滋病的重要里程碑?
6月20号的一个医药行业新闻引发了广泛关注:半年注射一针能百分百预防HIV感染,这是人类抗击艾滋病的重大突破。该新闻来源是医药巨头吉列德
2024-06-27 09:16:00
MWC系列报道|联想集团“全栈AI”大规模集中亮相
6月26日消息,2024世界移动通信大会(2024 MWC上海)在上海开幕。作为中国主力AI产品、方案和服务提供商,联想集团以“联想全栈AI
2024-06-27 09:17:00
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
STAR团队 投稿自 凹非寺量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证——中科大
2024-06-27 09:17:00
6月26日消息,英伟达最近成为华尔街的焦点,自2022年底以来,其市值增长了八倍,本月市值更是飙升至超过3万亿美元。与此同时
2024-06-27 09:15:00
湘潭在线6月27日讯(全媒体记者 武慧 通讯员 胡静 戴峰)6月26日,由省商务厅和湘潭市人民政府举办,市商务局承办的跨境电商平台进市州湘潭站活动正式启动
2024-06-27 07:51:00