• 我的订阅
  • 头条热搜
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包大模型在文生图模型方面的技术升级。李亮表示,豆包...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...GETTY IMAGES) “我们试图让大语言模型在谷歌内部运行得更快,并取得了一些进展,但实现这一目标仍很困难。”Pope说,“在谷歌内部,有很多人希望对芯片进行各种改动,因此我们很难只专注于大语言模型的开发。为此,我们...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...现,业内其实早有预期,但仍有人评价称“比想象中来得更快”,亦有人振奋地表示“我们真的看到新工业革命来临”。2月16日,业内分析人士对记者表示,Sora无疑是人工智能领域的一次重大突破,该技术不仅展示了AI在理解和...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...者是汪海洋,北京大学20级博士生,目前主要关注是通用模型的架构设计和学习算法。指导教授主要包括王立威,北京大学智能学院教授;Bernt Schiele,德国马普计算所教授;Federico Tombari 谷歌人工智能科学家等。新一代通用灵活...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
世界气象组织最新报告:AI 正在革新天气预报,更快、更便宜、更易获得
...来颠覆性变革。正如 Saulo 所指出的,“人工智能已经‘更快、更便宜、更容易获得’地彻底改变了天气预报科学”。 AI 正在革新天气预报在这份报告中,来自欧洲中期天气预报中心(ECMWF)的研究团队及其合作者,对 AI 在极端...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...法选型和瘦身,并充分地利用征程5的BPU架构优势,最终更快地实现了轻舟智航行泊一体BEV感知方案在征程5芯片平台上的落地。轻舟智航的行泊一体方案可在一个BEV模型中实现多任务检测,同时支持行车和泊车功能。由于不同任...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
MSRA:视觉生成六大技术问题
...进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,难以直接拟合。因此,往往需要将复杂的信号做拆分,拆分成多个简单的分布拟合问题,再分别求解。信...……更多
2024惠普商用ai战略暨aipc新品发布会在京举行
...相比传统药物设计方法“精度更高、成本更低、计算速度更快”。惠普Z系列智能视觉AI一体机: 惠普Z系列智能视觉AI一体机是惠普和星环科技联合推出的计算机视觉一体机。该一体机面向园区、工地、电力能源等行业,能够提...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...,开发者可以选择小版本的o1-mini。相较o1-preview,它速度更快、成本更低,适用于需要推理但没有广泛知识的应用程序,尤其擅长数据和编码,成本比o1-preview低80%,即和GPT-4o价格相当。对于OpenAI此次发布的新模型,复旦大学计算...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...降低科研人员的时间成本、以及相关厂商的资源成本,为更快、更精确地发现药物提供助力。前不久,中国科学技术大学博士生方俊峰和所在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC(Molecular inTeraction ...……更多
谷歌DeepMind展示大模型Genie,能从零制作类似超级马里奥的游戏
...家输入指令时从零生成的。Genie 的未来版本可能会运行得更快。“原则上,没有任何条件限制我们实现每秒 30 帧。”谷歌 DeepMind 的研究科学家蒂姆·洛克塔切尔(Tim Rocktäschel)说,他领导着这项工作的团队,“Genie 使用了许多...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...端MoE训练和推理解决方案,结合模型压缩等技术,可提供更快、更便宜的MoE模型推理服务,与同等质量的密集模型相比,可加速4.5倍,成本降低9倍。斯坦福大学、微软和谷歌联合推出的MegaBlocks系统,面向单个GPU上运行多个专家...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...个Pod(通常指一个包含多个芯片的集群或模块)中,从而更快或更高精度地训练模型。作为参考,该值比TPU v5e大35倍,是TPU v4的两倍多。 谷歌称,TPU v5p是其迄今为止最强大的,能够提供459 teraFLOPS(每秒可执行459万亿次浮点运...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...通过语音提示,动态修改EVI 2的说话风格。例如,“说得更快”、“语调听起来很兴奋”,甚至还可以“进行说唱“。根据Hume AI的介绍,EVI 2还能够与其他应用程序、大语言模型进行集成,在客服通话、网页搜索等功能中使用。C...……更多
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态调整不同层之间的连接权重,解决梯度消失和表示崩溃(Representation Col...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Lauren...……更多
OpenAI没有放弃的机器人梦想
... :“一种可能准确但带有讽刺意味的观点是,研究语言模型比研究机器人学具有更高的投资回报率和更低的风险。”事实证明,OpenAI的确在大语言模型方面取得了更大突破。不过,OpenAI忘记机器人了吗?「甲子光年」在2023北京...……更多
“ChatGPT之父”预测:中国会诞生有自身特色的大模型,未来将有10至20个模型“脱颖而出”
...认为在生产力方面,人工智能已经产生了影响。人们可以更快、更有效地完成工作,更多地专注于他们想做的部分。4、关于AI的潜在威胁网络安全问题,我不知道它是否会是第一个,但这是我认为可能会成为潜在问题的一个方面...……更多
更多关于科技的资讯:
哪种悬架:才能像尊界S800“三过坑而不入”
昨天,脖子哥的手机被尊界 S800 “ 凌波微步 ” 刷屏了。什么过坑 “ 白沙不扬 ” 、 “ 玻璃不碎 ” 、 “ 踏水无痕 ”
2025-02-15 07:52:00
杭州新春首场高新技术企业招聘会今天继续
记者 韩晨柯 摄“有员工宿舍吗?”“能不能接受一次性出差2-3周的工作节奏?”“下个月可以入职吗?”2月14日,由杭州高新区(滨江)人力社保局主办的“起跑春天·相约高新”新春首场高新技术企业综合性招聘会在高新人才之家举行
2025-02-15 07:55:00
终于来了!小米澎湃OS超级小爱接入DeepSeek-R1大模型
快科技2月15日消息,近期,华为、荣耀、OPPO、vivo、联想、中兴等一众国产手机厂商都接入了DeepSeek-R1大模型
2025-02-15 08:22:00
回忆杀大揭秘!饺子导演和网友15年前私人邮件曝光
快科技2月15日消息,据猫眼专业版最新数据显示,饺子导演新作《哪吒之魔童闹海》正持续热映,其执导电影累计票房已跨越157亿大关
2025-02-15 08:22:00
德国媒体感慨中国科技发展太快:若只卖玩具、纺织品、手机电脑就好了
快科技2月15日消息,近日德国媒体发文,感慨中国科技发展速度实在是太快了。《商业内幕》德国版(businessinsider
2025-02-15 08:22:00
8只河狸2天建好捷克拖了7年的水坝:这合理吗
可爱的大型啮齿动物河狸,最近上了新闻。有多家媒体报道说,捷克一座 7 年还没动工的水坝,被一窝河狸在一天或者两天之内搞定了
2025-02-15 08:52:00
《哪吒2》、《美队4》同天上映:老外使坏 未来至少一周全美无《哪吒2》IMAX排片
2月15日消息,据国内媒体报道称, 2月14日《哪吒2》和《美队4》北美同日上映,不过两者的待遇却截然不同。报道中提到
2025-02-15 08:52:00
2月14日晚,记者从杭州群核信息技术有限公司获悉,旗下控股公司Manycore Tech Inc.(以下简称“群核科技”)已正式向港交所递交上市申请
2025-02-15 08:57:00
回归单身的日产:不靠本田 也能蹚出一条路
事实证明,企业“包办婚姻”往往没什么幸福结局。 2月13日下午,日产、本田正式宣布终止合并计划,双方撤回2024年12月23日签署的业务整合谅解备忘录
2025-02-15 00:22:00
顺丰接收全球第100架波音767-300BCF:3月正式投入航线
快科技2月15日消息,据顺丰航空官微介绍,顺丰航空作为767-300BCF的全球最大用户,日前在广州飞机维修工程有限公司(GAMECO)正式接收波音第100架767-300BCF
2025-02-15 00:22:00
全国首个“空地协同”智慧物流中心启用:跨城快递3小时送达
快科技2月14日消息,全国首个“空地协同”智慧物流运营中心-丰翼宝安低空智慧物流运营中心今天正式启用。据了解,该运营中心位于深圳市宝安区新安街道
2025-02-15 00:22:00
揭秘:苹果AI为何选阿里不选DeepSeek
快科技2月14日消息,在昨天阿联酋迪拜举办的World Governments Summit2025峰会上,阿里巴巴联合创始人
2025-02-15 00:22:00
比亚迪智驾价格战背后:一年招了几千人 过年还在赶工
作为全球新能源车保有量最大的车企,比亚迪又放大招了。昨晚,比亚迪开了一场声势浩大的发布会,一次性把王朝网、海洋网的 21 款车型全转换成 “ 智驾版 ”
2025-02-15 00:22:00
作为一名高中生,我深切地感受到人工智能时代的浪潮正深刻地改变着我们的学习方式,尤其是在数学学习上。数学,这门充满逻辑与美感的学科
2025-02-15 05:29:00
本文聚焦钟山县职业技术学校《旅游概论》课程,通过问卷与访谈收集师生反馈,剖析课程教学现存问题并提出针对性改进建议,为同类课程改革提供参考
2025-02-15 05:29:00