• 我的订阅
  • 头条热搜
3天把Llama训成Mamba,性能不降,推理更快!
...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于...……更多
业内震动!马斯克与它公开叫板
...认为,马斯克此举是与OpenAI公开叫板,也将让业内对于大模型开源问题的讨论进一步升级。埃隆·马斯克(资料图)“这周,xAI将开源聊天机器人Grok。”马斯克在其旗下的社交平台X上发布上述消息时言简意赅。有外媒注意到,...……更多
魅族21pro真实体验究竟如何?
...是要看游戏。魅族21PRO在《原神》游戏中,PChome标准测试模型,250尼特屏幕亮度,极高+60帧画质,开启电竞模式,30分钟平均帧率59.74帧,游戏过程中偶有波动,会有影响视觉的掉帧情况。游戏平均功耗5.17W,正面最高温44.5度,背...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...上一代WSE-2的两倍,可用于训练业内一些最大的人工智能模型。在近日的Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制...……更多
百度智能云:最新旗舰大模型文心4.0 Turbo开放精调服务
在国产大模型中,文心大模型一直名列前茅。昨天,文心旗舰大模型ERNIE 4.0 Turbo精调服务正式开放,可以帮助企业利用自身业务数据训练出更适合企业应用场景的大模型,提升大模型在业务中的使用效果。本文作者进行了分析...……更多
华为大模型演示系人为操控?昇腾社区:均为真实代码,非调取...
...完成RAG应用开发。现场图片为实时生成,调用的是开源大模型。代码中有time.sleep(6)等表述,是命令等待读取外部开源大模型实时生成的图片,并非调取预置图片。本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者...……更多
全新英特尔 至强 可扩展处理器,打破数智化变革瓶颈的一板利斧
...英特尔® AVX-512,成功对AI工作负载进行加速;2018年,第二代至强® 可扩展处理器开始采用深度学习加速(DL Boost)技术;2020年,面向多路服务器的第三代至强® 可扩展处理器通过扩展出bfloat16加速功能,在推理加速能力之外又加...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在...……更多
很强也很贵!OpenAI12天12场直播收官,官宣最新推理模型o3
...网友猜测的一样,人工智能(AI)巨头OpenAI发布最新推理模型o3和o3-mini。前一天,OpenAI公司CEO山姆·奥特曼(Sam Altman)就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3?奥特曼表示是为了避免和英国电信运...……更多
鑫闻界|繁花落尽,风流未央?2024手机圈“卷”什么?
...2024开年之作——一加 Ace 3,全球首发1.5K东方屏,搭载第二代骁龙8移动平台、全新一代超帧超画引擎、全新一代灵犀触控以及旗舰级金属中框等配置。外观设计上,一加 Ace 3提供了鸣沙金、星辰黑与月海蓝三款简约配色。继去年...……更多
stackoverflow与openai合作提高模型性能
...OverflowAPI,并与StackOverflow合作为使用其产品的开发者提高模型性能。StackOverflow将利用OpenAI模型开发OverflowAI,并与OpenAI合作利用内部测试最大限度地提高OpenAI模型的性能。注:StackOverflow和OpenAI的首批新集成和……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。针对此,港大数据智能实验室提出了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
长时间交通状况预测,可以用大模型实现了。香港大学联合华南理工大学和百度,推出了长时间城市交通预测模型——OpenCity。而且泛化能力极强,可有效应用于广泛的交通预测场景。为了解决传统交通预测模型泛化性及长期预...……更多
DeepSeek仅用9秒创作一首诗 网友:比大部分诗人写的好
快科技1月28日消息,据媒体报道,近期,国产大模型公司深度求索(DeepSeek)在海内外引发广泛关注。与其他大模型相比,DeepSeek在对话中展现出的思考逻辑过程及其输出结果令人印象深刻。如果你请DeepSeek创作一首赞美“济南...……更多
连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2
...上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级点:▼MFU提升10% 最高可达55%在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。稠密模型集群训...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
...策略。我们深入研究了统计学在AI算法开发、数据分析和模型优化方面的作用。通过采用统计学方法,可以提高AI系统的性能、准确性和稳定性,从而更好地满足不同应用领域的需求。此外,我们还探讨了在AI系统中应用统计学方...……更多
让手机、PC、汽车、AIoT等“终端”都用好AI,搞定统一生态这事太重要了
...此产业也通常将今年看作是“端侧AI元年”。当下,AI大模型在终端细分赛道展现出的强大生命力,各类AI产品几乎无处不在,AI手机、AI PC、AI眼镜,以及AIoT领域的各类AI智能终端设备成为当下数码和科技圈广为热议的关键词。根...……更多
NeurIPS 2024评审结果公布!AI大佬晒出成绩单,又是被吐槽最严重的一届
...非常微妙,即使在过度参数化的情况下也是如此。而对大模型而言,权重衰减则扮演者完全不同的角色。与最初一版arXiv论文相比,研究人员对其进行了很多更新。Andriushchenko表示,自己非常喜欢这项新实验,并且匹配了AdamW有效...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...地与环境和自身频繁交互,并从中获取经验予以改进。大模型自我进化研究之所以重要,正是源于该思想,并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势,北京理工大学 DIRECT LAB 正式启动了「大模型自我进...……更多
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU直访存储、全局一致性缓存...……更多
李彦宏替马化腾试错?
发端于 2022 年底的大模型热潮,在过去的 2023 年里席卷了大多数互联网企业,从去年上半年的 " 百模大战 ",到后来卷向场景应用,业界对大模型的认知在不断刷新,围绕大模型的应用探索步伐,也在不断加快。李彦宏毫无疑问...……更多
人形机器人组团“十八金刚”各类AI助手工具百花齐放
...斯克,今年并未如传闻所言现身大会。虽然老板没来,但二代机器人Optimus(擎天柱)在WAIC首次公开亮相,特斯拉称此次展出将“见证人形机器人的再进化”。相比一代产品,Optimus行走速度提升了30%,重量减轻了10公斤,也配备...……更多
魅族特别活动在珠海举办:魅族 21 PRO开放式AI终端发布,售价4999元起
...款拥有开放平台能力的旗舰手机,魅族 21 PRO 对所有的大模型平台进行开放,向开发者提供系统权限、API 文档,并开放处理器的 AI 算力,让开发者拥有充分的自由度,从而实现更多创新功能和应用服务的开发。通过开放的平台...……更多
3500P算力就位!北京数据基础制度先行区扩至海淀
...园举行。在会上,海淀宣布3500P算力部署就位,可以为大模型企业提供算力、数据一体化服务,全力为北京人工智能企业打造大模型训练基地。2023年11月,北京市在全国率先启动数据基础制度先行区建设,主动探索创新监管方式...……更多
人工智能大模型如何加速赋能千行百业?这场会议给出答案
...…”这是10月23日下午,在江苏省互联网大会人工智能大模型平行会议现场,记者与虚拟会议智能体助手的一段对话。通过手机扫码后向虚拟会议智能体提问,就能轻松获取会议的嘉宾信息、议程介绍、主题演讲等各种大会相关...……更多
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...为提升其聊天机器人产品Gemini的性能而努力,该公司希望模型性能提升的速度可以与去年相当,这促使研究人员专注于其他方法来勉强取得效果。这种情况和OpenAI的遭遇类似。此前有报道称,OpenAI模型性能提升速度有所放缓,该...……更多
喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会
...语音技术成果,包括喜马拉雅珠峰语音生成式大模型和第二代智能语音交互系统,为参会者展示AIGC与文娱音频产业深度融合的最新成果。据了解,喜马拉雅珠峰语音生成式大模型是喜马拉雅的一项创新性技术,具备快速实现语...……更多
openai发布sora模型:支持一次性生成多机位视频
2月18日消息,OpenAI近日发布了Sora模型,可以根据用户输入的文本描述,生成一段视频内容,一经公布便引发网友热议。然而,Sora的能力还不止于此。当地时间周六OpenAI研究科学家比尔・皮布尔斯(BillPeebles)在X上晒图,并表示“...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
【新智元导读】UrbanGPT是一种创新的时空大型语言模型,它通过结合时空依赖编码器和指令微调技术,展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖,即使在数据稀缺的情...……更多
更多关于科技的资讯:
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00
从优篮子到 JOBY:唯迹科技的全球化成长之路
在摄影配件行业,“速生速死” 是常态 —— 产品迭代快、价格战频发,多数企业陷入内卷困境。而深圳市唯迹科技有限公司却走出了一条 “反常识” 的发展路径
2025-09-26 12:07:00
让AI规划假期行程,告别烧脑做攻略比价;戴上耳机,和自己的专属AI讲解员一起边逛边聊,拍展品听讲解,拍景点听典故,拍建筑听历史……这种全新的旅行体验
2025-09-26 12:08:00