• 我的订阅
  • 头条热搜
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
AI“卖铲人”英伟达,为何业绩再爆发?
...智能在2023迎来爆发,生成式AI以ChatGPT为代表掀起全球大模型浪潮,全球各行业的算力需求激增。英伟达GPU作为主流AI训练解决方案使其成为最大受益者,实现量价双收。英伟达财报也揭示了未来发展战略的三大方向:一是以数据...……更多
...的蛋白质序列数据集,并利用其训练了Venus(启明星)系列模型。肉、蛋、奶,这些食物中含有丰富的蛋白质,可以提供人类身体所需营养。但天然的蛋白质难以发挥这些功能,科研人员需要对天然蛋白质的功能进行设计和改造,...……更多
交通类 AI 项目预演阶段,本地化部署的一些新思路
...段中,通常小规模算力就可以满足需求。此阶段主要是对模型的可行性、架构设计的合理性以及算法的有效性进行初步验证,此时模型规模相对较小,参数数量和复杂度都处于较低水平。例如,在构建一个简单的文本分类预演模...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下AI初创公司xAI宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...升还成本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)...……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...它的特点,那就是——AI味道越发得浓厚。以训练、推理大模型为例:• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;• 与第三代相比,AI训练和推理性能提升高达14倍。什么概念?现在若是将不超过200亿参数的模型“投喂...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
无需训练即可大幅提升SAM 2!SAM2Long来了,港中文 上海AI Lab出品
...出了创新的记忆结构设计,打造了专为复杂长视频的分割模型。论文链接:https://mark12ding.github.io/project/SAM2Long/asset/images/paper.pdf 项目链接:https://mark12ding.github……更多
气象服务的“存储密码”:京东云云海如何破解行业难题?
在大模型训练中,算力一直是核心驱动力。但大模型竞速中还有一个很重要的隐形变量,那就是存储。有数据表明,同一批GPU集群,存储配置的差异,模型训练速度可能相差3倍。对于企业的CTO们来说,要让大模型真正跑稳,存...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
AI一天,人间一年。现在不论是大模型本身,亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世。也正如来自InfoQ的调查数据显示的那般,虽然AIGC目前还处于起步阶段,但市场规模...……更多
大模型时代的阿里云,将云计算进行到底
文|葛覃大模型与云计算,正在成为新时代的淘金者和卖铲人。自ChatGPT刷屏之后的数月时间,微软Azure与OpenAI的示范效应传导至全球,基本所有能做大模型的厂商都尝试“淘金”,其中,云厂商是一股重要力量,云计算天然适...……更多
chatgpt:技术突破有望构建新商业模式
...近ChatGPT再次出来后,大众的接受度非常高,因此关于大模型训练,类ChatGPT生成对话/替代搜索等软件,以及背后的模型算法,如‘雨后春笋’一般出现在投资人的在看项目名单里。”火凤资本联合创始人陈悦天表示。不仅投资机...……更多
东阳光药AI研发团队发布HEC-Transporters模型,为早期药物研发提供全流程的药代动力学性质优化
东阳光药AI研发团队新发布药物研发用模型 东阳光药AI研发团队推出了多个自研创新模型应用于药物分子ADME/T属性优化,已涵盖PK曲线预测和CYPs相互作用预测。近日,团队发布了基于多任务学习策略的药物透膜/转运预测模型,...……更多
CITE2024,昇腾硬核实力打造极致体验,宝德斩获创新大奖
...硬核技术实力与卓越创新实力。 展会现场,融合主流大模型和适配昇腾算力打造的AI训推一体机PR410EI、昇腾智能边缘小站PI300T、鲲鹏服务器PR210KT、盘古台式机PT620W等宝德自强®系列终端产品以及丰富的解决方案轮番上阵,技术...……更多
Nature封面:AI训AI 越训越傻
...等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个:GARBAGE OUT!要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个...……更多
NPU IP累计出货超1亿颗!芯原股份一站式AI解决方案揭秘
...亿颗,并进入了近千万辆汽车。在目前生成式人工智能大模型在云端及边缘端蓬勃发展的趋势之下,芯原根据目前市场的需求,基于自身NPU IP可伸缩可扩展的特性,已发展了覆盖从高性能云计算到低功耗边缘计算的生成式AI解决...……更多
美国政府加速限制,要求英伟达立即停止A800/H800芯片销往中国|硅基世界
...表达了担忧和疑虑。他们向钛媒体App表示,未来国内AI大模型的算力训练可能会受到这一影响,导致落后于OpenAI。其中一位AI行业人士还表示:“我认为国内算力将会降低,但我更倾向于认为算力的降低是行业竞争的必然结果。...……更多
DeepSeek开源惠四方(科技名家笔谈)
...州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek,受到用户热烈欢迎。2025年1月20日,DeepSeek-R1发布上线,7天内用户超过1亿。ChatGPT从发布到达到相同的用户规模用时两个月。GitHub是全球最大的代码托管网站,Gi...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
“女巴菲特”预期2030年人形机器人进入家庭,通用AI出现,重仓马斯克
...了长期的投资机会。之前曾被 LeCun 等 AI 大佬转发的开源模型VS专属模型的神图,也是目前最重要的 AI 图表之一,正是来源于这家投资机构。 过去几年,方舟投资表现抢眼,成为全球最受欢迎的主动管理基金之一,掌门人"木头...……更多
如何让大模型输出更精准、更可靠的结果?
大模型虽然强大,但是也有技术缺陷。有时会产生“幻觉”,甚至会犯一些事实性错误。这是大模型技术逻辑带来的天然缺陷,大模型的技术机理是,通过大量的知识训练,基于概率最大的原则生成答案。那么这就带来了几个...……更多
标贝科技上亿像素点图像标注能力 实现标注精度和效率双提升
【每日科技网】国内大模型的发展如火如荼,也给其背后的推手——数据标注行业再添一把火。同时伴随细分领域垂类大模型越来越多,数据需求向精细化、场景化发展,需要使用更大像素、更高分辨率的图像以提供丰富细致...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...让人啼笑皆非。就在刚刚,阿里国际发布首个商用翻译大模型,电商出海神器真来了!果式文案一出,少不了网友的热议。苹果iOS 18官方7月更新的系统宣传语中,「真的很你」硬生生文案,被许多人吐槽太过抽象。原本英文的...……更多
华为周跃峰:数据觉醒时代,共创数据存储产业新未来
...共创数据存储产业新未来”主题演讲。周跃峰表示,AI大模型加速数据觉醒,华为秉持“以存强算、以存强训、以存强安”的理念,打造领先数据基础设施,推进全场景闪存化,同时围绕“联合创新、营销赋能、服务使能”构建...……更多
从数据清洗到训练全程优化,腾讯云助力秘塔AI降低数据采集和训练成本
...、大数据和云计算技术的快速发展,数据已经成为驱动AI模型迭代与应用创新的核心引擎。尤其是在全球化竞争加剧的背景下,AI企业需要在更广泛的地域获取更丰富、更高质量的数据,以支撑多语种、多场景的模型训练。然而...……更多
AI将爆发哪些超级应用?
...助办公、作图、视频生成、教育等领域潜力巨大。基于大模型进行定制化扩展升级,将“超能力”带给各行各业。第三类是AI消费电子,如AI PC、AI 手机、XR设备和脑机接口技术,对传统设备进行AI升级,或在新技术上开发新的需...……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
不出意外,AI大模型浪潮卷到了智能手机领域,智能手机厂商争先恐后地自研AI大模型或者联手AI大模型厂商,挖掘智能手机与AI大模型的融合发展的巨大潜力。10月26日,荣耀CEO赵明官宣新机荣耀Magic6的部分信息。他表示,新机...……更多
去太空训练AI大模型,24小时太阳能供电的GPU明年上天
...来,太空 AI 算力或许要比地球上功率最大的还要大。大模型的未来,其实是在天上?为了跟上人工智能快速发展的步伐,最近全球都在争抢 AI 算力,想得更远的人(如 OpenAI CEO Sam Altman)甚至已经把问题想到了供电这一层。据说...……更多
摩尔线程全国产千卡智算中心正式落地:国产GPU为底座的里程碑
...足日益增长的计算需求。随着人工智能技术的不断发展,模型参数数量不断增加,对计算能力的需求也呈指数级增长。智算中心所提供的千卡级算力,能够为各类大模型的训练和微调提供有力支持,推动人工智能技术的快速发展...……更多
更多关于科技的资讯:
促进民营经济高质量发展·超能量的“中小微”(十九)|乡村小厂造出“搬运神器”
11月12日,智捷智能科技香河有限公司工作人员在室外场地对智能搬运叉车进行调试。 河北日报记者 刘英摄11月12日,天津滨海新区一处海滩上
2025-11-29 07:31:00
厦门网讯(厦门日报记者 许舒昕)在注意力被算法切割的当下,一张纸质报纸竟在粉丝圈掀起抢购潮——从常规售价2元到二手平台单份22
2025-11-29 09:13:00
一、大数据视域下高校学生资助精准识别与分配的核心概念界定大数据技术是对数据进行加工、整理与计算的技术。其核心在于通过信息存储
2025-11-29 12:02:00
大数据技术在高校学生资助工作中发挥了重要保障作用。相对于传统资助模式存在的问题。大数据通过整合多源数据、构建评估模型,能够实现从被动申请到主动发现的转变
2025-11-29 12:20:00
从迷失到笃行:一位古贝春经销商的二十载商海沉浮与顿悟
鲁网11月27日讯(记者 赵洪斌)在鲁北商业版图上,王文俊的名字与古贝春酒业紧紧相连。然而,这段长达二十余年的合作关系
2025-11-28 08:45:00
近日,广东宇太能源与河北某工业玻璃龙头企业签约,合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资,宇太能源提供技术及设备支持
2025-11-28 08:57:00
罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐,杨钧博士《未来竞速》即将出版发行
百年汽车产业大变局的必读之作。近日,由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行
2025-11-28 09:27:00
近日,鹏华基金发布公告,旗下科创创业人工智能ETF鹏华 (认购代码:588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员
2025-11-28 10:11:00
入选概率不及万分之二,阿里千问斩获顶级AI会议最佳论文
11月28日消息,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出
2025-11-28 11:01:00
11月24日,位于启东市南阳镇的朗峰新材料启东有限公司生产车间内,自动化生产线高速运转,一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出
2025-11-28 11:05:00
济南轨道交通集团举办财务资本培训,实战专家孙春浩解析财务精英三级跃迁路径
近日,济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持
2025-11-28 11:09:00
锚定本土、驱动创新的金融实践!青岛银行荣膺CFV“最佳品牌竞争力城商行”奖项
11月21日,在上海举办的“2025第一财经金融价值年会”上,青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现
2025-11-28 11:18:00
挂号缴费不用跑!微信医保移动支付在北京140家公立医院全面上线
近日,北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线
2025-11-28 11:28:00
河北省煤田地质局物测队引入新装备提升探测能力
河北新闻网讯(吕若汐、齐彦红)11月18日,地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪(激发系统)诺玛德65尼奥
2025-11-28 11:53:00
中新经纬11月28日电 北京市广电局网站消息,《北京市促进“人工智能+视听”产业高质量发展行动方案(2025-2029年)》(下称《行动方案》)近日发布
2025-11-28 11:57:00