• 我的订阅
  • 头条热搜
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...层次,包括免费、开发者和企业级,满足从小规模开发到大规模企业部署的不同需求。用户可直接在官网上的交互界面进行体验,也可调用API。体验地址:https://inference.cerebras.ai/Cerebras Systems成立于2016年,团队由计算机架构师、...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...上做出了重大突破。它采用了更先进的预训练技术,通过大规模语料库的学习,使得模型在理解和生成文本的能力上达到了新的高度。此外,Qwen2.5还特别注重多语言支持和跨文化适应性,这使得它在全球化应用方面具有独特的...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...方法来生成样本,从而减少了对人工标注的依赖,更易于大规模收集数据。自动化方法如 OmegaPRM、Math-Shepherd 和 MiPS 可以高效地收集高质量的过程监督数据。虽然 Math-Shepherd 和 MiPS 提供了过程监督的自动化标注,但它们需要大量...……更多
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
...模型性能、能效表现来了一次全面概览。对人类语言进行大规模建模是一个复杂的过程,研究人员花了几十年的时间才开发出来。这项技术最早可追溯于 1950 年,当时克劳德・香农将信息理论应用于人类语言。从那时起,翻译和...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...,那么所需算力至少增长1000+倍,需要建立一个单节点超大规模算力集群来做训练。二是算法持续迭代,Transformer架构不能实现大一统,从稠密到稀疏模型,再到多模态模型的融合,多元架构持续演进并共存,面向特定领域设计...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...础资源,通过软硬件协同创新,为大模型训练和研发提供大规模高性能计算。在AI工程中台层,我们提供覆盖大模型全生命周期的工具链,通过智能研发平台、数据平台、AI开发平台、AIAgent平台等能力,有效降低大模型训练难度...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...方言语音合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示...……更多
垂类大模型竞争白热化,微医医疗大模型拿下“双料”冠军
...发的AI医生、AI药师、AI健管、AI智控等四大智能体已实现大规模应用,形成了覆盖诊前、诊中、诊后的全生命周期健康管理应用闭环。数据显示,截至2024年6月30日的六个月,微医控股“AI 医生”的处方不合理提醒遵从率达到了99....……更多
“Sora目前仍不够可靠,应用场景受限”
...频假冒好友与陈先生聊天,从而实施诈骗。Sora如果实现大规模推广,将大大降低普通人利用AI合成高质量视频的难度。据中国科学院信息工程研究所正高级工程师韩冀中介绍,Sora应用的技术与此前的深度伪造技术相互承接,又...……更多
“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI
...次宕机。服务状态页面显示,“近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。” ……更多
深夜登顶,全网刷屏!来自杭州的DeepSeek震惊硅谷
...据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。这一模型发布后...……更多
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
...回归模型。 2018年至2021年期间,出现了从单任务微调到大规模多任务模型的隐蔽的范式转变。所有人的注意力被慢慢吸引到统一的SFT模型上,这也是我们今天看到的统一的通用模型。用BERT来做到这一点实在是太难了。然而,BERT...……更多
...AI回答接入了利用深度神经网络、强化学习等技术训练的大规模语言模型以及其他模型及服务,模型采用对话格式,可以根据考生和家长等用户输入的指令,通过自动化分析后生成专属同济大学的参考信息。同济大学本科生院院...……更多
...QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习,它在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也...……更多
...大地提升了平台性能与效率,使得复杂视觉任务的处理和大规模3D数据的生成变得更加迅速、准确。智能化的算力管理和调度系统是此次融合的一大亮点。Behavision空间智能MaaS平台能够根据用户的实际需求,动态优化配置算力资...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...并不仅仅是简单地移除数据。由于AI大模型的训练依赖于大规模的数据集,删除部分数据集可能需要对模型进行重新训练,以确保模型的准确性和有效性,而这一过程需要消耗大量的时间和计算资源。此外,大模型在生成内容时...……更多
...助提示学习、强化学习、思维链等技术,大模型正朝着更大规模、更深层次、更多模态、更加对齐人类价值观的方向快速发展。采用大小模型协同和知识蒸馏等技术手段,可实现大模型的云、边、端部署,有效降低大模型落地对...……更多
...力边界而言,“知识蒸馏”技术意义不大,未来仍需探索大规模强化学习技术,以持续激发大模型在思考、反思、探索等方面的能力。AI模型未来如何进化在2025年美国消费电子展上,美国英伟达公司高管为AI的进化勾画了一条路...……更多
联汇科技荣获2024人工智能隐形冠军企业标杆Top10
...索、聚类和分析等服务。多模态预训练大模型(OmModel)基于大规模自监督学习的多模态人工智能算法,融合语言和视觉模态理解,实现下一代认知域人工智能应用场景落地。已完成基于行业的十亿级图文、亿级图片、万级视频大规...……更多
三榜齐登、实力认证!网易有道连续五年入选“北京民营企业百强”
...种小语种的实时互译,以较小参数量实现了媲美甚至超越大规模通用模型的翻译质量,有效支持跨语言教学与学习交流。在坚持科技创新的同时,有道也不断将大模型能力与教育硬件深度融合,持续推动多元化应用成果落地。今...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...(具体详见论文)。得出了以下几个有见地的发现:1. 更大规模的模型有更好的校准性能我们要求模型在回答问题时提供 0 到 100 的信心指数,以衡量模型的校准程度,即模型对其答案的自信程度。理想的校准模型应该是信心指...……更多
...股,每股回购价介于24.1843港元至24.4港元。AMD回应中国区大规模裁员传闻:失实,对组织架构小幅优化重组近期,有消息称超威半导体公司(AMD)即将在中国区进行大规模裁员,本轮裁员比例可能为10%-15%,或涉及数百名员工...……更多
微软与openai的合作源于对谷歌的担忧
...型至少六个月,并且有更多的时间来进一步开发和改进更大规模的模型。此外,斯科特还对谷歌的Gmail自动完成功能表示钦佩,称其“变得非常好”,并指出微软在机器学习规模方面已经落后于竞争对手多年。他认为,尽管微软...……更多
AI一本正经地胡说八道 有种办法可以识破它
...措辞得当,也基本符合官方通报的格式,导致了错误信息大规模传播。美国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 技术生成的新闻报道,却被发现其中存在大量基础性错误,包括计算错误、金融概念误解等,不得不...……更多
...硕士学位,专注研究大语言模型在金融领域的应用,涉及大规模数据处理、自然语言处理、机器学习、深度学习和分布式计算。他曾在全球支付技术公司Visa任职数据科学家,主导开发了 “Visa账户攻击智能防御系统”,该系统采...……更多
...示,在人工智能(AI)技术井喷的浪潮下,2025年会是AI应用大规模落地的元年。李开复提到,过去两年大模型能力不断提升,在问答能力上已经远超人类。新技术持续突破,数字化AI与真实物理世界将进一步融合。较云计算,AI2.0应...……更多
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
...发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。QwQ-32B采...……更多
华大基因:AI医疗引领 2月涨幅超60%
...和模型泛化能力,能应对复杂疾病分析应用场景。 对于大规模数据的影响,华大基因回应,将成测试和扩展模型重要来源,提升泛化和解读专家能力。 健康管理是 AI 落地最快场景之一,公司称未来将合规收集用户多维度健康数...……更多
浪潮数字商业发布基于大模型的 数字员工3.0解决方案 -- 金叶智系列 数字化转型解决方案
...行识别分析。利用DeepSeek大模型的知识迁移能力,将其在大规模图像数据上学习到的通用特征,迁移到烟草行业特定图像识别任务中,提高模型训练效率和识别准确率,满足大规模门店巡查和实时数据分析需求。自然语言处理与...……更多
人均年薪100万,手机厂商数百亿开卷大模型
...厂商入场的心态绝不只是“重在参与”,而是真金白银地大规模投入。今年4月,小米组建大模型团队时,雷军就表明态度:“全力支持,投入不设上限。”目前,小米内部在做AI相关的研发人员超过3000人;向来低调的vivo创始人...……更多
更多关于科技的资讯:
12月10日,公测仅23天月活突破3000万后,千问APP正以周为单位快速迭代,意在打造全能“办事”助手,即日起向所有用户首批开放AI PPT
2025-12-10 15:04:00
存量博弈下,潍柴如何用服务增值让客户体验与企业增长双向奔赴?
鲁网12月10日讯当发动机及装备制造业迈入存量竞争深水区,新能源与智能化技术加速迭代,客户需求越来越高,后市场服务早已超越了简单“售后服务”的范畴
2025-12-10 11:25:00
杭州造火箭了!最快明年首飞,“半小时全球直达”
火箭不仅可以向太空发射卫星,还可以送洲际快递,甚至可以建造太空城实现“太空旅居”?这个听起来充满未来感的愿景,正在杭州迈出第一步
2025-12-10 12:19:00
望海康信荣膺国家级专精特新“小巨人”企业称号
近日,望海康信(北京)科技股份公司成功入选北京市第七批专精特新“小巨人”企业名单,荣获由工业和信息化部认定的国家级专精特新“小巨人”企业称号
2025-12-10 12:05:00
图达通港股上市,黄山市深度投资,助力汽车产业升级发展
大皖新闻讯 2025年12月10日,全球顶尖激光雷达制造商图达通正式在香港联合交易所挂牌上市,截至上午10点30分,涨幅50%
2025-12-10 11:32:00
大皖新闻讯 屏幕,作为用户感知数字世界的核心窗口,其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透
2025-12-10 10:20:00
100天倒计时|于变化中锚定成长,来京宠展驭见2026
十二年为一纪,自2014年破土而生,北京万耀雄鹰国际展览有限公司举办的京宠展已悄然走过它的第一轮春秋,我们看着行业从青涩走向成熟
2025-12-10 10:43:00
杭州日报讯 还没毕业就带队创业,把密码学原理变成孩子爱玩的闯关游戏。日前,在第十一届杭州市大学生科技创新大赛决赛现场,杭州电子科技大学在校生唐萌团队带来的“秘密传递小特工”项目
2025-12-10 06:43:00
智能穿戴产品打开千亿市场空间
从运动健康到生活全场景︐智能穿戴设备以技术融合重塑消费生态︐开启市场新增长极腕间智能手表实时监测心率,耳畔智能耳机同步语音控制
2025-12-10 07:13:00
病理诊断准确率可达到90%以上,AI破局病理诊断痛点每日商报讯 12月4日-6日,第四届中国智能肿瘤学大会在杭州举行。作为大会核心专题板块之一
2025-12-10 07:44:00
从“卖布料”到“卖创意”杭州日报讯 眼下,绍兴未远品牌管理有限公司负责人周凯正为其一手打造的品牌“GUYUANDAI”筹备新系列的作品
2025-12-10 06:44:00
原佳星摘要:互联网行业的迅速发展使数据成为企业核心资源,统计学专业的重要性随之提升。企业在产品运营、用户分析和商业预测中高度依赖统计能力
2025-12-09 05:45:00
近年来,商品过度包装问题引发社会广泛关注。部分商家为提升商品附加值,通过增加包装层数、扩大空隙率、使用高成本材料等方式制造“包装溢价”
2025-12-09 07:18:00
在杭州,两位潜心科研的博士后,不约而同地将目光投向了地球上空数百公里处的低轨卫星。来自西安电子科技大学杭州研究院的孙冉冉博士
2025-12-09 07:49:00
我省交通行业首个自主创新研发的交通数智大模型太行交通数智大模型发布河北日报讯(曹智、谭磊)12月6日,河北交投集团发布太行交通数智大模型
2025-12-09 08:00:00