• 我的订阅
  • 头条热搜
真香!智谱大模型,有了首个免费的API
大模型API,正式进入Flash时代。最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推出了 Min...……更多
Yann LeCun说自回归要完,DeepMind论文证明自回归能实现通用计算
毫无疑问,现在可说是自回归大型语言模型(LLM)的时代,我们看到技术迭代,我们也看到应用频出,但即便如此,也依然有人表示不看好。唱衰自回归范式的最著名人物应当是 Yann LeCun 无疑了。他甚至还曾给出过一个相当大...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
... 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型。同时,旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台,用户可直接调用。 据阿里云官方介绍,相比上代模型,...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文...……更多
Nature封面:AI训AI 越训越傻
...等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个:GARBAGE OUT!要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...n-Sora、Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型的质量。值得注意的是,作为一种不需要训练的方法,PAB 可以为任何未来基于 DiT 的视频生成模型提供加速,让其具备实时生成的能力。自今年起,OpenAI 的 Sora 和其...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
...离,根据设定的阈值,判断签名的真伪。1.2隐马尔可夫模型隐马尔可夫模型(HMM)是在语音识别中得到成功应用的一种随机过程方法。在线签名序列与语音序列有某些内在的相似性。在语音序列中,音素是一种基本元素,这种音...……更多
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
【新智元导读】前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客,首篇博文的话题关于:基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的,分析了BERT灭绝的始末以及不同架构模型的优缺点,以史为...……更多
大模型越狱,价值百亿的猫鼠游戏|Future
...里,看见【Future】。文|林炜鑫编辑|苏建勋想要诱骗大模型听从一些不怀好意的指令吗?一个最简单的方式是,不停夸奖它,把它捧上天。比如,想让大模型教你如何制造炸弹,你得先夸它是世界上最聪明的AI,然后就会得到...……更多
国网浙江电力探索“AI+电力”增量价值
...斯中国科创人物、浙江大学人工智能系主任杨洋介绍,大模型是当前学术界在“AI+电力”领域的研究热点之一,包括大语言模型,面向负荷、电量等时间序列数据的时序大模型,以及能融合多类型数据从而更全面理解电力系统的...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
一个 token 就能控制模型快些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊...……更多
张一鸣被曝全力押注 AI,亲自监督字节跳动招聘高端人才
...12 月 8 日报道,字节跳动内部人士称,字节跳动创始人张一鸣虽然已卸任 CEO 一职,但他一直积极参与该集团的 AI 战略。这些人士说,张一鸣亲自监督了从竞争对手公司招聘 AI 工程师和研究人员的工作。张一鸣在内部谈到了他...……更多
新奥数能申请基于大语言模型的综合能源系统内容输出专利,能够提升用户体验和满意度
...显示,新奥数能科技有限公司申请一项名为“基于大语言模型的综合能源系统内容输出方法、系统及装置”的专利,公开号CN119903228A,申请日期为2024年11月。专利摘要显示,本发明涉及能源系统技术领域,公开了一种基于大语言...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...辑:泽南、杜伟生成式 AI 推理性价比是 GPU 的 140 倍。大模型时代,全球都缺算力,买铲子的英伟达市值被炒上了天。现在,终于有一家公司带着自己的 AI 芯片来叫板了。今天凌晨,科技圈迎来了一个重要新闻。美国芯片创业公...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群,——还...……更多
赛力斯基于哑语手势车辆控制专利公布
...,得到手语符号序列;将所述手语符号序列输入到大语言模型中,通过所述大语言模型对所述手语符号序列进行语义理解,并生成车辆控制指令。本申请可以准确识别哑语手势。 ……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
贵州电网申请基于多时间尺度分析的新能源发电量评估与预测专利,大幅提高发电量预测的精度和稳定性
...分析方法,提取发电数据的变化特征;构建时间序列预测模型;将发电数据的变化特征输入至时间序列预测模型;基于时间序列预测模型提供发电量评估报告。我方发明通过引入多时间尺度分析方法,有效提取了新能源发电数据...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
艾美疫苗(06660.HK)全面接入DeepSeek大模型,实现\
...积极响应国家"AI+"产业发展战略,全面部署接入DeepSeek大模型,通过本地化策略,推动DeepSeekR1版本在集团全业务场景应用,实现疫苗全生命周期的"降本、提质、增效"。为构建智能化疫苗研发体系,集团将藉助DeepSeek大模型,通过...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
文 | 苏建勋Transformer是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构,凭借强大的自然语言理解能力,Transformer在问世的短短几年内便取代了传统的RNN网络结构,成为自然语言处理领域的主流模型架构。如今,一家创业...……更多
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
...印与推测采样集成在一起,使之真正应用于生产系统。大模型的指纹下面跟小编一起来看下DeepMind的水印有何独到之处。识别AI生成的内容,目前有三种方法。第一种方法是在LLM生成的时候留个底,这在成本和隐私方面都存在问...……更多
赛道Hyper | AI PC渐近:联想抢占第一入口
...AI PC产业。这个全新产业的吸引力,就连智能手机移动SoC霸主的高通,也未能抵挡。12月7日,联想与IDC联合发布业内首份《AI PC产业(中国)白皮书》(以下简称《白皮书》),对AI PC做了明确定义。作为全新的技术产品,AI PC将...……更多
2023 CCF国际AIOps挑战赛决赛成功举办
12月16日,2023CCF国际AIOps挑战赛决赛暨“大模型时代的AIOps”研讨会于北京西郊宾馆成功举办。活动吸引了来自行业内众多一流专家、学者参与,共同探讨和展示了他们在智能运维领域的最新研究成果和技术应用,为智能运维技...……更多
...复原模型+VR黑科技+全息投影,带你探索远古巨兽从陆地霸主到翱翔蓝天的壮丽进化史诗,沉浸式感受科研与艺术的碰撞。上百件珍贵的恐龙化石与科学复原模型,铺陈开一幅波澜壮阔的史前画卷。从天空到陆地,从庞然巨物到...……更多
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...蒸馏这一概念,能在保证准确率接近的情况下,大幅压缩模型参数量,让模型能够部署在各种资源受限的环境。比如Siri能够出现在手机上,就是用知识蒸馏压缩语音模型。自它之后,大模型用各种方法提高性能上限,再蒸馏到...……更多
具身智能竞速时刻,百度百舸提供全栈加速方案
...晰。每一家企业都面临着同样的核心命题:如何将前沿的模型能力,转化为在真实世界各类场景中可规模化应用落地的机器人产品?这背后,是研发团队对模型迭代速度的极致追求。企业亟需突破算力瓶颈、简化工程复杂性、缩...……更多
更多关于科技的资讯:
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00
鲁网11月26日讯近日,莱商银行郓城西城小微支行迎来了一位熟悉的客户李大爷。他手持莱商银行新换发的金融IC卡,脸上却写满了困惑与焦虑
2025-11-26 11:13:00
鲁网11月26日讯近年来,莱芜农商银行雪野旅游区公司业务营销中心认真贯彻落实“五篇大文章”,聚焦科技型企业发展,创新“转型全周期”服务模式
2025-11-26 11:17:00