• 我的订阅
  • 头条热搜
手脑并用,AI大模型“补全”机器人
...在目前这个时间节点,无法真正解决机器人学习的商业化大规模落地。第一个难点是数据获得的难度。在现实生活中收集其他的数据相对简单,但大规模的机器人数据目前并没有明确的获得途径,且机器人形态大小不一,实体的...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...验室领军科学家林达华分享了对大模型的思考。他表示,大规模生产高质量数据是大模型研发机构的竞争力所在。当前主流的大模型无一例外都建立在Transformer架构堆叠的基础上,但产业界和学术界在不断探索更加高效的架构,...……更多
...究院院长李学龙带领下,推出了星辰语音大模型,通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持最多方言、覆盖人口最多的语音大模型;研发团队首创“蒸馏+膨胀”...……更多
...得算力的强强结合,GLM-4稳定、高效运行于云端,并具备大规模实时推理能力,成功实现了成本效益和服务质量的平衡。这一创新使得智谱大模型能够深入理解用户需求,快速作出响应,为用户提供智能化生活的便利与高效。自2...……更多
印度宣布向AI领域投资1037亿卢比,强化对大语言模型的开发
...能在关键领域的应用,将重点开发 / 扩展 / 推广具有催化大规模社会经济转型的潜力的影响性 AI 解决方案。IndiaAI 未来技能:旨在降低进入 AI 行业的门槛,并增加本科、硕士和博士课程中的人工智能课程。此外,还将在印度二...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
...悉,GR-2 的开发团队采用了一种创新的微调方法。在经历大规模预训练后,通过在机器人轨迹数据上进行微调,GR-2 能够预测动作轨迹并生成视频。GR-2 的视频生成能力,让它在动作预测方面有着天然的优势。它能够通过输入一帧...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...训练效率,生数科技构建了完整的工程与数据体系,并在大规模GPU集群上实现更高效、低成本、强兼容的模型训练。唐家渝表示,去年团队花了近一个月的时间做完了华为昇腾训练架构的适配,芯片的国产替代帮助节省了不少成...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...使模型具有高效的并行计算能力与灵活性,从而可以处理大规模数据集,并能通过微调预训练模型,快速适应不同任务场景。同时,其层次化结构能做到对复杂数据深层次的抽象和解析。 因此,Transformer 架构的引入为具身智能...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...直接在笔记本电脑上运行。性能表现方面,Gemma7B在MMLU(大规模多任务语言理解)测试中取得了64.3%的高分,而之前的佼佼者Mistral7B得分为62.5%,Meta的Llama-27B和13B模型也有所不及。此外,Gemma还在HuggingFace和HuggingChat平台上上线……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...和显存占用降低的优势。 模型评测相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解...……更多
专家模型不要专家并行!微软开源MoE新路径
...为90.4,而在编码任务基准HumanEval上拿到了74.4分。在MMLU(大规模多任务语言理解)基准测试中GRIN得分为79.4,超过了同为MoE架构的Mixtral(70.5分),以及自家的Phi-3.5(78.9分)。如果对比流行的商用模型,GPT-3.5表示感受到时代的...……更多
摩尔线程万卡GPU集群新进展!性能可提升20倍
...软件公司清程极智正式建立战略合作关系,旨在加速国产大规模GPU智算集群的产业化进程,推动AI算力生态的快速发展,为大模型行业提供更强大、灵活且高效的基础设施支持。摩尔线程近期宣布了从千卡至万卡的全功能GPU智算...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...种识别、多维度数据质量评估,由此,就获得了高质量、大规模多语言数据。与此同时,通过利用多语言MoE、参数扩展方法,从而保证主导语言(如中英)性能不下降的情况下,提升了其他语种的性能。微调阶段,基于多语言大...……更多
天工skyagents助力大模型走入千家万户
...数据检索增强(RAG)的能力,能够支持导入更多格式和更大规模的数据和知识,相当于给大模型增加了“智能知识库外脑”。结合人工智能技术,平台能够从导入的数据中自动识别关键信息点,形成结构化的知识体系。从此,「...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...的核心组成。然而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等全球多...……更多
...研究的霍金斯还说,以往的类似研究计算成本太高,难以大规模应用。科学家们说,三个资料库框架都使用神经符号方法——一种结合神经网络的人工智能结构。神经网络就是采用经典的类似程序的逻辑方法,模仿人类大脑结构...……更多
新鲜早科技丨台积电宣布日本第二制造工厂建设计划;华为2023年度分红770亿
...产高级闪存。全球闪存大厂铠侠计划最快2025年秋季开始大规模生产高级闪存。铠侠将向位于日本岩手县北上和三重县四日市的生产基地投资总计约7000亿日元,日本政府将提供近2400亿日元支持。(界面)4、机构:2023年全球平板...……更多
美国目前虽领先,“科技人才将让中国AI产业最终胜出”
...成式AI的竞争。据中国媒体报道,截至4月中国国内发布的大规模语言模型已经超过300个,而这正是生成式AI的技术基础。AI的核心产业规模也在2023年达到5784亿元人民币,比前一年增长13.9%。熟悉中国数字产业的野村综合研究所未...……更多
AI,未来也许只是一种办公软件
...统和应用增强人类工作的关键机理在于其通过深度学习和大规模训练,具备了处理复杂数据、理解自然语言和模拟人类思维过程的能力,可以在没有人类干预的情况下自动化执行任务。倚仗庞大的数据集和算力资源,LLMs能够提...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...模型各项评测中最关键的MMLU(MassiveMultitaskLanguageUnderstanding大规模多任务语言理解)、BBH等反映模型综合能力的评测集上,Yi-34B同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。 各评测集得分:Yi模型v.s...……更多
林伟:大数据AI一体化的解读
...程的能力,包括数据采集和集成,再通过大数据平台,做大规模的离线分析,去验证数据质量。此外还有流式的计算能力。数据在大数据平台上处理好之后,就会被“投喂”到PAI这个负责人工智能开发的平台,去做训练和迭代。...……更多
从云栖大会,看阿里的科技本色
...阿里巴巴不断对通义大模型进行了迭代和更新,包括推出大规模视觉语言模型 Qwen-VL,并成为第一个开源自家大模型的大型科技企业,在 8 月开源了 Qwen-7B 和 Qwen-7B-Chat,9 月开源了 Qwen-14B 和 Qwen-14B-Chat。此次云栖大会上,通义千...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中小型企业望而却步。其内部架构的复杂性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问...……更多
Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤
...频假冒好友与陈先生聊天,从而实施诈骗。Sora如果实现大规模推广,将大大降低普通人利用AI合成高质量视频的难度。据中国科学院信息工程研究所正高级工程师韩冀中介绍,Sora应用的技术与此前的深度伪造技术相互承接,又...……更多
大模型时代的阿里云,将云计算进行到底
...淘金”,其中,云厂商是一股重要力量,云计算天然适合大规模的AI任务,同时云厂商也有人才、资源等优势,匹配大模型这类技术密集型工作。淘金热最开始的阶段总是最混乱,淘金者一窝蜂涌向理想之地,竞争很快变得激烈...……更多
... AI)生成式人工智能是利用复杂的算法、模型和规则,从大规模数据集中学习,以创造新的原创内容的人工智能技术。这项技术能够创造文本、图片、声音、视频和代码等多种类型的内容,全面超越了传统软件的数据处理和分析...……更多
...内人士认为,如果将数据视为新时代的石油,那么融合了大规模数据处理、数据挖掘、机器学习、人机交互、可视化等多种底层技术的数据智能就是“炼油厂”。具体来说,数据智能通过分析数据获得价值,将原始数据加工为信...……更多
梦想当燃|浪潮云海若大模型团队:从“0”开始,前进不会止步
...突破了高效微调技术,大大降低了计算和存储成本,使得大规模预训练语言模型(PLM)的微调变得更为经济高效;突破了检索增强技术,解决了大模型在知识局限性和实时性方面的问题,从而生成更准确、更丰富的输出结果。同...……更多
更多关于科技的资讯:
近日,“年轻人开始反向驯化‘大数据杀熟’”的话题引发热议。一名年轻人通过反复评论“机票太贵了,买不起,不去了”后,发现机票价格从4309元降至1903元
2024-12-20 22:28:00
本文转自:人民网人民网北京12月20日电 (记者夏晓伦)“数据二十条”提出,“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”
2024-12-20 22:56:00
放弃坚果狂吃肉 松鼠捕田鼠吃 尝过肉就停不下来
近日,科学家们发现加州地区的松鼠,出现了一种反常态且令人惊讶的行为:它们放弃了对坚果和果实的热爱,转而开始食肉,吃的还是同是啮齿动物的田鼠
2024-12-21 00:01:00
晋江文学城回应被要求整改:一直在北京 对浙江消保委约谈非常惊讶
快科技12月20日消息,今晚,晋江文学城发布了关于近期被浙江消保委要求整改及后续媒体不实报道的解释和说明。说明中称,晋江文学城于2024年12月2日收到自称“浙江省消费者权益保护委员会”的组织下达的《约谈函》
2024-12-21 00:01:00
科幻惊悚剧《怪奇物语》第五季杀青 多张幕后照发布
快科技12月20日消息,网飞正式官宣,《怪奇物语》第五季杀青,同时发布多张幕后照。《怪奇物语》(Stranger Things)是美国网飞公司制作的一部主打科幻惊悚风格的美剧
2024-12-21 00:01:00
拉萨一航班起飞时遭遇鸟击返航:风挡玻璃上血迹斑斑
快科技12月20日消息,据报道,今日上午,西藏航空一个从拉萨飞往西宁的航班在起飞时,遭遇鸟击后返航。网友发布的现场视频显示
2024-12-21 00:01:00
小红书已经成为新一代《1818黄金眼》
“ 在商场门口被无人机撞头,怎么维权 ” ?“ 服了,在网购平台买到假乳液了 ” 。“xx 手机维权!质保期内右上角漏液
2024-12-21 00:31:00
世界第三大车企即将诞生:被迫的
快科技12月21日消息,多少有些戏剧性的剧情正在上演,继丰田和大众之后,世界第三大汽车集团即将诞生,然而,双方是不得不走到这一步
2024-12-21 08:01:00
年薪50万女子择偶标准要求千万年薪引热议:门当户对不应该吗
12月21日消息,1991年出生的万女士开了一家公司,年收入50万左右。择偶要求男方年薪千万,相亲遇到“假富豪”,引发关注
2024-12-21 08:01:00
《暗喻幻想》IGN年度最佳引热议:你认为是否实至名归
IGN今日举行了年度游戏颁奖直播,年度最佳游戏奖项最终颁发给了《暗喻幻想:ReFantazio》。这一消息在官方推特发布后
2024-12-21 00:31:00
超算+AI 我国科学家揭示地球20亿年生命演化历程
快科技12月21日消息,南京大学科研团队联合中外多家科研单位,揭示了地球大约从20亿年到5亿年前早期生命多样性演化历程
2024-12-21 00:31:00
微信推出这个送礼功能 到底好不好用
兄弟们,掐指一算,很久没写微信的新功能了。倒不是世超不想整,相反,写了流量大大滴,我还特想写。主要现在微信新功能都是灰度
2024-12-21 00:31:00
冬天来了 我却不会开车上的空调
这几天天气冷了,但脖子哥在网上冲浪的时候,刷到很多人还不会用车上的空调。比如下面这个问题,冬天刚打着火的车,它吹出来的暖风到底是不是暖风
2024-12-21 00:31:00
警方通报新型诈骗:直播间开盲盒获高额奖金 全是假的
快科技12月21日消息,网络直播间直播开盲盒,高额奖金频频开出,“小投入高回报”让观看的人心动不已,但实际上是精心设计的骗局
2024-12-21 00:31:00
因没用USB-C接口:iPhone 14/SE今日起在欧盟停产、停售
快科技12月21日消息,今日起,苹果将逐步在欧盟地区正式停售iPhone 14、iPhone 14 Plus、iPhone SE 3
2024-12-21 00:31:00