• 我的订阅
  • 头条热搜
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。奋力追赶一年,成就...……更多
「AI时刻」LAM大动作模型兴起!这才是我们想要的AI!
...来解析语音命令,辅以GPT语言模型(主要负责转换人类的指令为文本并进行解读)来完成任务。它允许用户通过语音指令定制个性化操作,无须开发特定的API。该设备的动作模型通过分析人与应用程序的互动来学习操作方法。图...……更多
在“地球裂缝”上搭起的这座桥 将是世界第一高
...整的是第7根索股。吴朝明表示,调整这根索股需要参考基准索,即主缆第一根索股的位置。索股与基准索的相对高差,和指令的误差在-5到+10毫米内,调索才算完成。调索的工序并不复杂,但条件非常苛刻,只有在风和夜间温度...……更多
中央广播电视总台国际视频通讯社志愿服务小分队走进阳原
...。日前,中央广播电视总台国际视频通讯社美美“语”共多语种公益课堂志愿服务小分队走进河北省阳原县开展公益帮扶活动。图为捐赠仪式现场。杨璇摄志愿服务小分队由总台国际视频通讯社董事长、总经理兼总编辑高伟,常...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...)场景下进行了全面验证。不同微调方案在单一领域多个基准中的性能比较:在 BBH 基准上跨混合任务域的不同微调方案性能比较: 从以上两个表格可以得出以下结论:卓越的性能表现:HydraLoRA 在多个基准测试任务中均优于现...……更多
火狐Firefox 130正式发布!切换标签页视频自动小窗播放
...亚语和越南语等语言的支持,进一步扩大了火狐浏览器的多语言服务范围。在Firefox 130中,用户可以通过设置中的Firefox Labs,启用自动画中画功能以及其他实验性功能。Linux用户也将从Firefox 130中受益,因为该版本为Linux平台默认...……更多
amd推出10亿参数语言模型系列amdolmo
...AMDOLMo在推理能力和聊天能力上表现优异。尤其是在多个基准测试中,其性能与最新的OLMo模型相当,且计算预算仅为其一半。OLMo除数据中心使用外,更支持配备NPU(NeuralProcessingUnit,神经处理单元)的AMDRyzenAIPC能够部署模型,使...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...面,作者直接使用评估套件LLM Foundry,测试了模型在53个基准任务上的分数。与其他模型进行比较时,除了MMLU分数,作者还自定义了两个指标——「核心准确率」(core)和「扩展准确率」(extended)。前者是包括HellaSwag和ARC-E在...……更多
...民族大学有很多个,遍布全省民族地区。“我省是多民族多语种省份,全省的推普重点是边远民族地区和农村地区,了解少数民族群众的语言使用情况是推普获得成效的前提。”贵州民族大学国家语言文字推广基地常务副主任、...……更多
这个悟空不一般:传统文化对话未来,AI科技连接世界
...充满趣味与便捷,展现了AI科技与中国文化的深度融合。多语种多模态,智能语音畅通跨国交流在本次世博会中,孙悟空还能以中、日、英三种语言与观众进行自由深度的交互问答,带来生动有趣的体验。这得益于科大讯飞在多...……更多
大模型这把“火”,烧到了人形机器人
...意思是,人形机器人具备较好的知识完备性,能够把一个指令拆解成多个子任务和子指令,在不同场景去完成各种任务。比方说,你和机器人说“把饭热一下”,它知道要去找微波炉。随着谷歌、英伟达等公司对大模型+机器人...……更多
当AI大模型卷向服务机器人,会有哪些新故事?|硬氪分析
...程包括了几个必要步骤。首先,机器人需要听懂人发出的指令,将任务进行拆解;第二步是做出决策,确定目标定位并规划行进路线;第三步到达目的地后,面对冰箱里各式物品,机器人既要能识别出“可乐”、还要能控制机械...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...上最好的开源大模型”据Meta介绍,Llama 3已经在多种行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transfo...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出的偏好来对 LLM 进行综合排名。然而,随着 LLM 逐渐落地于众多应用场...……更多
...凯奇这一次对耳机的使用似乎是毫无必要的,假设不存在多语种观众同场观剧,现场只需播放一种语言,耳机就不再只是传送声波的设备,它制造了另一种声音文本,针对个体并使得每个个体更加集中精力。这又是一个悖论——...……更多
突破数据墙!27岁华裔MIT辍学创业8年,年化收入逼近10亿
...而过于具体的指示似乎会影响模型的推理能力。虽然o1在基准测试中取得了出色的结果,但让它完成你自己的具体任务似乎需要更多努力——它们往往会忽视明确(甚至是强调的)关于如何解决问题的指令。由此可见,现实世界...……更多
...州市税务局上线了一项新服务:“一带一路·12366税越”多语种咨询服务。作为杭州优化营商环境,提升城市国际化水平的一大举措,此番“一带一路·12366税越”多语种咨询杭州服务站上线无疑是杭州又一“加分项”,将吸引越...……更多
...条件下的训练对,还使用了一个自动标注的VLM来生成事后指令。该VLM处理来自机器人机载摄像头的分段视频片段,并以“为了得到这段视频中看到的动作,您会给机器人下达什么指令?”为提示。训练期间处理过的所有物品都会...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...和谷歌云提供的硬件。图丨Claude 3 与同行模型在多个性能基准上的比较(来源:Anthropic 官网) 或颠覆科研、内容创作等领域,在处理涉及深厚专业知识的任务上比 GPT-4 更具优势显而易见,基于上述能力,Claude 3 的潜在应用有...……更多
服务香港、迈向国际 | 兴业银行信创版境外核心系统V3升级项目顺利上线
...对境外系统的影响;满足国际化三多(多银行、多时区、多语言)要求,为兴业银行在海外伦敦、新加坡新开行奠定基础。下一步,兴业数金将持续秉承着勇于担当、攻坚克难、精益求精、乐于奉献和懂得感恩的研发精神,继续...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...泛学科领域的表现,被视为衡量人工智能学术能力的前沿基准。该测试包含超过3000道多项选择题和简答题,涵盖从语言学到火箭科学、从古典学到生态学等100多个学科领域。 由此也可以看出,DeepSeek确实让OpenAI感觉到压力不小...……更多
专为机器人行业而设计!谷歌推出两款新型AI模型
...能够通过物理动作输出结果,使机器人可以理解自然语言指令并执行复杂任务。更简单的说,Gemini Robotics可以听懂人类的语言,然后执行相应的命令。另一款名为Gemini Robotics-ER,是一个专注于空间推理的视觉-语言模型,能够帮...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...“我们迄今为止最强大、最通用的模型,它在许多领先的基准测试中都展现出了最先进的性能。”此前在接受《麻省理工学院技术评论》杂志采访时,Pichai还讲道:“在57项测试中,Gemini的表现有89%与人类专家相当。这是第一个...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...界知识不仅提升了 CLIP 在英文任务中的表现,还能赋予其多语言理解能力。尽管 LLM2CLIP 仅在英文数据上进行了训练,但在中文图文检索任务上却超越了中文 CLIP 模型。这一突破让 CLIP 不仅在英文数据上达到领先水平,同时在跨...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...代码生成任务的评测集TACO、文生图主观评测集Image-gen、多语言文生图质量评测数据集MG18、文生视频模型主观评测集 CUC T2V prompts。其中,主观题4000余道,均来源于自建原创未公开并保持高频迭代的主观评测集,严格校准打分标...……更多
...。在时间标准化领域,国际计量局(BIPM)作为全球时间基准的设定和维护机构,可以承担月球时间标准与地球“协调世界时”的衔接工作。在频谱分配领域,国际电信联盟(ITU)作为联合国系统负责电信业务的专门机构,能够...……更多
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...首批通过大模型国家标准测试认证的“模范生”,发布了多语言大模型、语音大模型与图文识别大模型,以及集语音、视觉、数字人一体的超拟人交互。基于模型底座的持续突破,正在加速星火智能体的全面爆发,助力全民Agent...……更多
直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线
...是GPT-4采用的架构。从官方公布的数据来看,Mixtral8x7B在基准测试中的表现十分出色,跑分全面超越GPT-3.5,更在多个跑分上超过了Llama2 70B,并且推理速度还是后者的6倍。△图源:Mistral AI 在生成同等质量的模型时,Mixtral8x7B的推...……更多
芝加哥大学研究表明,大型语言模型胜过人类分析师
...有显著优势。尽管一些专家谨慎地指出,这项研究使用的基准可能并不是最先进的财务分析模型,但总体研究结果仍然令人振奋。通用人工智能模型能够超越专门的财务模型甚至人类专家,这表明大型语言模型拥有改变财务分析...……更多
招320人!杭州外国语学校招生方案发布,报名今日开启
...3.语言学习能力强,口齿清晰,善于表达。能较好地适应多语种、跨文化学习,具有参与国际交流交往的意愿和能力。4.身心健康,能较好地适应同学间的良性竞争。独立生活能力强,具有较强的自我管理能力。没有不适宜寄宿...……更多
更多关于科技的资讯:
鲁网11月21日讯为回馈客户,赋能业务高质量发展,近日,河东农商银行桃源支行联合辖内某药业集团举办“金冬时节·健康相伴”客户养生见面会
2025-11-22 09:34:00
灵光4天下载破100万,扩容8轮,刷新Sora2五天纪录
11月22日消息,蚂蚁灵光上线4天下载量突破100万,冲上App Store中国区免费榜第六。灵光首个百万下载速度超过ChatGPT
2025-11-22 14:13:00
知识带货热度高,历史作家梅毅在抖音直播间发布新书
知识带货热度不减,越来越多作家走进直播间推荐新书、好书。11月20日,知名历史作家梅毅(网名“赫连勃勃大王”)携新作《天命无常
2025-11-22 15:35:00
齐绘未来发布“快上岸”智能求职小程序,多项自主知识产权技术为大学生就业赋能
北京齐绘未来教育科技有限公司近日正式推出“快上岸”微信小程序,以多项具备自主知识产权的AI系统为核心,为大学生提供精准
2025-11-22 15:36:00
以开源聚合力,以生态促创新,电鸿走出行业操作系统自主路径
“在过去,去一次现场要带一大堆终端,以应对现场不同设备的接入。现在,只需一部手机和一箱基础工具就行。”来自广州南沙示范区运维工作人员的分享
2025-11-22 15:37:00
河北新闻网讯(李力芳)2025年7月份以来,河北建工省安装六分公司浙江八亿时空项目创新引入平台吊装系统、蜘蛛吊、电动遥控坦克等专业技术装备
2025-11-22 18:08:00
11月21日从太钢获悉,太钢近期硅钢产品订单在欧洲高端市场实现成功落地。此次出口的硅钢产品首次实现大卷重(15-17吨)和高牌号超宽规格(1250mm)供货
2025-11-22 18:20:00
校企携手研发新型电池 拓展长时储能应用新边界
荆楚网(湖北日报网)讯(记者唐天琪 通讯员王蕾、蓝静)11月20日,以“储能大时代,长时新蓝海”为主题的中国新型储能产业创新联盟2025年度大会在武汉召开
2025-11-22 19:06:00
必胜客中国业务进入快车道:门店突破4000家
2025年11月22日,百胜中国旗下必胜客在海南三亚举行中国第4000家门店的开业庆典。这一里程碑意味着必胜客在中国的布局进入新阶段
2025-11-22 22:32:00
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00