• 我的订阅
  • 头条热搜
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...里大学等机构的研究人员首次提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报...……更多
...公司合作,计划将PurpleLlama评估套件整合进行业模型评估基准中。 ……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...提升基模型的性能。进一步加入TPO,在AlpacaEval、Arena-Hard基准测试中,性能比基线再提升约4%。网友纷纷表示这项研究很有意思,简单而又实用。如果你已经在进行DPO,那么采用这种方法几乎就是不二之选了。 所以,TPO到底长啥...……更多
遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一
...Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等严格的基准测试集上进行了全面而深入的评估。这次重新评估的初衷在于,许多开发者过于追求排行榜的名次,导致在模型训练过程中过度依赖评估集数据,并且过去的评估标准...……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...为了评估o1系列模型的规划能力,作者使用了PlanBench评估基准。该基准的提出者中也正好包含了本文三名作者中的两名——共同一作Karthik Valmeekam,以及他的导师Subbarao Kambhampati。PlanBench专门为评估大模型规划能力而设计,任务类...……更多
...拓展至航空遥感飞机、无人机等不同航空平台观测数据的自动化、高精度解译处理。尤其是航空大倾角成像过程中,极易出现畸变、遮挡、缺失等干扰,模型对此依然可以保持高精度的识别能力。目前“空天·灵眸”3.0版在覆盖...……更多
国产ai大模型首批评估名单公布
...盖6大通用能力场景、7大专用能力场景、3大服务成熟度,多维度验证研发大模型在研发场景能力和人效优化效果方面的场景丰富度,重点考察研发大模型在代码理解、代码生成和补全、研发问答、单元测试用例生成等方面的能力...……更多
深度势能核心开发者团队发布“大原子模型计划”
...型针对自己的体系进行微调优化部署、使用具体场景中的自动化工作流,加速解决科研场景中的具体问题。同时可共享数据、模型,进行成果展示,通过首页看板直观感受到自己的贡献价值,也可看到目前共建的成果。科研人员...……更多
...基础性能不同,《规范》是一款面向实际应用场景的评价基准,以服务器整机为评测对象,构建20多个基础性能和应用性能评测指标,其中应用性能涵盖数据库、大数据、虚拟化、AI等多种场景。近年来,随着大数据、人工智能...……更多
江苏:多维赋能 开创工业新前景
...术产品。在国家电网公司直属产业单位南瑞集团有限公司自动化设备电磁兼容实验室,科研人员在进行辐射发射实验准备工作(2023年7月7日摄)。设在江苏神马电力股份有限公司的国家能源电力绝缘复合材料重点实验室里,科研...……更多
...-72(通义千问1.5-72)。经过微调的对话模型进行了客观、自动化的能力评测,评测结果显示,总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中,Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年,中国电...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...很多。(这个榜单旨在为中文领域提供一个多模态大模型多维度能力评估参考,GPT-4o等国外模型仅作对比参考,不参与排名哦)hunyuan-vision也就是腾讯混元大模型的多模态版本了,除了开发者调用API之外,其实在腾讯元宝APP里免...……更多
GPT-4最强对手出现!Claude-3 AI模型发布
...处理那些需要快速反应的任务,例如知识检索和销售流程自动化等。Claude3OpusClaude3Opus是系列中的高端型号,具备与市场上其他顶尖模型相匹敌的复杂视觉处理能力,能够处理多种视觉格式,包括照片、图表、图形以及技术图解...……更多
...为分析中的应用统计学方法在消费者行为分析中的应用是多维度且深入的。通过收集消费者在不同时间点上的购买记录、浏览历史、社交网络互动等数据,构建出一个全面的消费者行为数据库。分析这些数据能够帮助企业了解消...……更多
...为汽车行业带来了新的机遇,其所提供的不仅仅是简单的自动化工具,更是通过集成先进的机器学习和自然语言处理技术,为汽车行业带来了前所未有的效率提升和个性化体验。“过去几年,AI在汽车领域的机会主要体现在自动...……更多
全球首位AI程序员爆火,背后公司成立仅4个月,CEO才27岁
...开发编码工具,以及抽象程度越来越高的人工监督,都为自动化软件工程指明了一条可能的方向。“无论如何,软件工程都将发生重大变化。”他在最后这样说。Web3基金的顾问,著名投资人packy mccormick使用Devin开发了一种餐厅评...……更多
老年综合评估:多维度了解老年人的身心健康
...的广泛关注。老年综合评估作为一种系统性的方法,通过多维度的评估手段,全面了解老年人的健康状况,以便制定个性化的护理和干预方案。一、老年综合评估的必要性老年人群体的健康问题往往是复杂且多样的,单一的健康...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...ral行列,成为Mistral一员。别看仅有30亿参数,在指令跟随基准上,完全超越了Llama 3 8B,以及前辈模型Mistral 7B。而且Ministral 3B和Ministral 8B在大模型竞技场中的测试,均拿下了媲美Gemma 2、Llama 3.1开源模型的成绩。 世界上最好……更多
解读健康风险评估和疾病风险评估
...多层次、全方位的深度分析健康风险评估是一个综合性、多维度的过程,它旨在通过收集和分析个体的健康信息,全面评估其健康状况和潜在风险。这一过程不仅关注个体的生物学特征,还涉及生活方式、环境因素、遗传因素等...……更多
遵义市多维度破解失能老年人养老难题
本文转自:人民网-贵州频道近年来,遵义市聚焦养老服务体系建设,以老年群体中的失能、半失能老年人为服务重点,有效破解失能老年人“养老难”的瓶颈问题。探索实施失能老人“集中供养+居家救助”遵义市益养仁和日间...……更多
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
...附上新款模型的性能情况如下:在更具挑战性的 MMLU-Pro 基准测试中,模型的性能提高了约 7%。 在 MATH 和 HiddenMath 基准测试中,数学性能显著提高了 20%。 视觉和代码相关任务也有所改进,在视觉理解和 Python 代码生成评估中提...……更多
深度赋能科技企业创新发展 浦发银行“浦科”系列产品生根企业处处开花
...通过科技创新、优化管理,致力打造互联网+回收、工业自动化深加工、制成新材料的全新模式。浦发银行淮安分行了解到该公司存在日常经营性周转资金需求后,第一时间和企业联系,推荐针对具有科创属性的小微企业量身定...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化标注。基于离线点云大模型3D自动化标注可高效提供动静态的障碍物真值,还可融合跨传感器与跨时序信息,自动补全被遮挡的目标,提高标注的精度。高速路场景下...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-modal Large Language Models, MLLMs)以文本模态为基础,将其它各种模态...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...过不断增加上下文长度(干扰图片的数量),将现有的VQA基准和简单图像识别集 (MNIST) 扩展为测试长上下文「提取推理」的示例。结果在简单VQA任务上,VLM的性能呈现出惊人的指数衰减。——LLM:原形毕露了家人们。而与实际研...……更多
“性价比”时代加速餐饮连锁化发展 多维度看2023年中国餐饮业发展趋势
...地方美食广域营销将成为出圈破局的重要手段。餐饮行业自动化进程促使人才转型相关数据显示,2020年送餐机器人市场规模由2019年的2.2亿元激增到11.6亿元,同比增长428.6%;2022年上升至约47.5亿元。自动化大规模的应用正在悄然...……更多
...规范,制定适宜的治疗方案。然而,医疗人工智能存在“自动化偏见”风险,即医生在诊断过程中可能会过度依赖人工智能技术,从而忽略自身专业判断和对患者个体需求的考虑。这种过度依赖可能导致医生将困难的医疗决策不...……更多
大幅减缓幻觉 百融云创大模型精度测评结果出炉
...越重要。百融云创参加的这场“考试”名叫检索增强生成基准测评,这是对大模型处理“幻觉问题”的能力测评,也是对大模型生成内容准确性的测评。尽管大模型带来令人兴奋的技术进步,但“幻觉”一直是制约其发展的主要...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...能会忽略或误用细节。最后,目前科学文献的检索和推理基准尚不完善。AI 无法参考整篇文献,而是局限于摘要、在固定语料库上检索,或者只是直接提供相关论文。这些基准不适合作为实际科学研究任务的性能代理,更重要的...……更多
更多关于科技的资讯:
冲泡即食、真材实料:海福盛冻干粥3.1元/杯大促
海福盛冻干粥5杯日常售价24.9元,今日下单可领6元优惠券,到手18.9元,包邮到家。购买链接:天猫(券后18.9元)下单赠送芙蓉鲜蔬汤一杯
2024-12-19 17:00:00
有效期3年:瑞慈全身体检套餐279元大促(立减800元)
天猫瑞慈体检旗舰店,成人全身体检套餐日常售价1079元,可领限量800元券,实付279元入手。全国66门店通用,有效期3年
2024-12-19 17:00:00
男子给已婚女同事发“么么哒”被辞退!法院判决:公司赔偿3万9
快科技12月19日消息,近日,据媒体报道,一则法院判决案例在网络流传,网文称安徽宣城一名“70后”男职工因给已婚女同事发“我想你”“么么哒”等聊天内容等原因遭到公司的辞退
2024-12-19 17:00:00
曝富士康已建立折叠屏iPhone测试线:厚度/重量尚未达到苹果标准
快科技12月19日消息,每年关于苹果的爆料,除了下一代iPhone之外,大家最熟悉的节目可能就是折叠屏iPhone了,年年都有传闻出现
2024-12-19 17:00:00
主人杀年猪 二哈偷吃猪肉被撑死:没有饱腹感、喂养需适量
12月19日消息,很多动物其实没有饱腹感,会一直进食,甚至有可能被撑死。近日在四川泸州,一户人家杀年猪,切好的肉放在桌子上
2024-12-19 17:00:00
中兴罕见涨停 股价创近一年来新高 夺A股成交冠军
快科技12月19日消息,作为A股硬科技领域的代表公司,中兴通讯今日盘中触及涨停板,股价创下近一年来的新高,总市值也重回1800亿元以上
2024-12-19 17:00:00
2024年,茅台悠蜜的美好遇见
营收连续5年蝉联第一。——在水果发酵酒领域,茅台悠蜜可谓是异军突起。12月18日,贵州茅台(集团)生态农业产业发展有限公司(以下简称“茅台生态农业公司”)2024年市场营销工作会议在贵阳市举行
2024-12-19 17:18:00
正安县中等职业学校:产教融合培育直播电商“新农人”
多彩贵州网讯 在当今数字化经济蓬勃发展的时代,直播电商作为一种新兴的商业模式,正以惊人的速度改变着人们的消费方式和市场格局
2024-12-19 17:19:00
远大医药获治疗干眼症的全球首创创新产品的独家开发及商业化权益
远大医药获得治疗干眼症的全球首创创新产品的独家开发及商业化权益OC-01和OC-02是两种高选择性的乙酰胆碱能受体激动剂
2024-12-19 17:21:00
@山东人:2024,你的钱都去哪了?参与调查赢奖品!
2024作为消费促进年,我国一系列促消费持续落地,有效释放了内需潜力,多数商品销售增势良好,升级类商品较快增长。根据国家统计局数据
2024-12-19 17:23:00
圣诞装蒂法3D模型分享:圣诞老人版“耶路撒泠”
随着圣诞节越来越近,“3D区”博主、模型渲染爱好者@DRAYQ今天在推特中分享了自己制作的圣诞装蒂法3D建模同人图。我们的“耶路撒冷”换上了圣诞老人短裙后像是要把衣服都要撑破了
2024-12-19 17:30:00
2026北京车展提前官宣:总面积超38万平米打破历史规模纪录
快科技12月19日消息,2026(第十九届)北京国际汽车展览会已正式定档。将于2026年4月24日至5月3日在北京中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)隆重举行
2024-12-19 17:30:00
余承东:很多车厂想和我们合作 抱歉 我手里没有那么多资源了
快科技12月19日消息,鸿蒙智行年度直播今日于海南三亚举办,余承东与四界老总相聚直播间,跟撒贝宁、尼格买提、陈伟鸿跨界对话
2024-12-19 17:30:00
鲜果酿造 口感纯正!云小耳黑莓果汁大促:48元券 6罐到手11.9元
云小耳黑莓果汁242ML*6罐日常售价为59.9元,下单领取48元优惠券,到手价为11.9元。购买链接:天猫(券后11
2024-12-19 17:30:00
商务部回应美方考虑禁售TP-Link路由器:别搞有罪推定
快科技12月19日消息,有报道称,美国商务部、国防部和司法部的调查人员以国安问题为由,已经对中国路由器品牌厂商TP-Link展开调查
2024-12-19 17:30:00