• 我的订阅
  • 头条热搜
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与图数据挖掘领域的深度合作。...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...以提高性能。MMMU-Pro:更健壮的MMMU重新审视MMMU基准测试大规模多学科多模态理解和推理(MMMU)基准测试是一个综合性的数据集,能够评估多模态人工智能模型在需要特定学科知识和深思熟虑推理的大学水平任务上的表现。MMMU由...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...计算机视觉、音频处理以及估计和预测等任务。首个通用大规模Mamba模型上面提到,基于注意力机制的Transformer是当今所有最强大语言模型中占主导地位的架构。然而,由于计算和内存成本随着序列长度的增加而增加,注意力机...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...但他们利用视频作为通用监督的可扩展来源。UniReal 可从大规模视频中学习世界动态,在处理阴影、反射、姿态变化和物体交互方面展示了先进的能力,同时还为新型应用展示了新兴能力。论文链接: https://arxiv.org/abs/2412.07774项...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交错图像和文本文档上进行了预训练,具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内部维度14336...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...论文地址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令,使它们适合用作模型输出的自动评估器。一方面,为了使LLM自动评分更加合理、准确并与人类偏好保持一致,对人类判断...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...元导读】Robin3D通过鲁棒指令数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...一个具有 2.4B 非嵌入参数的 Memory3 模型,其性能超过了更大规模的 SOTA 模型。它还比 RAG 具有更好的性能和更快的推理速度; 此外,Memory3 提高了事实性并减轻了幻觉,并能够快速适应专业任务。方法介绍记忆电路理论有助于确...……更多
GPT-4最强对手出现!Claude-3 AI模型发布
...PT(GenerativePre-trainedTransformer)技术的大型语言模型,通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。亚马逊于今日宣布使用Claude3来优化其商业逻辑 该系列包含三款各具特色的型号:Claude3Haiku、Claude3Sonnet以……更多
总说具身智能的数据太贵,鹏城实验室开源百万规模标准化数据集
...的具身智能领域学术成果 ——ARIO(All Robots In One)具身大规模数据集,旨在解决当前具身智能领域所面临的数据获取难题。 论文题目:All Robots in One: A New Standard and Unified Dataset for Versatile……更多
pixelmatorpro新增pdf文本编辑、文本图层轮廓
...前官方为PixelmatorPro推出了3.5.8版本,新增PDF文本编辑、文本图层轮廓、“便当网格”模版等内容。IT之家整理主要更新点如下:PDF中的可编辑文本图层您现在可以将矢量PDF中的文本元素作为常规文本图层导入,然后使用各种文件...……更多
Jina AI 推出全球首个开源 8K 文本嵌入模型
...品,在功能和性能上与OpenAI的text-embedding-ada-002类似。在大规模文本嵌入基准(MTEB)排行榜方面,IT之家发现,官方进行如下解释:与OpenAI的8K模型text-embedding-ada-002进行比较,jina-embedding-v2在分类平均值、重排平均……更多
...、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...级处理能力的任务。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力。Gemini Pro专为多...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 tokens,其内容来自于四个来源:1. 通过启发...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...腾讯联合北京大学、北京科技大学共同完成的研究《面向大规模数据的Angel机器学习平台关键技术及应用》,也斩获2023中国电子学会科学技术奖一等奖,体现了腾讯深厚的自研技术积累。在应用上,腾讯混元大模型已经支持了腾...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...间或使处理器过热。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客...……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
...于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。一直以来,想要完整建模在线购物相当复杂,主要痛点是:多任务性:在线购物...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...所示:为实现强大的通用和泛化能力,研究人员需要基于大规模和多样化的数据集训练模型。然而,在图像生成领域,尚无一个可用的通用数据集。为此,我们构建了首个大规模且多样化的统一图像生成数据集 X2I,意为「Anything...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...从Pixel 8 Pro设备开始支持。Gemini中最大Size的Ultra仍在完成大规模信任和安全检查的过程中,尚未全面公开发布。在其完善过程中,Ultra将向部分客户、开发者、合作伙伴以及安全和责任专家,以供相应人员进行早期试验、提供反...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角,对于理解复杂系统...……更多
AI一本正经地胡说八道 有种办法可以识破它
...措辞得当,也基本符合官方通报的格式,导致了错误信息大规模传播。美国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 技术生成的新闻报道,却被发现其中存在大量基础性错误,包括计算错误、金融概念误解等,不得不...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...valuation)来提升结果的准确性,但这种方式成本高、难以大规模应用,而且缺乏可复现性。 在图片生成领域,已有多种方法使用模型来自动评估(Automated Evaluation)生成图像的表现,其中常见的指标包括CLIPScore、FID、LPIPS、PickSc...……更多
国产chatgpt何时能出?百度站出来了最快3月评分全球第一
...被国际顶级学术会议AAAI、IJCAI收录。ERNIE在工业界得到了大规模应用,如搜索引擎、新闻推荐、广告系统、语音交互、智能客服等。 ……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...到了一个有合适推理效率的平衡点。之所以做到405B这么大规模,其实原因很简单——我们想做出最好的模型,一个真正与GPT-4比肩的开源模型。(现在是GPT-4o了)虽然目前还没有完全达到目标,但差距正在逐渐缩小。正如小扎之...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...,Gemini Ultra模型超越了现有最先进的GPT-4。其中,在MMLU(大规模多任务语言理解)测试中,Gemini Ultra以90.0%的成绩首次超过了人类专家,这一测试综合了数学、物理、历史等57个科目;此外在UltraMMMU多模态测试中也取得59.4%高分;...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...where to judge)。最后,我们归纳了评估 LLM 作为评判者的基准数据集,并强调了关键挑战和有希望的方向,旨在提供有价值的见解并启发这一有希望的研究领域的未来研究。论文链接:https://arxiv.org/abs/2411.16594 网站链接:https://llm...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...由有关世界的问题组成。值得注意的是,UltraChat 是一个大规模多轮对话数据集,但作者仅选择了前 150K 条条目并仅使用第一轮指令。最终获得 200K 语音指令数据,称为 InstructS2S-200K。实验结果训练数据。作者采用 InstructS2S-200K 数...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...习研究人员都对新型 GPU 感到兴奋。它的尖端功能也能让大规模实验更高效、更便宜,即使它有炉灶那么大。)对大多数中文母语者而言,这个任务应该不难,相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断...……更多
更多关于科技的资讯:
日前,石太高速改扩建项目3分部高效完成了Y匝道桥下构施工,较原计划提前40天实现节点目标。该桥下构施工包含桩基56根、承台21个
2025-04-26 17:57:00
4月23日至25日,第四届全民阅读大会在太原举行,太原移动以“智慧网络”为笔,在这场文化盛会上书写通信保障的精彩篇章。面对人员与流量的双重激增
2025-04-26 18:04:00
鲁网4月26日讯莱芜农商银行莱芜区公司业务营销中心顺应当前科技创新驱动经济发展形势,聚焦科创企业金融服务,采取有力举措为科创产业的蓬勃发展注入强劲动力
2025-04-26 20:34:00
五一不劳动,海尔兄弟免费送
五一劳动节即将来临,海尔兄弟为大家准备了丰厚的宠粉福利!参与活动,就有机会赢取海尔兄弟全家桶系列大礼,包括旅行套、随心套和时尚套
2025-04-26 21:00:00
科交会举办“人工智能+”场景对接活动 安徽打造全球AI创新高地
大皖新闻讯 4月26日下午,记者从第三届中国(安徽)科交会“人工智能+”场景对接活动中了解到,安徽已成为人工智能国家战略布局和重大平台最为集聚的省市之一
2025-04-26 21:16:00
失业年轻人的新标配:一周三刷迪士尼
“感觉像是回家了”迪士尼好像有种魔力。一迈进迪士尼乐园的大门,就好像跨越了一道结界,将冷冰冰的现实世界隔离在外。焦虑抛之脑后
2025-04-26 21:25:00
头部电商携手龙头商超企业同发力!青岛助外贸企业“破局突围”
齐鲁晚报·齐鲁壹点 尚青龙面对国际贸易风浪,青岛彰显应对挑战的“硬实力”。4月26日,“外贸优品青岛行”内外贸融合促消费活动在西海岸新区嘉年华·海信广场盛大启幕
2025-04-26 21:33:00
马斯克杀回汽车行业:特斯拉自动驾驶出租车开测
快科技4月26日消息,终于马斯克的工作重心要从效率部转移到特斯拉身上了,而他首先抓的就是Robotaxi业务。最新消息
2025-04-26 14:04:00
日本一大爷坠入深坑3个月仍未获救 官方:预计5月中旬开始搜寻
4月26日消息,听起来很奇葩的事,发生在某些国家似乎也并不令人觉得意外了。日本媒体报道,今年1月28日,该国埼玉县八潮市发生路面塌陷事故
2025-04-26 14:04:00
性价比太高 美厂商无力抗衡!TP-Link正面临美国反垄断调查 或遭禁售
快科技4月26日消息,据国外媒体报道称,TP-Link正面临美国司法部的反垄断刑事调查,理由是销售低于成本的商品以获得市场份额
2025-04-26 14:04:00
港湾周评|刘强东发起外卖大战,今年抢10%市场份额?
《港湾商业观察》李镭自宣布进军外卖以来,京东在舆论场可谓收获满满,随着师出有名的改变行业顽疾、让外卖行业更美好、让从业人员生活更好等系列价值观推进下
2025-04-26 14:29:00
国补价1699.15元!小米发布米家无线洗地机4 Pro:21000Pa狂暴吸力
快科技4月26日消息,小米最新推出了米家无线洗地机4 Pro,首发价1999元,国补到手价1699.15元起。新品在外观上采用了米家高端系列的灰色调为主
2025-04-26 14:34:00
F5G-A万兆光网加速商用 华为获光华杯全国一等奖
快科技4月26日消息,日前第三届“光华杯”千兆光网应用创新大赛全国总决赛颁奖仪式在广西南宁举办。仪式上,上海电信联合华为申报的《基于50G PON的万兆光网打造数智生活》项目
2025-04-26 14:34:00
芬兰首次发现“巨型病毒”直径约200纳米 刷新生命认知
快科技4月26日消息,据媒体报道,近日,芬兰于韦斯屈莱大学纳米科学中心研究人员取得重要发现。他们首次在芬兰分离出一种巨型病毒
2025-04-26 14:34:00
女子手机失控冲进派出所 民警让砸掉:保住了21万
快科技4月26日消息,据媒体报道,近日,浙江嘉兴发生了一起令人惊心动魄的事件。一位李阿姨焦急万分地冲进派出所,向民警诉说自己的手机突然不受控制
2025-04-26 15:04:00