• 我的订阅
  • 头条热搜
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...易于评估”五个特性,用于评估语言模型回答简短问题的真实性能力。研究人员表示,中文简短问答能够指导开发者更好地理解其模型的中文真实性能力,并促进基础模型的发展。人工智能发展中的一个重大挑战是确保语言模型...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...指标无法完全捕捉模型生成的质量,更无法对生成视频的真实性、图文语义一致性等进行量化。因此,需要系统化构建针对文生视频模型的主观评价体系。该评价体系,由智源研究院与中国传媒大学基于双方在大模型评测领域和...……更多
豆包学会“写字”了!秒出海报漫画表情包,运营神器get
豆包支持在图片里面直接生成中文了。国内首家!我们火速上手试玩了一波,效果真的很不错。先来自制一张抽象表情包:或者设计一张迎接圣诞节的面包店海报:还有社交媒体运营经常需要的横版封面图:和竖版封面图:类...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
豆包代码大模型,不小心给曝光了!在字节开源的代码大模型评估基准FullStack Bench里面,出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版,还并没有上线。它在多种编程语言上的性能表现如下,可以看到在闭源模...……更多
...容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。当下,“百模大战”厮杀正酣,各类榜单也层出不穷,其中国际开放研究组织LMSYS Org(Large Model Sy...……更多
全面透视豆包:功能、版本、价格、优势、应用
本文将深入探讨豆包的功能特点、应用场景、费用结构以及企业应用优势和注意事项,帮助读者全面了解并合理利用这一AI工具,提升个人和企业的效率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具...……更多
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。根据介绍,本次大模型高考评测与河南省考卷完全相同,而河南高考录取分数线显示,文科本科一批录取分数线为521分,豆包等三款国产AI...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...MLU 和 C-Eval 等选择题形式的评测集。为了进一步同步推进中文社区对模型事实正确性的研究,淘天集团算法技术 - 未来生活实验室团队提出了Chinese SimpleQA,这是第一个系统性地全面评估模型回答简短事实性问题能力的中文评测...……更多
谁是苹果AI的“中国合伙人”?
...在大模型一途上搞得有声有色。以字节跳动为例,旗下的豆包大模型,在MMLU、BBH、GSM8K、HumanEval、DROP、CMMLU、CEval等11个业界主流的公开评测集上,是同期整体得分最高的国产模型。另外,豆包大模型也为小米、荣耀和OPPO提供大...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...k-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...4日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,...……更多
借助大模型能力,晓多科技智能客服的效率与服务双提升
...多科技不仅自研“晓模型 XPT”,还携手火山引擎,依托豆包大模型,进一步提升“AI 训练场”与“全渠道智能知识库”的智能化,全面升级智能客服能力。成都晓多科技有限公司成立于 2014 年,是以智能对话为核心的认知智能 S...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...员持之以恒的付出。第六期的《AIGC体验派》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近...……更多
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...下火山引擎在深圳举办 AI 创新巡展,一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。在此之前,海内外不少现象级的同类模型产品相继发布,包括字节跳动相继发布的即梦、海绵音乐,和剪映(...……更多
Mac装上字节豆包 艾玛!一下变AI PC了
万万没想到,Mac变成AI PC,原来就差了一个豆包电脑版。例如想要在B站上学习科技新进展,现在的打开方式是这样的——在豆包电脑版里,用AI看视频:将近15分钟的视频,“啪的一下”,各种重点内容全部给你总结好了:当然...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...成写作类任务的时候,AI助手就会给我们分配擅长文案的豆包。遇到编程问题,就会召唤代码能力较强的DeepSeek。以逻辑推理为主的问题,可能会让智谱来应对。当然界面中所展示的任务分类比较具有概括性,实际运行过程中AI助...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...月评测总榜和子榜两项第一,AI智能体方向受瞩目 近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,Sense...……更多
估值一年翻17倍,巨头创企疯狂涌入,AI搜索火爆了
...利润率或高达80%。下一步,如何重塑搜索模式的可靠度、真实性以及商业化,将成为AI搜索引擎新的课题。 ……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...性能表现。研究团队发现大多数模型在英语上的准确度比中文要高,这种差距在排名靠前的模型中尤为显著。推测可能有以下几个原因: 尽管这些模型包含了大量中文训练数据并且具有跨语言泛化能力,但它们的训练数据主要...……更多
腾讯元宝“上桌”,AI助手之争再起波澜
...的“AI问书”已经在用户群体中引发了热议。无论是抖音豆包、文心一言还是天工、Kimi,短时间内都很难追赶微信读书数百万正版图书的内容生态,这一高质量语料库,也将助力混元大模型深化专业知识能力。如今,全面接入微...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性成为了一个重要问题。此外,版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战,通过制定相关政策、法律和伦理准则来确保技术...……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
...,包含了4501个三轮对话的多语言指令任务,覆盖英语、中文、法语、俄语等八种语言,以全面测试模型在多轮、跨语言场景下的指令执行能力。论文链接:https://arxiv.org/abs/2410.15553Multi-IF下载链接:https://huggingface.co/datasets……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...实验更高效、更便宜,即使它有炉灶那么大。)对大多数中文母语者而言,这个任务应该不难,相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断完整文字仍然需要十分复杂的推理过程:当代神经科学研究表明...……更多
AGI、GAI、LLM怎么翻译:一大波人工智能外语词“中文名”出炉!
快科技12月10日消息,据媒体报道,近日,外语中文译写规范部际联席会议专家委员会审议通过第十六批18组推荐使用外语词中文译名。本次拟推荐使用的外语词中文译名,均为与人工智能、信息技术等相关的词条。其中在人工...……更多
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
...多了?这就是我们最近发现的一个学习、工作神器 ——豆包电脑版。有了它,机器之心编辑部读论文、学东西的效率蹭蹭往上提,关键它还免费,都不用找主编报销。 接下来,就来揭秘一下这款提效神器是怎么帮我们学习 AI ...……更多
大模型价格“卷”至新低,带来哪些影响?
...度全部跟进。大模型价格“卷”至新低5月15日,字节跳动豆包大模型率先发起降价攻势,宣布主流大模型在企业市场的定价为0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。这样折合下来,1元钱就能买到125万Tokens...……更多
年轻人的「AI自由」,是它给的
...,人类即将再痛失一大阵地!搜索方面,信息的准确性、真实性也至关重要,我们又用热点新闻进行测试。 只用在几秒钟,豆包就完成了新闻事件检索。总结里,热点事件的时间、地点、人物、亮点、原因等要素整理,非常详...……更多
科大讯飞、阿里云、腾讯打价格战,大模型厂商“卷”起来
...全面免费。5月15日,在火山引擎原动力大会上,字节跳动豆包大模型发布,火山引擎总裁谭待表示,豆包主力模型在企业市场的定价为0.0008元/千tokens,即0.8厘就能处理1500多个汉字。事实上,“卷”起来的不止国产大模型,国外...……更多
一手体验电脑版豆包后,我删除了购物车里的AI PC
...意应用端都能方便快速地召唤AI助手?在这样的背景下,豆包电脑版应运而生。它突破了现有产品形态的困境,能够跨应用一键划词搜索,或是通过启动器随时唤醒,在桌面端提供跨应用的全方位AI能力。这意味着无论是在办公...……更多
更多关于科技的资讯:
36氪合伙人、副总裁李政:中国产业的未来在哪?| 2025年36氪产业未来大会
9月10日,由36氪主办的2025年36氪产业未来大会在中国厦门盛大启幕。本次大会重磅携手商务部主办的“中国国际投资贸易洽谈会”
2025-09-16 01:03:00
核电“听诊器”打破卡脖子壁垒 中船集团携多款核心产品亮相烟台
齐鲁晚报·齐鲁壹点记者 于民星9月15日,2025山东清洁能源产业博览会和第18届烟台国际核电工业及装备博览会双展联动
2025-09-15 23:49:00
南方电网兴义供电局:职工自研装置投入使用 开启变电设备一键检测新模式
9月11日,在南方电网兴义供电局500千伏仁义变电站内,一套由该局文峰职工创新工作室历经3年自主研发的“无线传输型的氧化锌避雷器多组同步带电检测装置”成功投入使用
2025-09-15 23:11:00
人力资源管理专家汪江涛:以人才体系创新激活企业内生动力
文/许笑“人力资源管理的价值,在于精准识别组织痛点,通过体系搭建、机制创新与人才激活,将人力资源转化为推动企业前行的动能
2025-09-15 11:17:00
长白时评评论员 久泰平近日,围绕“预制菜”的争论持续发酵,引发广泛关注。表面上看,双方争执的焦点是“什么才算预制菜”,实则揭开了餐饮行业一个长期被回避的核心议题
2025-09-15 11:22:00
威海智造 冠军领航 | 从“千规千面”到“千舱千智”,一艘高端客滚船的“冠军制造”算法
大众网记者 宁晓洁 仇艺畅 威海报道威海湾畔,巨轮林立,焊花飞溅。这里是招商工业威海船厂的生产现场,一艘艘高端客滚船正在建设中
2025-09-15 11:26:00
威海智造 冠军领航 | 于“场景”处深耕,向“高端”处跃迁
□宁晓洁9月9日上午,“高质量发展中国行——冠军制造 工赋山东”活动自威海“启程”,三十多位来自中央及省重点媒体的记者
2025-09-15 11:31:00
2025海口第二届卫生健康知识脱口秀大赛进入复赛30强名单出炉
消费日报网讯(记者 郑红梅)9月12日,以“健康椰城 科普达人”为主题的2025海口市第二届卫生健康知识脱口秀大赛完成初评工作
2025-09-15 11:41:00
张家界武陵源AIGC短视频培训为宣传注入科技动能
近日,张家界市武陵源区“镜头有品+网评有巧+AI创造”AIGC短视频培训班开课。全区百余位文旅从业者与短视频创作者齐聚一堂
2025-09-15 11:56:00
响应工信部试点,元萝卜“做家电价格的机器人”锚定养老场景
近日,在工业和信息化部、民政部联合推动的智能养老服务机器人结对攻关与场景应用试点工作背景下,商汤科技旗下家用机器人品牌“元萝卜”成功入选试点名录
2025-09-15 12:11:00
贾少谦:海信没有秘密,只有长期主义的“苦炼”与“修行”
“海信没有秘密,海信的秘密就是坚持长期主义。”9月11日,海信集团董事长贾少谦受邀参加正和岛发起的标杆企业案例分享活动
2025-09-15 12:22:00
罗永浩凌晨“喊话”西贝创始人贾国龙当面对话
大皖新闻讯 近几日,罗永浩与西贝预制菜风波一直持续发酵,霸榜各大平台热搜。9月13日,罗永浩发文称“西贝的事告一段落”
2025-09-15 12:47:00
提供“2500+”岗位 蜀山区秋季首场招聘会走进合肥大学
大皖新闻讯 AI工程师、短剧编剧、金融科技……这些新兴岗位成为招聘会上的“香饽饽”!9月12日,蜀山区秋季招才引智首场招聘会在合肥大学火热开启
2025-09-15 12:47:00
智造世界 创造美好|蚌埠:奋力打造产值超千亿元智能传感产业集聚区
大皖新闻讯 9月12日,2025年世界制造业大会会前集中采访团来到位于蚌埠经济开发区的中国传感谷。“你好,可以和你握个手吗
2025-09-15 12:47:00
九章云极:AI+浪潮下的中国样本,把最新的普惠智算服务带到服贸会
2025年中国国际服务贸易交易会在北京国家会议中心和首钢园区举行。作为全球服务贸易领域最具影响力的年度盛会,历经13年发展的服贸会已成为促进国际经贸合作的重要平台
2025-09-15 13:00:00