• 我的订阅
  • 头条热搜
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...易于评估”五个特性,用于评估语言模型回答简短问题的真实性能力。研究人员表示,中文简短问答能够指导开发者更好地理解其模型的中文真实性能力,并促进基础模型的发展。人工智能发展中的一个重大挑战是确保语言模型...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...指标无法完全捕捉模型生成的质量,更无法对生成视频的真实性、图文语义一致性等进行量化。因此,需要系统化构建针对文生视频模型的主观评价体系。该评价体系,由智源研究院与中国传媒大学基于双方在大模型评测领域和...……更多
豆包学会“写字”了!秒出海报漫画表情包,运营神器get
豆包支持在图片里面直接生成中文了。国内首家!我们火速上手试玩了一波,效果真的很不错。先来自制一张抽象表情包:或者设计一张迎接圣诞节的面包店海报:还有社交媒体运营经常需要的横版封面图:和竖版封面图:类...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
豆包代码大模型,不小心给曝光了!在字节开源的代码大模型评估基准FullStack Bench里面,出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版,还并没有上线。它在多种编程语言上的性能表现如下,可以看到在闭源模...……更多
...容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。当下,“百模大战”厮杀正酣,各类榜单也层出不穷,其中国际开放研究组织LMSYS Org(Large Model Sy...……更多
全面透视豆包:功能、版本、价格、优势、应用
本文将深入探讨豆包的功能特点、应用场景、费用结构以及企业应用优势和注意事项,帮助读者全面了解并合理利用这一AI工具,提升个人和企业的效率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具...……更多
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。根据介绍,本次大模型高考评测与河南省考卷完全相同,而河南高考录取分数线显示,文科本科一批录取分数线为521分,豆包等三款国产AI...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...MLU 和 C-Eval 等选择题形式的评测集。为了进一步同步推进中文社区对模型事实正确性的研究,淘天集团算法技术 - 未来生活实验室团队提出了Chinese SimpleQA,这是第一个系统性地全面评估模型回答简短事实性问题能力的中文评测...……更多
谁是苹果AI的“中国合伙人”?
...在大模型一途上搞得有声有色。以字节跳动为例,旗下的豆包大模型,在MMLU、BBH、GSM8K、HumanEval、DROP、CMMLU、CEval等11个业界主流的公开评测集上,是同期整体得分最高的国产模型。另外,豆包大模型也为小米、荣耀和OPPO提供大...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...k-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...4日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,...……更多
借助大模型能力,晓多科技智能客服的效率与服务双提升
...多科技不仅自研“晓模型 XPT”,还携手火山引擎,依托豆包大模型,进一步提升“AI 训练场”与“全渠道智能知识库”的智能化,全面升级智能客服能力。成都晓多科技有限公司成立于 2014 年,是以智能对话为核心的认知智能 S...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...员持之以恒的付出。第六期的《AIGC体验派》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近...……更多
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...下火山引擎在深圳举办 AI 创新巡展,一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。在此之前,海内外不少现象级的同类模型产品相继发布,包括字节跳动相继发布的即梦、海绵音乐,和剪映(...……更多
Mac装上字节豆包 艾玛!一下变AI PC了
万万没想到,Mac变成AI PC,原来就差了一个豆包电脑版。例如想要在B站上学习科技新进展,现在的打开方式是这样的——在豆包电脑版里,用AI看视频:将近15分钟的视频,“啪的一下”,各种重点内容全部给你总结好了:当然...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...成写作类任务的时候,AI助手就会给我们分配擅长文案的豆包。遇到编程问题,就会召唤代码能力较强的DeepSeek。以逻辑推理为主的问题,可能会让智谱来应对。当然界面中所展示的任务分类比较具有概括性,实际运行过程中AI助...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...月评测总榜和子榜两项第一,AI智能体方向受瞩目 近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,Sense...……更多
估值一年翻17倍,巨头创企疯狂涌入,AI搜索火爆了
...利润率或高达80%。下一步,如何重塑搜索模式的可靠度、真实性以及商业化,将成为AI搜索引擎新的课题。 ……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...性能表现。研究团队发现大多数模型在英语上的准确度比中文要高,这种差距在排名靠前的模型中尤为显著。推测可能有以下几个原因: 尽管这些模型包含了大量中文训练数据并且具有跨语言泛化能力,但它们的训练数据主要...……更多
腾讯元宝“上桌”,AI助手之争再起波澜
...的“AI问书”已经在用户群体中引发了热议。无论是抖音豆包、文心一言还是天工、Kimi,短时间内都很难追赶微信读书数百万正版图书的内容生态,这一高质量语料库,也将助力混元大模型深化专业知识能力。如今,全面接入微...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性成为了一个重要问题。此外,版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战,通过制定相关政策、法律和伦理准则来确保技术...……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
...,包含了4501个三轮对话的多语言指令任务,覆盖英语、中文、法语、俄语等八种语言,以全面测试模型在多轮、跨语言场景下的指令执行能力。论文链接:https://arxiv.org/abs/2410.15553Multi-IF下载链接:https://huggingface.co/datasets……更多
AGI、GAI、LLM怎么翻译:一大波人工智能外语词“中文名”出炉!
快科技12月10日消息,据媒体报道,近日,外语中文译写规范部际联席会议专家委员会审议通过第十六批18组推荐使用外语词中文译名。本次拟推荐使用的外语词中文译名,均为与人工智能、信息技术等相关的词条。其中在人工...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...实验更高效、更便宜,即使它有炉灶那么大。)对大多数中文母语者而言,这个任务应该不难,相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断完整文字仍然需要十分复杂的推理过程:当代神经科学研究表明...……更多
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
...多了?这就是我们最近发现的一个学习、工作神器 ——豆包电脑版。有了它,机器之心编辑部读论文、学东西的效率蹭蹭往上提,关键它还免费,都不用找主编报销。 接下来,就来揭秘一下这款提效神器是怎么帮我们学习 AI ...……更多
大模型价格“卷”至新低,带来哪些影响?
...度全部跟进。大模型价格“卷”至新低5月15日,字节跳动豆包大模型率先发起降价攻势,宣布主流大模型在企业市场的定价为0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。这样折合下来,1元钱就能买到125万Tokens...……更多
年轻人的「AI自由」,是它给的
...,人类即将再痛失一大阵地!搜索方面,信息的准确性、真实性也至关重要,我们又用热点新闻进行测试。 只用在几秒钟,豆包就完成了新闻事件检索。总结里,热点事件的时间、地点、人物、亮点、原因等要素整理,非常详...……更多
科大讯飞、阿里云、腾讯打价格战,大模型厂商“卷”起来
...全面免费。5月15日,在火山引擎原动力大会上,字节跳动豆包大模型发布,火山引擎总裁谭待表示,豆包主力模型在企业市场的定价为0.0008元/千tokens,即0.8厘就能处理1500多个汉字。事实上,“卷”起来的不止国产大模型,国外...……更多
一手体验电脑版豆包后,我删除了购物车里的AI PC
...意应用端都能方便快速地召唤AI助手?在这样的背景下,豆包电脑版应运而生。它突破了现有产品形态的困境,能够跨应用一键划词搜索,或是通过启动器随时唤醒,在桌面端提供跨应用的全方位AI能力。这意味着无论是在办公...……更多
更多关于科技的资讯:
溧水制造业再添一员“大将”年产两万台,易咖智车智能工厂投产南报网讯(记者胡英华通讯员陶燕燕谢一凡)自动导引车(AGV)“唱着歌”送材料
2025-10-24 07:47:00
中新经纬10月23日电 题:“山姆们”为何加速布局下沉市场?作者 江瀚 盘古智库高级研究员近日,以盒马、山姆为代表的新零售企业加速向全国下沉市场布局
2025-10-23 14:10:00
让残片活成文明的密码:专访90后文物活化创业者苗毅斐
2025 年上半年,文物拍卖市场迎来全面复苏,头部拍卖行交出亮眼成绩单,佳士得亚洲春季拍卖斩获 22 亿港元,苏富比亚洲中国艺术品专场亦录得 7
2025-10-23 14:18:00
西瓜学员科创赛事创佳绩,勇夺全球发明大会公益主题奖
2025 年 7 月 26 日至 28 日,全球发明大会中国区(ICC)全国总决赛在河南郑州国际会展中心落下帷幕。作为教育部严格筛选出的 “白名单” 竞赛
2025-10-23 14:18:00
深夜的福州南站,本应是灯火渐暗、人潮散去的时刻。然而在10月20日凌晨,这里却灯火通明、人声鼎沸——中国铁路南昌局集团有限公司首次推出的“歌迷专列”正整装待发
2025-10-23 15:29:00
万达电影亮相版博会,授权+原创双管齐下诠释“版权正当潮”
2025年10月16日,第十届中国国际版权博览会在青岛国际会展中心(崂山馆)正式开幕,万达电影作为参展商亮相北京展区。万达电影以“版权正当潮”为题
2025-10-23 16:08:00
拼多多给员工发黄金,10年老员工直接领100克金子? 网友:还得是真金白银实在!
2025年是拼多多成立10周年,日前,有拼多多员工在社交平台上晒出了拼多多给员工赠送的“周年礼”。据拼多多员工晒出的“周年礼”
2025-10-23 17:15:00
鲁网10月23日讯(记者 于胜涛)如今走进青岛市即墨区第二人民医院,会发现曾经缴费窗口排起的长队变短了,窗口前的焦灼面容也减少了
2025-10-23 17:19:00
泉韵风雅 尊享折叠 心系天下三星W26品鉴会落地济南
鲁网10月23日讯泉城济南,历史与潮流交相辉映;匠心之作,传承与创新共谱新章,10月23日,心系天下三星W26品鉴会于济南举行
2025-10-23 17:21:00
泉城雅集品匠心,心系天下三星W26品鉴会济南举办
10月23日,历史文化名城济南迎来一场科技与美学交融的盛宴——心系天下三星W26品鉴会。作为三星电子与中国电信携手打造的第18代超高端旗舰
2025-10-23 17:48:00
据统计,我国家电保有量已超 30 亿台,大量老旧热水器存在能耗高(超期服役机型能耗比新品高 50% 以上)、安全隐患突出等问题
2025-10-23 17:57:00
海尔发明了三筒洗衣机,也发明了行业新品类
中国家电品牌在海外市场的拓展速度再次刷新了大众的认知。前不久,海尔三筒洗衣机作为首个出口东南亚的中国三筒洗衣机品牌,一亮相直接登陆越南第一大现代连锁渠道
2025-10-23 18:02:00
作为深耕热水器领域 32年的专业品牌,万和始终以 “技术创新驱动用户体验升级” 为核心,依托行业领先的蓝金刚内胆、精准恒温
2025-10-23 18:05:00
2025年前三季度,社会消费品零售总额同比增长4.8%,服务零售额增速更是快于商品零售近3个百分点,消费“压舱石”作用愈发凸显
2025-10-23 18:36:00
贵州火焰山电器:开足马力备战销售旺季 AI新品成市场“硬通货”
多彩贵州网讯 随着秋冬季节来临,黔北大地寒意初显,位于贵州省遵义市播州区的贵州火焰山电器股份有限公司内却是一片火热景象
2025-10-23 18:40:00