• 我的订阅
  • 头条热搜
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...易于评估”五个特性,用于评估语言模型回答简短问题的真实性能力。研究人员表示,中文简短问答能够指导开发者更好地理解其模型的中文真实性能力,并促进基础模型的发展。人工智能发展中的一个重大挑战是确保语言模型...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...指标无法完全捕捉模型生成的质量,更无法对生成视频的真实性、图文语义一致性等进行量化。因此,需要系统化构建针对文生视频模型的主观评价体系。该评价体系,由智源研究院与中国传媒大学基于双方在大模型评测领域和...……更多
...容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。当下,“百模大战”厮杀正酣,各类榜单也层出不穷,其中国际开放研究组织LMSYS Org(Large Model Sy...……更多
全面透视豆包:功能、版本、价格、优势、应用
本文将深入探讨豆包的功能特点、应用场景、费用结构以及企业应用优势和注意事项,帮助读者全面了解并合理利用这一AI工具,提升个人和企业的效率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具...……更多
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。根据介绍,本次大模型高考评测与河南省考卷完全相同,而河南高考录取分数线显示,文科本科一批录取分数线为521分,豆包等三款国产AI...……更多
谁是苹果AI的“中国合伙人”?
...在大模型一途上搞得有声有色。以字节跳动为例,旗下的豆包大模型,在MMLU、BBH、GSM8K、HumanEval、DROP、CMMLU、CEval等11个业界主流的公开评测集上,是同期整体得分最高的国产模型。另外,豆包大模型也为小米、荣耀和OPPO提供大...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...MLU 和 C-Eval 等选择题形式的评测集。为了进一步同步推进中文社区对模型事实正确性的研究,淘天集团算法技术 - 未来生活实验室团队提出了Chinese SimpleQA,这是第一个系统性地全面评估模型回答简短事实性问题能力的中文评测...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...4日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,...……更多
借助大模型能力,晓多科技智能客服的效率与服务双提升
...多科技不仅自研“晓模型 XPT”,还携手火山引擎,依托豆包大模型,进一步提升“AI 训练场”与“全渠道智能知识库”的智能化,全面升级智能客服能力。成都晓多科技有限公司成立于 2014 年,是以智能对话为核心的认知智能 S...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...k-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...员持之以恒的付出。第六期的《AIGC体验派》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近...……更多
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...下火山引擎在深圳举办 AI 创新巡展,一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。在此之前,海内外不少现象级的同类模型产品相继发布,包括字节跳动相继发布的即梦、海绵音乐,和剪映(...……更多
Mac装上字节豆包 艾玛!一下变AI PC了
万万没想到,Mac变成AI PC,原来就差了一个豆包电脑版。例如想要在B站上学习科技新进展,现在的打开方式是这样的——在豆包电脑版里,用AI看视频:将近15分钟的视频,“啪的一下”,各种重点内容全部给你总结好了:当然...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...成写作类任务的时候,AI助手就会给我们分配擅长文案的豆包。遇到编程问题,就会召唤代码能力较强的DeepSeek。以逻辑推理为主的问题,可能会让智谱来应对。当然界面中所展示的任务分类比较具有概括性,实际运行过程中AI助...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...月评测总榜和子榜两项第一,AI智能体方向受瞩目 近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,Sense...……更多
腾讯元宝“上桌”,AI助手之争再起波澜
...的“AI问书”已经在用户群体中引发了热议。无论是抖音豆包、文心一言还是天工、Kimi,短时间内都很难追赶微信读书数百万正版图书的内容生态,这一高质量语料库,也将助力混元大模型深化专业知识能力。如今,全面接入微...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...性能表现。研究团队发现大多数模型在英语上的准确度比中文要高,这种差距在排名靠前的模型中尤为显著。推测可能有以下几个原因: 尽管这些模型包含了大量中文训练数据并且具有跨语言泛化能力,但它们的训练数据主要...……更多
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
...多了?这就是我们最近发现的一个学习、工作神器 ——豆包电脑版。有了它,机器之心编辑部读论文、学东西的效率蹭蹭往上提,关键它还免费,都不用找主编报销。 接下来,就来揭秘一下这款提效神器是怎么帮我们学习 AI ...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性成为了一个重要问题。此外,版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战,通过制定相关政策、法律和伦理准则来确保技术...……更多
大模型价格“卷”至新低,带来哪些影响?
...度全部跟进。大模型价格“卷”至新低5月15日,字节跳动豆包大模型率先发起降价攻势,宣布主流大模型在企业市场的定价为0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。这样折合下来,1元钱就能买到125万Tokens...……更多
年轻人的「AI自由」,是它给的
...,人类即将再痛失一大阵地!搜索方面,信息的准确性、真实性也至关重要,我们又用热点新闻进行测试。 只用在几秒钟,豆包就完成了新闻事件检索。总结里,热点事件的时间、地点、人物、亮点、原因等要素整理,非常详...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...实验更高效、更便宜,即使它有炉灶那么大。)对大多数中文母语者而言,这个任务应该不难,相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断完整文字仍然需要十分复杂的推理过程:当代神经科学研究表明...……更多
科大讯飞、阿里云、腾讯打价格战,大模型厂商“卷”起来
...全面免费。5月15日,在火山引擎原动力大会上,字节跳动豆包大模型发布,火山引擎总裁谭待表示,豆包主力模型在企业市场的定价为0.0008元/千tokens,即0.8厘就能处理1500多个汉字。事实上,“卷”起来的不止国产大模型,国外...……更多
一手体验电脑版豆包后,我删除了购物车里的AI PC
...意应用端都能方便快速地召唤AI助手?在这样的背景下,豆包电脑版应运而生。它突破了现有产品形态的困境,能够跨应用一键划词搜索,或是通过启动器随时唤醒,在桌面端提供跨应用的全方位AI能力。这意味着无论是在办公...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...两个主要产品,一个即已在国内运营的聊天机器人平台“豆包”,一个则是正在开发中的、计划通过火山引擎对外提供服务的机器人平台(bot platform)。如OpenAI一样,Seed项目的目标是最终建立通用人工智能,但真正的意图似乎是尽...……更多
腾讯回应大模型“价格战”:技术发展优先,对商业前景乐观
...注。5月15日,字节跳动在火山引擎原动力大会上正式发布豆包大模型,据介绍,豆包主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。这也引发外界对大模型“价格战”开启的猜测,...……更多
【聚焦2024中关村论坛】数据安全治理与发展论坛举行:发布7项实践成果
...产力、推动数字经济高质量发展提供有力保障。成果二:中文互联网语料库CCI 2.0北京智源人工智能研究院发布中文互联网语料库CCI 2.0,规模约500G,且为经过严格清洗过滤的中文数据集。CCI 2.0在1.0版本基础上,进一步扩充数据...……更多
《WILL: Follow The Light》Steam页面上线 支持中文
...快乐吧,所有操控都依照航海者的实际经历开发,在确保真实性的同时又做到了简单易上手,任何玩家都可以乐在其中。在寒冷恶劣的环境中航行对于生活在极北的人一直都很重要,而游戏主人公WILL——一个在海上长大的无畏...……更多
...何先发布局?得语料者,得天下?华策影视、每日互动、中文在线……今年3月,同花顺推出AI语料概念指数,从市场层面将“AI语料”推向台前。一众概念股中,或是明确表示拥有海量语料和数据集的上市公司,或是拥有海量IP...……更多
更多关于科技的资讯:
MWC现场直击:手机、运营商齐卷AI,硬件也要新故事
文 | 王方玉编辑 | 苏建勋万众期盼中,MWC 2025(世界移动通信大会)于3月3日在西班牙巴塞罗那正式拉开帷幕。作为全球通信行业的顶级盛会
2025-03-07 01:04:00
《哪吒2》票房破146亿!冲击全球第6 距《复联3》一步之遥
快科技3月6日消息,今日,据网络平台数据显示,动画电影《哪吒之魔童闹海》(以下简称《哪吒2》)总票房(包含港澳台及海外票房)突破146亿元
2025-03-06 19:43:00
智界R7车主称开智驾出严重事故:事发原因公布看呆网友
快科技3月6日消息,近日有小红书用户,同时也是智界R7车主发帖称,自己新提的车才1个月,结果在高速路上出事故导致车辆被撞报废
2025-03-06 19:43:00
顺鑫农业牛栏山持续引领行业品牌创新,让中国白酒融入烟火气
2024年度,中国白酒行业风云变幻、竞争激烈,而顺鑫农业旗下的牛栏山酒厂在这一年中的表现则可圈可点。牛栏山酒厂在其2024年度厂务公开暨总结表彰大会上
2025-03-06 20:13:00
雷军:小米汽车已交付超18万辆 还有15万台在排队
快科技3月6日消息,据报道,全国人大代表、小米集团董事长雷军在大会上表示:去年我在全国人代会上表态,一定会把小米汽车干好
2025-03-06 20:13:00
12万的“青春版奥迪” 奇瑞艾瑞泽8 PRO值得买吗
在12万级家用轿车市场,消费者常常面临“选国产还是合资”“要配置还是品牌”的纠结。如今,随着奇瑞艾瑞泽8 PRO的预售开启(起售价11
2025-03-06 20:13:00
五菱汽车发布正面盈利预告:净利润1.04亿同比增长约50%
快科技3月6日消息,五菱汽车在港交所发布正面盈利预告,预计截至2024年12月31日止年度将录得净利润约1.04亿元人民币
2025-03-06 20:13:00
刷新岛城春天的N种打开方式!上抖音,焕新青岛春日生活
摘要:相约青岛“过春天”,上抖音,焕新春日生活!春回大地,万象更新。褪去厚重的衣物,换上轻盈的春装,和三五好友围坐小马扎
2025-03-06 20:25:00
东科克诺尔:做好节能降耗 “加减法” 打造绿色工厂
十堰广电讯(全媒体记者 吕行 李昀翔)企业践行绿色发展,节能降耗是关键。东科克诺尔商用车制动有限公司通过调整生产工艺、科技化手段利用等方式
2025-03-06 20:28:00
护眼台灯哪个牌子好?掌握这三个挑选诀窍,远离智商税!
每当孩子写作业、看书的时候,我们总会担忧不良光线伤害孩子的眼睛。可想要挑个合适的护眼台灯,简直比解数学难题还让人头疼!市面上五花八门的牌子
2025-03-06 20:30:00
3月6日阳曲县消息,健康阳曲平台通过接入DeepSeek大语言模型,全面升级县域慢病AI辅诊能力,阳曲县在智慧医疗领域迈入全新阶段
2025-03-06 20:32:00
Manus创始人是中国90后:毕业于华中科技大学
快科技3月6日消息,继DeepSeek之后,科技圈又迎来一款全新的通用型AI Agent产品Manus,它由中国团队打造
2025-03-06 20:43:00
“英伟达小弟”上市风波不断:创始人巨额套现遭质疑 大客户被传撤单
随着本周被称为“英伟达小弟”的美国云计算平台CoreWeave递交上市招股书,这份充满“金融交易智慧”的文件令吃瓜群众大开眼界
2025-03-06 21:13:00
聚焦9大领域打造60+应用新场景 重庆发布人工智能赋能超大城市现代化治理三年行动计划
3月6日,上游新闻记者从重庆市城市治理委员会办公室获悉,为深入推进国家“人工智能+”战略部署,创新探索人工智能赋能超大城市现代化治理新路径
2025-03-06 21:14:00
车位到车位全程自主通行!广汽NDA4.0高阶智驾官宣:首搭昊铂HL
快科技3月6日消息,广汽昊铂宣布其NDA 4.0城市领航高阶智驾系统将率先应用于中大型SUV昊铂HL,该车型将于3月18日启动预售
2025-03-06 21:43:00