• 我的订阅
  • 头条热搜
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...易于评估”五个特性,用于评估语言模型回答简短问题的真实性能力。研究人员表示,中文简短问答能够指导开发者更好地理解其模型的中文真实性能力,并促进基础模型的发展。人工智能发展中的一个重大挑战是确保语言模型...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...指标无法完全捕捉模型生成的质量,更无法对生成视频的真实性、图文语义一致性等进行量化。因此,需要系统化构建针对文生视频模型的主观评价体系。该评价体系,由智源研究院与中国传媒大学基于双方在大模型评测领域和...……更多
...容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。当下,“百模大战”厮杀正酣,各类榜单也层出不穷,其中国际开放研究组织LMSYS Org(Large Model Sy...……更多
全面透视豆包:功能、版本、价格、优势、应用
本文将深入探讨豆包的功能特点、应用场景、费用结构以及企业应用优势和注意事项,帮助读者全面了解并合理利用这一AI工具,提升个人和企业的效率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具...……更多
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。根据介绍,本次大模型高考评测与河南省考卷完全相同,而河南高考录取分数线显示,文科本科一批录取分数线为521分,豆包等三款国产AI...……更多
谁是苹果AI的“中国合伙人”?
...在大模型一途上搞得有声有色。以字节跳动为例,旗下的豆包大模型,在MMLU、BBH、GSM8K、HumanEval、DROP、CMMLU、CEval等11个业界主流的公开评测集上,是同期整体得分最高的国产模型。另外,豆包大模型也为小米、荣耀和OPPO提供大...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...4日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,...……更多
借助大模型能力,晓多科技智能客服的效率与服务双提升
...多科技不仅自研“晓模型 XPT”,还携手火山引擎,依托豆包大模型,进一步提升“AI 训练场”与“全渠道智能知识库”的智能化,全面升级智能客服能力。成都晓多科技有限公司成立于 2014 年,是以智能对话为核心的认知智能 S...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...MLU 和 C-Eval 等选择题形式的评测集。为了进一步同步推进中文社区对模型事实正确性的研究,淘天集团算法技术 - 未来生活实验室团队提出了Chinese SimpleQA,这是第一个系统性地全面评估模型回答简短事实性问题能力的中文评测...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...k-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...员持之以恒的付出。第六期的《AIGC体验派》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近...……更多
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...下火山引擎在深圳举办 AI 创新巡展,一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。在此之前,海内外不少现象级的同类模型产品相继发布,包括字节跳动相继发布的即梦、海绵音乐,和剪映(...……更多
Mac装上字节豆包 艾玛!一下变AI PC了
万万没想到,Mac变成AI PC,原来就差了一个豆包电脑版。例如想要在B站上学习科技新进展,现在的打开方式是这样的——在豆包电脑版里,用AI看视频:将近15分钟的视频,“啪的一下”,各种重点内容全部给你总结好了:当然...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...成写作类任务的时候,AI助手就会给我们分配擅长文案的豆包。遇到编程问题,就会召唤代码能力较强的DeepSeek。以逻辑推理为主的问题,可能会让智谱来应对。当然界面中所展示的任务分类比较具有概括性,实际运行过程中AI助...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...月评测总榜和子榜两项第一,AI智能体方向受瞩目 近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,Sense...……更多
腾讯元宝“上桌”,AI助手之争再起波澜
...的“AI问书”已经在用户群体中引发了热议。无论是抖音豆包、文心一言还是天工、Kimi,短时间内都很难追赶微信读书数百万正版图书的内容生态,这一高质量语料库,也将助力混元大模型深化专业知识能力。如今,全面接入微...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...性能表现。研究团队发现大多数模型在英语上的准确度比中文要高,这种差距在排名靠前的模型中尤为显著。推测可能有以下几个原因: 尽管这些模型包含了大量中文训练数据并且具有跨语言泛化能力,但它们的训练数据主要...……更多
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
...多了?这就是我们最近发现的一个学习、工作神器 ——豆包电脑版。有了它,机器之心编辑部读论文、学东西的效率蹭蹭往上提,关键它还免费,都不用找主编报销。 接下来,就来揭秘一下这款提效神器是怎么帮我们学习 AI ...……更多
年轻人的「AI自由」,是它给的
...,人类即将再痛失一大阵地!搜索方面,信息的准确性、真实性也至关重要,我们又用热点新闻进行测试。 只用在几秒钟,豆包就完成了新闻事件检索。总结里,热点事件的时间、地点、人物、亮点、原因等要素整理,非常详...……更多
大模型价格“卷”至新低,带来哪些影响?
...度全部跟进。大模型价格“卷”至新低5月15日,字节跳动豆包大模型率先发起降价攻势,宣布主流大模型在企业市场的定价为0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。这样折合下来,1元钱就能买到125万Tokens...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性成为了一个重要问题。此外,版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战,通过制定相关政策、法律和伦理准则来确保技术...……更多
科大讯飞、阿里云、腾讯打价格战,大模型厂商“卷”起来
...全面免费。5月15日,在火山引擎原动力大会上,字节跳动豆包大模型发布,火山引擎总裁谭待表示,豆包主力模型在企业市场的定价为0.0008元/千tokens,即0.8厘就能处理1500多个汉字。事实上,“卷”起来的不止国产大模型,国外...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...实验更高效、更便宜,即使它有炉灶那么大。)对大多数中文母语者而言,这个任务应该不难,相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断完整文字仍然需要十分复杂的推理过程:当代神经科学研究表明...……更多
一手体验电脑版豆包后,我删除了购物车里的AI PC
...意应用端都能方便快速地召唤AI助手?在这样的背景下,豆包电脑版应运而生。它突破了现有产品形态的困境,能够跨应用一键划词搜索,或是通过启动器随时唤醒,在桌面端提供跨应用的全方位AI能力。这意味着无论是在办公...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...两个主要产品,一个即已在国内运营的聊天机器人平台“豆包”,一个则是正在开发中的、计划通过火山引擎对外提供服务的机器人平台(bot platform)。如OpenAI一样,Seed项目的目标是最终建立通用人工智能,但真正的意图似乎是尽...……更多
腾讯回应大模型“价格战”:技术发展优先,对商业前景乐观
...注。5月15日,字节跳动在火山引擎原动力大会上正式发布豆包大模型,据介绍,豆包主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。这也引发外界对大模型“价格战”开启的猜测,...……更多
【聚焦2024中关村论坛】数据安全治理与发展论坛举行:发布7项实践成果
...产力、推动数字经济高质量发展提供有力保障。成果二:中文互联网语料库CCI 2.0北京智源人工智能研究院发布中文互联网语料库CCI 2.0,规模约500G,且为经过严格清洗过滤的中文数据集。CCI 2.0在1.0版本基础上,进一步扩充数据...……更多
《WILL: Follow The Light》Steam页面上线 支持中文
...快乐吧,所有操控都依照航海者的实际经历开发,在确保真实性的同时又做到了简单易上手,任何玩家都可以乐在其中。在寒冷恶劣的环境中航行对于生活在极北的人一直都很重要,而游戏主人公WILL——一个在海上长大的无畏...……更多
...何先发布局?得语料者,得天下?华策影视、每日互动、中文在线……今年3月,同花顺推出AI语料概念指数,从市场层面将“AI语料”推向台前。一众概念股中,或是明确表示拥有海量语料和数据集的上市公司,或是拥有海量IP...……更多
更多关于科技的资讯:
美国科技巨头“收割者”!国产DeepSeek干掉英伟达4.3万亿市值
快科技1月28日消息,临近春节,中国人工智能公司DeepSeek突然爆火,其发布的DeepSeek-R1大模型性能上比肩OpenAI o1
2025-01-28 09:06:00
英伟达回应股价遭DeepSeek暴击:DeepSeek是出色的AI进步
快科技1月28日消息,日前,美股收盘英伟达股价暴跌17%,市值一夜蒸发5888.62亿美元(约合人民币4.27万亿元)
2025-01-28 10:07:00
王晶监制电影《笑傲江湖》上线爱优腾:张雨绮版东方不败来了
快科技1月28日消息,今日,电影《笑傲江湖》在腾讯视频、爱奇艺、优酷三大平台上线,同时发布“春满江湖”版海报。海报中,东方不败(张雨绮饰)侧卧雪地
2025-01-28 10:07:00
7月11日上映!DC《超人》新预告发布:只身大战反派、怪兽
快科技1月28日消息,DC全新的《超人》发布了新版预告,展示了超人翱翔于冰原之上、只身大战怪兽的场景,卢瑟等反派人物也一一登场
2025-01-28 10:37:00
快来看哪个更牛!网友热捧DeepSeek创意写春联
快科技1月28日消息,据媒体综合报道,近日,随着新春佳节的临近,一股创意写春联的热潮正在网络上悄然兴起。而在这场创意盛宴中
2025-01-28 10:37:00
李子柒将首次亮相央视《春晚》:讲述服饰的非遗故事
快科技1月28日消息,据央视频官方透露,今晚李子柒将首次亮相央视《春晚》,并担任“春晚体验官”,讲述演出服饰上的非遗故事
2025-01-28 11:07:00
育碧再次大裁员!185名员工被裁 英国工作室永久关闭
据eurogamer报道,育碧近日宣布,将关闭位于英国莱明顿的工作室,并裁减公司185个职位。部分莱明顿工作的员工将通过远程合同继续留职
2025-01-28 11:07:00
全球罕见!中国这两座城市又有“雪窝子”了
快科技1月28日消息,据媒体报道,近日,山东半岛东北部的烟台和威海再次因其频繁的降雪而备受关注,被形象地称为“雪窝子”
2025-01-28 11:07:00
直角拐弯学废了:妈妈练完车回家过桥把女儿撞进水沟
快科技1月28日消息,今天,话题#妈妈练完车回家过桥把女儿撞进水沟#登上热搜。据报道,事发1月26日,一位年轻妈妈在练完车后驾车回家
2025-01-28 11:37:00
DeepSeek爆火 网友热议广东AI三杰
快科技1月28日消息,据媒体综合报道,近日,随着DeepSeek公司的崛起,其创始人梁文锋成为了公众瞩目的焦点。这位1985年出生于广东湛江的科技奇才
2025-01-28 11:37:00
斥资5个亿!迅雷将收购虎扑
快科技1月28日消息,据新浪科技报道,迅雷(XNET.US)已同意以5亿元人民币的总现金对价收购运营体育平台虎扑的上海匡慧网络科技有限公司
2025-01-28 12:07:00
最烧钱的国产单机!《影之刃:零》成本将达4亿 超《黑神话:悟空》
快科技1月28日消息,据媒体报道,国产动作游戏领域再添重磅消息。由北京灵游坊开发并发行的黑暗风格武侠动作游戏《影之刃:零》
2025-01-28 12:37:00
余承东自驾回老家被抢道 享界S9迅速反应减速避让
快科技1月28日消息,昨天上午,余承东开启了自己“自驾回安徽老家过年”的直播活动,其实是提前的录播,即便如此,其抖音直播间也被封禁
2025-01-28 13:37:00
DeepSeek用莫言风格写《蔚来换电记》 还真是那个味儿
快科技1月28日消息,近日,DeepSeek在全网范围内引发了热烈的关注与讨论,其火爆程度堪称现象级。就连蔚来汽车的创始人李斌也对其进行了亲自体验
2025-01-28 14:37:00
阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o
快科技1月28日消息,今天,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中
2025-01-28 15:07:00