• 我的订阅
  • 头条热搜
大语言模型如何宣告心理学的死亡?
...的是月亮本身,而不是指向它的手指。同样,LLM训练用的语料库就像是指向更深层次知识的手指,研究者的目标是了解LLM是否能够把握那些更为深远的含义,即“月亮”。对于人类来说,理解和应对现实世界的任务涉及到他们心...……更多
...发展,该公司的数据许可业务将继续增长。“Reddit的信息语料库对于大型语言模型的训练非常重要,”她说,并补充说,随着人工智能生成的内容变得普遍,该网站19年来有组织和有节制的内容将变得更有价值。 ……更多
“2024语料风云榜”发布,10家企业上榜!
...海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数...……更多
人工智能与传统彩灯碰撞出“AI年兽”
...。我们在百度智能云客悦智能对话平台的基础上,开展了语料库训练、年兽人设定制、交互界面开发、灯组联调测试等一系列工作,最终保障了灯会开园时AI交互功能的正式上线投用。”百度智能云高级产品运营经理吕岳鹏介绍...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数...……更多
研究人员在电子邮件中使用ascii艺术
...邮件中写道,ArtPrompt暴露出的问题是,LLM被训练为假定\"语料库\"(意指书面文本的集合)应该\"纯粹从词义或语义的角度进行解释\"。然而,对语料库的解释有可能超越语义学的范畴。ArtPrompt要求LLMs完成两项任务,即识别ASCII艺...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...训练和后训练的数据。Meta 在大约 15 万亿的多语言 Token 语料库上对 Llama 3 进行了预训练,相比之下,Llama 2 只使用了 1.8 万亿 Token。此次训练的模型规模远大于以前的 Llama 模型:旗舰语言模型使用了 3.8 × 10²⁵ 次浮点运算(FLOPs...……更多
...2023年度中国媒体十大新词语”是基于国家语言资源监测语料库,利用语言信息处理技术,结合后期人工确认获得的。语料来源于2023年1月1日至11月30日的10份主流报纸的文章、20家电台和电视台的节目、4家门户网站的新闻,数据...……更多
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...用户-任务组合,LLM进一步生成了五个需要全面理解整个语料库才能回答的问题。通过这种方式,每个数据集最终产生了125个多样化的问题(5个用户 × 5个任务 × 5个问题),从而全面评估模型在处理各种查询时的能力。实现和评...……更多
...,依托国家权威机构,汇聚多模态制造业数据,构建行业语料库,降低预训练门槛,提升大模型的准确性和稳定性。促进制造业数据高效流通,加快数据交易市场建设,培育一批面向制造业大模型的服务商和交易所,有效盘活制...……更多
...校在厕所等隐蔽地点安装智能语音警报装置,通过与预置语料库相比对,装置能有效识别声音中的谩骂、殴打等信息,并向老师发出预警。该产品在实际运用中还可以连接警方或教育主管部门。一时间,不少网友将此装置奉为“...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...了重大突破。它采用了更先进的预训练技术,通过大规模语料库的学习,使得模型在理解和生成文本的能力上达到了新的高度。此外,Qwen2.5还特别注重多语言支持和跨文化适应性,这使得它在全球化应用方面具有独特的优势。 ...……更多
2023内容科技应用典型案例:人民日报创作大脑AI+发布
...、促进生成式人工智能在媒体行业的安全应用的主流价值语料库建设,展现出其助力用主流价值导向驾驭算法的能力与潜力。(天津大学新媒体与传播学院院长陆小华) ……更多
“AI是我们的好朋友!” 南威软件构建“数据+AI”新引擎
...理的检索模式,通过智能体对话式引导,并结合行业知识语料库,引导用户办事,简化流程,为用户提供即问即答、即问即办的‘一站式’政策服务。”南威软件集团人工智能与数据服务业务群总裁唐鹏飞介绍基于南威白泽大模...……更多
用AI识别AI:西湖大学一项研究可高效检测AI生成文本
...器则更倾向于选择有更高模型概率的词汇,因为在大规模语料库上预训练的AI模型反映的是人类的集体写作行为,而非个体行为。” 鲍光胜解释,“具体而言,两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有...……更多
马斯克旗下人工智能大模型Grok已正式开源
...服务访问。然而,Grok 的开源并不包括其训练数据的完整语料库,也不提供对 X 上可用的实时信息的访问。用户仍然需要订阅 X 的付费版本。Grok 被定位为 OpenAI 的 ChatGPT 和其他领先的谷歌AI的竞争对手。它以意为理解的俚语命名...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...情绪识别。“语音频谱图的语音数据集选自CASIA汉语情感语料库,它是由中国科学院自动化所录制,包括四个专业发音人,生气、高兴、害怕、悲伤、惊讶和中性等六种情绪,共4800句不同发音。”团队成员彭华东介绍。如此,“...……更多
AI展演让新科技“触手可及”
...。广西与东盟国家山水相连、人文相通,有着丰富的东盟语料库数据,这对于相关产品的研发很有助益。”杨晓东举例道。现场观看《白泽的奇幻旅程》。人民网 雷琦竣摄据介绍,“梦幻灵境”AI展演中心是人民网与广西旅游发...……更多
2023内容科技应用典型案例:“人民审校”智能涉政审校系统
...准定位信息中存在的风险问题。文本智能审校:持续丰富语料库资源,构建涉政信息垂直领域知识图谱,强化自然语言处理,深度赋能智能算法学习升级迭代,助力一键文本审校更加精准化、迅捷化、专业化。图片智能审校:综...……更多
...开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反映了人类的性别、伦理和道德偏见。伦敦大学学院信息学系博士生奥利维娅·麦克米伦-斯科特问道:“它们是否也反映了人类在推理测试中的认知偏差?”她...……更多
“什么值得买”助力提升海螺AI消费决策体验:输出垂类能力,建设融合生态
...和沉淀,有海量的商品数据、用户评价、购买指南等优质语料库,还有自主研发消费大模型的实战经验,这些正好能和我们实现优势互补,创造更好的用户体验,实现更大的商业化价值。”王云峰表示,“很荣幸这次成为MiniMax...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...调和对齐(alignment)。预训练预训练通常需要极其庞大的语料库,使模型了解语言的一般结构。Llama 3.1、GPT-4这种通用LLM,一般需要互联网规模的数据。而特定领域的LLM(如几何学、放射学、电信行业等)则需要注入相关的领域...……更多
...力,重新定义内容基础设施。人民网积极建设“主流价值语料库”,大幅提高大模型安全性。生成式人工智能全方位赋能内容创作、风控、分发、运营平台升级,推动内容产业发展形成新质生产力。生成式人工智能赋能内容创作...……更多
APUS成为深圳市人工智能行业协会理事单位,CEO李涛受聘专家
...PUS大模型坚持积累面向中国市场的、价值观正向的“红色语料库”,以打造符合中国需求与价值观准确的AI大模型,创造可用、可靠的新AI生产力,体现了行业高度和专业素养。经协会研讨决定,聘用李涛为协会专家委员会专家...……更多
...方面,AIGC的研发和应用需要基于海量优质的数据资源和语料库,而这正是值得买科技的优势,来自过去数年的积累。在此次战略发布会上,“1个大模型、2个数据库、3个引擎、4类应用”组成的值得买科技AI产品矩阵,首次整体...……更多
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
...提高模型的安全性和可靠性。这两个模型都在多语言基础语料库上训练,并针对德语、法语和西班牙语进行了文化和语言优化,能提供简明扼要、长度可控的回答。该公司在官网上发布了模型在AlpacaEval(由来自斯坦福的团队开...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...-STaR的具体性能,研究使用了可用的最佳开放语言模型Lean语料库 (InternLM2-Math-base-7b) 上进行预训练,并遵循Lean的Mathlib作为底层训练集的标准实践。首先以LeanDojo Benchmark 4 v9作为监督微调(SFT)数据集,包含超过23.1万个示……更多
...社长卢先和,清华大学出版社基础教育分社社长陈明以及语料库专家、本书编委贾云龙等与会。曾庆锴表示,中国日报社在英语教育领域有深厚积淀,多年来通过学术会议、教育培训、特色活动、专题企划等实践形式,始终致力...……更多
微软Win11中发现国产开源大模型!RWKV官方:没给钱啊?现在赶趟
...RNN的推理效率特征。同时,新架构引入了一个新的多语言语料库,包含1.12万亿个token。团队还基于贪婪匹配(greedy matching)开发了一种快速的分词器,以增强RWKV的多语言性。参考链接:[1]https://x.com/RWKV_AI/status/1831000938120……更多
...话,多重AI技术互补,大模型与小模型搭配,专业知识和语料为支撑。这套打法说起来容易,但做起来一点儿也不简单,这需要对产业有极深的理解和实践,对技术有极高的储备。以服务某金融机构的精细化运营场景为例,精细...……更多
更多关于科技的资讯:
宁波市消保委发布“大路灯”比较试验结果:“适璞”落地灯电气安全项目不符合要求
中国消费者报杭州讯(记者郑铁峰)“最接近日光的照明体验”“让孩子的用眼环境更加舒适”……近年来,作为新兴的护眼灯具产品
2025-02-18 11:13:00
昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局
2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1
2025-02-18 11:13:00
橘子冒烟小心肺部真菌感染:大量孢子形成烟雾
快科技2月18日消息,按压橘子冒烟是咋回事?据报道,这通常是因为霉菌繁殖产生的孢子扩散。霉菌成熟后会产生大量孢子,当微小的孢子在空气中扩散时
2025-02-18 11:25:00
路遇限宽墩司机不敢开:打开智驾寻求最强外援
快科技2月18日消息,日常生活中我们开车时可能会遇到限宽墩,每当这个时候,不少新手司机都觉得眼前一黑,不敢通过。而当前新能源汽车越发加宽
2025-02-18 11:25:00
“两新”政策赋能,太原电子产品市场“热”力全开
消费日报网讯(记者 刘自昌)2025年,作为 “十四五” 规划收官与 “十五五” 规划谋划的承上启下之年,意义非凡。在这一关键节点
2025-02-18 11:32:00
30家轻工企业入选工信部实数融合典型案例
本报讯 近日,工业和信息化部公布了2024年实数融合典型案例名单,235个案例上榜。轻工行业“成绩单”亮眼,共有30家企业榜上有名
2025-02-18 11:32:00
漫评丨这些机器人企业“代言”苏州新质生产力
□秦柳青在今年总台央视春晚上,人形机器人的“赛博秧歌”实力出圈了。在苏州,人形机器人不仅能“炒菜浇花”,还能“进厂打工”
2025-02-18 11:36:00
联通数科墨攻安全运营服务平台,护航亚冬安全,彰显卓越实力
2025年2月7-14日,第九届亚洲冬季运动会在哈尔滨隆重举办,这场冰雪盛会吸引了全球目光。作为本届亚冬会的官方通信及云服务合作伙伴
2025-02-18 11:45:00
小米青年公寓内部实拍首曝!减轻北漂毕业生租房贵压力
快科技2月18日消息,日前,小米市场部管培生赵长琳(抖音、小红书昵称“二赵上道”)全网首发分享了位于北京昌平的小米青年公寓内部实拍视频
2025-02-18 11:55:00
本田:若日产社长辞职 我们愿意重启合并谈判
快科技2月18日消息,据知情人士透露,如果日产汽车公司社长内田诚卸任,本田愿意重启收购谈判,以创建世界第四大汽车生产商
2025-02-18 11:55:00
深圳70名AI公务员上岗引热议 AI能取代公务员吗:DeepSeek是这么回答的
快科技2月28日消息,日前,#深圳70名AI公务员上岗# 的话题登上热搜,引发网友关注。据报道,近日,广东深圳福田区推出了基于DeepSeek开发的AI数智员工
2025-02-18 11:55:00
两女子骑电动车走机动车道并闯红灯:被撞翻还需负全责
快科技2月18日消息,行人闯红灯被车撞,该怎么判罚?也许这个案例可以全国推广。据“公安部交通管理局”最新披露的案例显示
2025-02-18 11:55:00
全社会都能共享数据!国家公共数据资源登记平台将于3月上线
快科技2月18日消息,据央视报道,今天,国家数据局举行新闻发布会,介绍公共数据开发利用最新情况。相关负责人介绍,国家公共数据资源登记平台将于3月1日上线试运行
2025-02-18 11:55:00
SSD直奔PB时代!闪迪已在路线图中列出
快科技2月18日消息,在近日的投资者日活动上,闪迪宣布了其开发容量高达PB级固态硬盘的计划,不过遗憾的是路线图中并未公布具体的时间
2025-02-18 11:55:00
学而思今天正式发布接入DeepSeek的全新“随时问”APP
学而思今天正式发布接入DeepSeek的全新“随时问”APP。该产品深度融合DeepSeek R1智能推理,依托学而思22年教研沉淀
2025-02-18 12:01:00