您的当前位置：首页 > 资讯 > 正文

大语言模型中的涌现现象是不是伪科学？环球热消息

2023-04-22 13:47:14 来源：程序员客栈

Datawhale干货

作者：平凡@知乎，诺桑比亚大学，在读博士

今天晚上，花了一点儿时间看了两篇文章：

(资料图片)

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

这两篇讲的都是emergent behavior，即涌现现象。

大规模神经网络下的涌现现象

在机器学习中使用大规模神经网络时，由于增加了参数数量、训练数据或训练步骤等因素，出现了定性上的新能力和性质，这些能力和性质在小规模神经网络中往往是不存在的。

第一篇文章举了这个例子，每个图都可以理解为一个任务，横轴是神经网络的规模，而纵轴是准确率，可以理解为模型的性能。

我们拿图一来看，在10的22次方前，这些模型基本上的性能基本上都很稳定在0附近，而在10的22以后，突然在10的24次方上获得了很大的性能提升，在其他的几个任务上都表现出类似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的评论引用在这里：

作者发现，当我们训练用网络计算同余加法 a+b = ? (mod c) 时，网络在某个时间突然获得了 100% 准确率。分析发现，神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法！这个算法可以证明是正确的，反人类直觉的。

从这俩例子里面我的感受是，只要数据量足够且真实，且模型没有硬错误的前提下，不断的训练说不定真的能够产生一些意想不到的效果。

还有就是我觉得人类现在积累的知识并不少，但是系统的少，零星的多，如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话，我觉得有很大概率会让它涌现出意想不到的能力。

甚至可能把人类的生产力解放提前很多。

参考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

标签：

大语言模型中的涌现现象是不是伪科学？环球热消息

Datawhale干货作者：平凡@知乎，诺桑比亚大学，在读博士今天晚上，花了一点儿时间看了两篇文章：《Emergent

今日热议：胡琏

1、胡琏（1907年-1977年），原名从禄，又名俊儒，字伯玉，陕西华州（今陕西华县）人，黄埔军校第四期毕业生

XBB.1.16未在我国形成传播优势_世界动态

XBB 1 16未在我国形成传播优势

鲭鱼的营养价值及功效_鲭鱼

1、鲭zheng第一声。2、铕you第三声。本文到此分享完毕，希望对你有所帮助。

预见2023：《2023年中国集装箱运输行业全景图谱》(附市场现状、竞争格局和发展趋势等)

根据现行国家标准《集装箱运输术语》(GB T17271-1998)，集装箱运输(containertransport)是指以集装箱为单元

115家上市药企发布2020年年报四家研发投入比例超50%

两公募净赚超20亿尾佣超200亿元

2021成都双遗马拉松拟决定于4月24日举行

一季度A股市场企业IPO过会率为88% 创业板最“吃香”

爆发！清明三天小长假电影市场总票房超7亿

国际油价凌晨跳水跌幅超6% 重回技术性盘整区间

“南大碎尸案”家属撤诉没等到南大任何回应

古井贡“年份原浆”被质疑黄鹤楼酒业基酒产量是多少

沈海高速盐城段交通事故双向交通已基本恢复

累计亏损79亿微医要如何说服资本市场为其买单

清明小长假宝泉景区踏青赏花掀起春日踏青热潮

郑州新款共享单车投放试运营超区停放扣费

车险综改半年保费降幅超30%的保单占比达到64%

《动物防疫法》即将施行遛狗不拴绳现象减少

怪兽上市、搜电融资共享充电资本竞逐火药味十足

第十四届运动会羽毛球项目资格赛将在郑举行

业绩三连降周黑鸭营收净利润均被煌上煌反超

第39届洛阳牡丹文化节截止到5月10日结束

中芯国际净利转正“摘U” 多只“带U”股减亏

国有六大行全年新增不良贷款近2082亿不良率集体提升

第十四届郑开马拉松赛参赛总人数45000人

中金公司回A后首份年报发布净利润同比增长70.04%

游客私挖笋遭村民索赔一根1万？咋回事呢？

中信建投营收净利增速居前十券商之首

泰山回应酒店价高游客厕所过夜杜绝价格欺诈

清明全国预计发送旅客超1.4亿人次有你吗？

地产销售增长放缓景瑞控股频发高息债负债率达83.46%

规模缩水450亿元！权益类ETF一季度险守8千亿关口

广东一村民被红火蚁咬后休克其攻击性极强

主动降价争取市场联动科技撤回材料才一周就重启IPO

重庆女子12楼高空抛物获刑半年长点心吧！

“价值派”基金经理走“红” 33只指数基金收益率超10%

首次大批量！广州一区招50名博士当中小学教师

五大龙头券商座次初定 “百亿阵营”券商净利润加总占比37%

父亲坟被推被要求证明此处确实有坟啥情况？

人均亏损1.2万元！ A股一季度领跌全球

单针和双针新冠疫苗怎么选？权威解答来了

行业“马太效应”逐渐凸显一线白酒转战并布局数字化

痛心！山东一充气城堡被吹翻两三岁女童身亡

ST百花变身ST百花退市新规下还有哪些个股存在“ST”预期

增收不增利慧择保险年报发布后股价下跌两成

父女俩攀爬伏羲雕像被困获救后被批评教育

业绩符合预期 TCL科技中环股份混改初显成效

永安财险大同中支涉嫌不正当竞争被银保监会处罚

保姆擅自将去世老人火化法院判其赔偿1万元

中融基金旗下46只主动权益基金春节后全亏损

女子购买南航快乐飞后遇14次航变啥情况？

新华保险全年净利润微降1.8% 续期保费占比降至70.82%

一季度全国64名民警辅警牺牲最小的仅23岁

控股股东94.59%股份质押开元教育两大“内伤”浮现

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品，均转载自其它媒体，转载目的在于传递更多的信息，并不代表本网赞同其观点和对其真实性负责。亚洲品牌网倡导尊重与保护知识产权，如发现本站文章存在内容、版权或其它问题，烦请联系。联系方式：8 86 239 5@qq.com，我们将及时沟通与处理。

大语言模型中的涌现现象是不是伪科学？ 环球热消息

推荐阅读

猜您喜欢

资讯更多>

热点

动态

子站

大语言模型中的涌现现象是不是伪科学？环球热消息