重生之AI教父

CloseAI

首页 >> 重生之AI教父 >> 重生之AI教父最新章节(目录)
大家在看我在精神病院学斩神 官道:从殡仪馆平步青云 重返84:从收破烂开始致富 四合院:开局嫂子秦淮茹 那年花开1981 四合院之魏武光辉 四合院一品良民赵大海 四合院:从1958开始 四合院:开局62年,十级技术员 我是大玩家 
重生之AI教父 CloseAI - 重生之AI教父全文阅读 - 重生之AI教父txt下载 - 重生之AI教父最新章节 - 好看的都市小说

第207章 Attention is all you need

上一页书 页下一章阅读记录

“你是说文字的长期依赖问题?”伊利亚微微皱眉,捕捉到了重点:“不过长期依赖问题,已经相当程度上被循环网络的进化版本,长短期记忆方法又或者是各种门控制给解决了。”

“说是解决了,但实际上是减轻了,终究还是治标不治本,只是把症状压了下去。”

“那怎么办?难道干脆就不要了?”伊利亚没想那么多,随口问道。

问完却发现,孟繁岐正在似笑非笑地看着他。

“你是认真的?”伊利亚此前是被思维的惯性局限住了,根本没有想到注意力机制这样一个配菜,能干脆成为主餐,取代原本常用的网络结构。

现在孟繁岐已经暗示了他的想法,伊利亚自然也就开始认真地考虑这种操作的可行性。

“原本最常见的循环网络和卷积网络互有利弊,如果长度为n,前向的复杂度是O(n)级别,卷积是O(1)级别。但是卷积的每层复杂度要再根据卷积核的大小增加开销。”

“倘若用注意力机制去做,前向的复杂度是O(1),每层的复杂度则从O(nd^2)变为O(n^2d)。关键是,它可以并行了!”

分析复杂度分析到一半,伊利亚眼睛一亮,发现了重点。复杂度只是小事情,能够轻松并行才是最关键的地方。

传统的长短期和循环网络,可以处理时间序列信息,但总是需要根据之前的信息来推测当前的信息,依赖前置位的信息,因而无法并行。

简单点说,就是能并行的模型学不到长距离语言之间的联系,能学到的又没法并行。无法并行,用现在的设备自然就很难把语言模型做大。

“可目前最强力的模型都是带门控制,编码器加解码器的循环网络和卷积网络...难道我们真的一点旧有的技术都不使用吗?”

旁边有旁听的同事越听越觉得不靠谱了,这一步子跨得也有点太大了,咔,容易扯着蛋。

“它可以无视语言中,两个词之间的距离为它们单独建立相关性关系,单独这一点,就足以成为我们尝试的理由了。你们翻译任务当中,长句不也是相当令人头疼的问题吗?”

句子一长,就容易出岔子,加上目前的模型还喜欢持续累加各个词的信息。

机器看到中间,早就忘记前面是什么内容了。

“我是谁?我在哪?我在干吗?”

喜欢重生之AI教父请大家收藏:(m.qbxsw.com)重生之AI教父全本小说网更新速度全网最快。

上一页目 录下一章存书签
站内强推大奉打更人 十日终焉 剑来 灯花笑 惊悚乐园 我在精神病院学斩神 凡人修仙传 疯批小师叔她五行缺德 我不是戏神 大明国师 我在修仙界万古长青 万古第一废材 终极一家之夏渡 万相之王 谍影:命令与征服 玩家请上车 穿书七零,冷面军少轻点宠 分家囤粮盖大房,恶毒爷奶悔断肠 特工:开局郑耀先和我接头 奥特科学家:我有火力不足恐惧症 
经典收藏我在精神病院学斩神 官场:分手后,我转身考上省组部 官道:从殡仪馆平步青云 透视仙王在都市 重返84:从收破烂开始致富 娱乐:我怎么就上恋综了 重生:我爸是煤老板 兽娘纪元:穿越成SSS级御兽师 院士重生:回到1975当知青 打赏主播,10倍提现当首富 港片:穿越洪兴,你让我做善事? 反派:截胡师姐后,主角崩溃了 重生香江之最强大亨 你一个交警,抢刑侦的案子合适吗 重返1987 重生都市修真 美食:随机摆摊,顾客追我十条街 逍遥农场 都市:我开局成了富二代反派 赌石之财色无双 
最近更新风月古韵 我的系统竟然是九天玄女 抗战:我觉醒杀星系统 凡逆:仙武同修 十二狱 祖血 知道走了宝,不知我是感应异能王 万维守护 异世界哥哥 一眼睁开,神仙师父找上我 老板娘的终极目标 蓝星第一霸 寻宝全世界从成为亿万富豪开始 叶尘之逆袭平行界 75岁,来了个恋爱系统 非凡战驴 疯了吧,这个人形凶兽是警员? 渔民:从打捞间谍装置开始 只要游戏里不死,现实中终将永生 战神赘婿:黄海平 
重生之AI教父 CloseAI - 重生之AI教父txt下载 - 重生之AI教父最新章节 - 重生之AI教父全文阅读 - 好看的都市小说