完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
解锁我理解的是基于深度学习,需要训练各种数据知识最后生成自己的的语言理解和能力的交互模型。 基础技术词表示技术词表示一般分为三种,主要是词的独热表示(One-hot),词的分布式表示,基于预训练的词嵌入表示。 分词技术(Tokenization)Word粒度:我/贼/喜欢/看/大语言模型 这里有个专有名词OOV:模型无法处理未在词表中的词 其中效果最好的就是sunword粒度,可以处理以上问题,具有灵活性,允许学习词缀关系 经典结构transformer:由Encoder和Decoder组成,这个太厉害了,有效避免卷积神经网络中的梯度消失与梯度爆炸。 开篇的感觉主要是学好数学,书山有路勤为径,学海无涯苦作舟! |
|
相关推荐
|
|
你正在撰写答案
如果你是对答案或其他答案精选点评或询问,请使用“评论”功能。
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片CPU
928 浏览 0 评论
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览
770 浏览 0 评论
41054 浏览 1 评论
【RISC-V开放架构设计之道|阅读体验】+ 个人心得并祝福
2255 浏览 1 评论
10188 浏览 6 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-22 09:24 , Processed in 0.578953 second(s), Total 90, Slave 75 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号