ewAU_zenRRan的个人主页_电子工程师 - 电子技术论坛

ewAU_zenRRan

经验：积分：10

查看完整档案 >>

+关注发私信

他的动态

发布了文章 2022-9-20 15:25

如何统一各种信息抽取任务的输入和输出

信息抽取任务包括命名实体识别（NER）、关系抽取（RE）、事件抽取（EE）等各种各样的任务。...

0

1164次阅读

0条评论
发布了文章 2022-9-20 15:18

深度学习与经典统计学的差异

深度学习和简单的统计学是一回事吗？很多人可能都有这个疑问，毕竟二者连术语都有很多相似的地方。在这篇文章中，理论计算机科学家、哈佛大学知名教授 Boaz Barak 详细比较了深度学习与经典统计学的差异，认为“如果纯粹从统计学角度认识深度学习...

0

1026次阅读

0条评论
发布了文章 2022-9-20 14:30

视觉语言导航领域任务、方法和未来方向的综述

视觉语言导航（VLN）是一个新兴的研究领域，旨在构建一种可以用自然语言与人类交流并在真实的3D环境中导航的具身代理，与计算机视觉、自然语言处理和机器人等研究领域紧密关联。...

0

3668次阅读

0条评论
发布了文章 2022-9-20 12:04

一种简单而有效的转换方法来降低预测情感标签的难度

面向目标的多模态情感分类（TMSC）是方面级情感分析的一个新的子任务，旨在预测一对句子和图片中提到的意见目标的情感极性。...

0

1005次阅读

0条评论
发布了文章 2022-9-19 11:18

基于谷歌中长尾item或user预测效果的迁移学习框架

文中提出的迁移学习框架主要包括model-level transfer和item-level transfer。其中model-level transfer通过学习一个多样本模型和一个少样本模型，并学习一个二者参数的映射函数，实现模型参数上...

0

1103次阅读

0条评论
发布了文章 2022-9-19 11:14

预训练模型在搜索中使用的思路和方案

当然了，和往常的文章一样，我不会复述这一篇文章，而是聊聊里面的一些关键点和一些有意思的内容，拿出来和大家讨论一下。...

0

1036次阅读

0条评论
发布了文章 2022-9-19 09:19

自然语言处理（NLP）领域的高效方法

训练越来越大的深度学习模型已经成为过去十年的一个新兴趋势。如下图所示，模型参数量的不断增加让神经网络的性能越来越好，也产生了一些新的研究方向，但模型的问题也越来越多。...

0

1317次阅读

0条评论
发布了文章 2022-9-15 14:54

几种常用的NLP数据增强方法

因为直接对原是文本进行数据增强，很难保证维持原始的文本语义，因此可以通过在语义空间上进行隐式数据增强，简单列出几种方法：...

0

1647次阅读

0条评论
发布了文章 2022-9-14 11:16

深度解析YOLOv7的网络结构

最近，Scaled-YOLOv4的作者（也是后来的YOLOR的作者）和YOLOv4的作者AB大佬再次联手推出了YOLOv7，目前来看，这一版的YOLOv7是一个比较正统的YOLO续作，毕竟有AB大佬在，得到了过YOLO原作的认可。...

0

7326次阅读

0条评论
发布了文章 2022-9-9 17:11

为什么深度学习模型经常出现预测概率和真实情况差异大的问题？

文中对比了简单模型LeNet和现代模型ResNet的校准情况，LeNet的输出结果校准性很好，而ResNet则出现了比较严重的过自信问题（over-confidence），即模型输出的置信度很高，但实际的准确率并没有那么高。...

0

6982次阅读

0条评论
发布了文章 2022-6-10 10:58

事件模式归纳的历史以及相关概念

一个典型的原子事件类型归纳的研究是Nathanael Chambers和Dan Jurafsky在2013年发表的一篇关于如何在没有预设模板的情况下进行基于模板的事件模式归纳的方法[1]。这篇文章的开创性部分在于文章着重于在无监督的情况下学...

0

1573次阅读

0条评论
发布了文章 2022-6-9 11:19

几种基于深度学习的中文纠错模型

Confusionset-guided Pointer Network看起来跟之前提及的CopyNet思路很接近文本生成系列之文本编辑，同时考虑到copy原文跟生成新字两种可能性，相对于之前的seq2seq模型的改进主要是引入混淆集来控制可...

0

5838次阅读

0条评论
发布了文章 2022-6-7 09:57

微调前给预训练模型参数增加噪音提高效果的方法

为了减轻上述问题，提出了NoisyTune方法，即，在finetune前加入给预训练模型的参数增加少量噪音，给原始模型增加一些扰动，从而提高预训练语言模型在下游任务的效果，如下图所示，...

0

2364次阅读

0条评论
发布了文章 2022-6-7 09:54

一种缓解负采样偏差的对比学习句表示框架DCLR

近年来，预训练语言模型在各种 NLP 任务上取得了令人瞩目的表现。然而，一些研究发现，由预训练模型得出的原始句表示相似度都很高，在向量空间中并不是均匀分布的，而是构成了一个狭窄的锥体，这在很大程度上限制了句表示的表达能力。...

0

1772次阅读

0条评论
发布了文章 2022-6-7 09:48

SemEval 2022: 多语种惯用语识别评测冠军系统简介

提交的系统使用XLM-RoBERTa作为编码器，在预处理过程中对训练数据的惯用语短语（MWE）进行特殊标记，在训练过程中使用R-Drop作为辅助训练目标...

0

1107次阅读

0条评论