论文辅助笔记:t2vec 模型部分

编程入门 行业动态 更新时间:2024-10-10 21:29:39

论文辅助笔记:t2vec <a href=https://www.elefans.com/category/jswz/34/1771358.html style=模型部分"/>

论文辅助笔记:t2vec 模型部分

1 t2vec.py 函数

命令行参数

data训练、测试数据路径
checkpoint保存的检查点路径
prefixtrjfile的前缀
pretrained_embedding预训练的词(或称为单元)嵌入的路径 。默认值是None
num_layersRNN单元中的层数。默认值是3
bidirectional在编码器中是否使用双向rnn。默认值是True
hidden_sizeRNN单元中的隐藏状态大小。默认值是256。
embedding_size词(或称为单元)嵌入的大小。默认值是256。
dropoutdropout的概率。默认值是0.2
max_grad_norm最大梯度范数。默认值是5.0。
learning_rate学习率。默认值是0.001
batch批处理大小。默认值是128
generator_batch每次生成的最大词数。数值越高,需要的内存越多。默认值是32。
t2vec_batch每次在t2vec中编码的最大轨迹数。默认值是256。
start_iteration开始的迭代次数。默认值是0。
epochs训练的周期数。默认值是15。
print_freq打印频率。默认值是50。
save_freq:保存频率。默认值是1000。
cuda是否使用GPU来训练模型。默认值是True
use_discriminative如果给定此参数,将使用判别损失。
discriminative_w判别损失的权重。默认值是0.1
criterion_name使用的损失函数名称。可以是NLL(负对数似然)或KLDIV(KL 散度)。默认值是NLL
knearestvocabsKLDIVLoss中使用的k最近的单元和距离的文件,由预处理生成,如果使用KLDIVLoss则必需。
dist_decay_speed在dist2weight中距离衰减的速度。数值越小,远离的单元的权重越高。默认值是0.8。
max_num_line默认值是20000000
max_length目标序列的最大长度。默认值是200
mode运行模式(0: 训练,1:评估,2:t2vec)。默认值是0
vocab_size词汇表大小。默认值是0
bucketsize

训练时的桶大小。默认值是一系列的元组

  • 桶是一种策略,用于在序列长度可变的情况下处理数据。
  • 例如,假设我们有不同长度的句子,我们可能不希望为每个句子单独创建一个批处理,因为这会非常低效。
  • 桶策略是将句子放入一个接近它们长度的桶中,以尽量减少填充。 

2 train t2vec

几个注意事项:

numpy 版本不能过高 1.23以下

原github给的vocab_size有点问题,调整到20000就好了

更多推荐

论文辅助笔记:t2vec 模型部分

本文发布于:2023-11-16 19:03:42,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1631230.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:模型   笔记   论文   t2vec

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!