admin管理员组

文章数量:1650766

这里介绍tensorflow中几种常见的特征处理方式,也是tensorflow中封装好的库函数。
主要来源于tf.feature_column.*

1.tf.feature_column.categorical_column_with_hash_bucket

tf.feature_column.categorical_column_with_hash_bucket(
    key,
    hash_bucket_size,
    dtype=tf.dtypes.string
)

输入特征为稀疏特征,一般为字符串数据或者整型数据,将输入稀疏特征转换为有限个桶,计算公式为

output_id = Hash(input_feature_string) % bucket_size

要求input_feature_string为字符型,如果输入的稀疏特征是整型的,需要先转换为字符型才能使用上面的映射公式。
对于字典型的features,如果features[key]要么是Tensor,要么是 SparseTensor,但是如果是Tensor 的话,缺失值可以被表示为为-1的整型以及‘ ’的字符型,这种情况下,相应的特征值将会被舍弃掉。

2.tf.feature_column.c

本文标签: 中对特征方式tensorflowTF