query词权重, 搜索词权重计算|电子爱好者

admin管理员组
文章数量:1567522

query词权重（term weighting）是为了计算query分词后，每个term的重要程度。常用的指标是tf*idf（query中term的tf大部分为1），即一个term的出现次数越多，表明信息量越少，相反一个term的次数越少，表明信息量越多。但是term的重要程度并不是和term的出现次数呈严格单调关系，并且idf缺乏上下文语境的考虑（比如“windows”在“windows应用软件”中比较重要，而在“windows xp系统iphone xs导照片”的重要性就比较低）。词权重计算作为一种基础资源在文本相关性，丢词等任务中有着重要作用，其优化方法主要分为下面三类：

1）基于语料统计

2）基于点击日志

3）基于有监督学习

本文首先介绍一些基于语料统计的计算方法。

一、imp（importance的缩写）

idf的一个缺点是仅仅依靠词频比较，imp从在query中的重要性占比基础上，采用迭代的计算方式优化词的静态赋权，其计算过程如下：

其中BT为term的imp值，初始值可设为1，Tmp_i是query中的第i个term的重要性占比，N指所有包含第i个term的query数目。

二、DIMP（Dynamic imp）

idf和imp的一个共同缺点是其都是静态的赋权。DIMP根据query的上下文计算每个term的动态赋权，其主要假设是任意query中的词权重可以由相关query 的词权重来计算，计算过程可分为两部分：

1）自顶向下的query树构建

根据实际场景中采用不同的构建方法，这里介绍一种在搜索中的做法。如下图，给定query作为根节点，首先获取query的相关query作为第二层节点，在第二层的基础上，枚举相关query的子query作为第三层节点，最后一层为分词后的term节点。因此query树种的节点都是不同粒度的文本串，边都是文本串间的相关关系。在拍卖词推荐任务中，用户query都是比较短的关键词，其可以通过拍卖词间的共同购买关系构建对应的query树。

本文标签：权重搜索词 Query

版权声明：本文标题：query词权重, 搜索词权重计算内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1725535983a1028343.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

query词权重, 搜索词权重计算

更多相关文章

2019年微信号维护专业指南

上证50权重计算方法

高权重抖音账号注册技巧!

熵权法 变异系数法

抖音权重查询怎么做?抖音权重降低怎么办?

我是如何把一个网站搞砸的

【DB Query Analyzer(万能数据库查询分析器)】DB Query Analyzer(万能数据库查询分析器) V7.024官方版官方免费下载

神经网络算法介绍

BP神经网络算法原理

HTSQL is a comprehensive navigational query language for relational databases.

sqlalchemy (2013, ‘Lost connection to MySQL server during query

MYSQL5.7报2013-Lost connection to server during query

MySQL Error Code: 2013. Lost connection to MySQL server during query解决

解决MySQL导入数据报错2013 - Lost connection to MySQL server during query

ERROR 2013 (HY000): Lost connection to MySQL server during query(已解决)

Unexpected exception encountered during query.

MySQL报错：Lost connection to MySQL server during query

解决：2013, ‘Lost connection to MySQL server during query’ 问题

科普帖：什么是Query？关于数据库查询的解释

苹果cmsv10迅雷下载站模板高权重好看的影视源码

发表评论

推荐文章

xshell6无法卸载重装问题

win7共享xp打印机_别麻烦了！局域网一键共享工具

华擎 FM2A75 PRO4刷Bios历险

下载及安装虚拟机

WIN10下安装SQL SERVER 2017

热门文章

【Linux学习笔记16】磁盘的分区、格式化、检验与挂载(blkid、lsblk、UUID、parted查看分区的格式、lvm命令)

阿里云服务器到期后多久会释放

应用程序无法正常启动(0xc0000022)。请单击” 确定“关闭应用程序。

内存泄露,内存溢出和死锁

【病毒查杀】CAD杀毒方法

PhotoZoom Pro 9免解锁代码版下载 PhotoZoom v9.0.2 电脑版

安装VS2010遇到的问题

iOS手机模拟器配置

免费安装office流程（官方自动批量激活）

linux桌面无法启动,Ubuntu18.04启动后无法进入桌面修复方法（图文）

最新文章

计算机输入用户名但是进去黑屏,win7输入账号密码后无法进入系统直接黑屏咋办...

VMware虚拟机启动ubuntu后出现黑屏，不能显示界面，鼠标键盘都不管用

遇到Parallels Desktop 开机windows黑屏的解决办法

w ndows10启动黑屏,windows10系统启动安全模式后出现黑屏如何解决

机械师星辰15电脑开机一直黑屏怎么重装电脑系统？

VMware虚拟机开机黑屏问题

Linux 安装 Nvidia 驱动出现的黑屏无法开机解决方式

启动Mac电脑为什么出现黑屏？

Vmware虚拟机在win10（1903版本后）启动就会黑屏的解决办法

Ubuntu18.04及以上 安装3070ti显卡驱动 超简易方法！黑屏无法进入桌面解决方法以及联想拯救者电脑特殊设置

Win10 拖动文件从文件夹里复制到桌面时出现黑屏资源管理器重启复制失败

为什么曙光服务器不显示画面,电脑开机后显示器不显示画面,但是显示器灯是亮的,这是为什么?...

w7进入后桌面黑屏并且在命令行中explorer也没反应

Macbook Pro开机输入密码后，走进度条时屏幕会黑一下然后才进入桌面

Hyper-V 启动黑屏的解决办法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

熵权法变异系数法

Ubuntu18.04及以上安装3070ti显卡驱动超简易方法！黑屏无法进入桌面解决方法以及联想拯救者电脑特殊设置

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载