分词之正向最大匹配法

编程入门 行业动态 更新时间:2024-10-13 20:16:01

<a href=https://www.elefans.com/category/jswz/34/1763864.html style=分词之正向最大匹配法"/>

分词之正向最大匹配法

完整资料和代码获取地址github:zlhcsm

知识普及-正向最大匹配法:
对于输入的一段文本从左至右、以贪心的方式切分出当前位置上长度最大的词。
正向最大匹配算法是基于词典的分词方法,其分词原理是:单词的颗粒度越大,所能表示的含义越确切。

步骤

1,一般从一个字符串的开始位置,选择一个最大长度的词长的片段,如果序列不足最大词长,则选择全部序列。
2,首先看该片段是否在词典中,如果是,则算为一个分出来的词,如果不是,则从右边开始,减少一个字符,然后看短一点的这个片段是否在词典中,一次循环,直到只剩下一个字。
3,序列变为第2步骤截取分词后,剩下的部分序列

核心代码

1.读取字典文件

def init():"""读取字典文件载入词典:return:"""with open("../dic/dict.txt", "r"

更多推荐

分词之正向最大匹配法

本文发布于:2024-02-26 18:17:27,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1703430.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:分词

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!