【nlp】文本处理的基本方法

编程入门行业动态更新时间:2024-10-28 07:18:49

【nlp】<a href=https://www.elefans.com/category/jswz/34/1771357.html style= 文本处理的基本方法"/>

1 什么是分词

分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文的行文中，单词之间是以空格作为自然分界符的，而中文只是字、句和段能通过明显的分界符来简单划界，唯独词没有一个形式上的分界符。分词过程就是找到这样分界符的过程。

举个例子:

上海海事大学是一个以航运、物流、海洋为特色的安全管理高校['上海', '海事', '大学', '是', '一个', '以', '航运', '、', '物流', '、', '海洋', '为', '特色', '的', '安全', '管理', '高校']

更多推荐

【nlp】文本处理的基本方法

本文发布于:2023-11-29 22:16:27，感谢您对本站的认可！

文本方法 nlp

评论列表（有 0 条评论）