Windows10下CRF++ 分词实践|电子爱好者

admin管理员组
文章数量:1581062

步骤如下：
1. 下载 CRF++-0.58.tar.gz，解压
2. 我们只需要如下三个文件

之后

将这三个文件与所需文件压缩包内东西解压放在同一目录下

下载链接：

3. 创建模板文件 tmpl.txt 如下：

# Unigram
U00:%x[-2,0]
U01:%x[-1,0]
U02:%x[0,0]
U03:%x[1,0]
U04:%x[2,0]


# Bigram
B

4.进入Windows shell界面 cd 切换到刚才解压好的目录然后执行如下操作

将训练语料转换成crf++需要的格式

python make_crf_train_data.py pku_train.utf8 pku_training_out.utf8

5. 使用训练，得到model 文件

.\crf_learn tmpl.txt pku_training_out.utf8 pku.model

6. 将测试语料转换成crf++需要的格式

python make_crf_test_data.py pku_test.utf8 pku_test_out.utf8

7. 得到标注文件，还要用脚本进行转换，略繁琐（可以跳过直接进入下一步）

.\crf_test -m pku.model pku_test_out.utf8 > pku_test_result.utf8

8. 执行得到分词输出结果

 python crf_segmenter.py pku.model pku_test.utf8 pku_test_word.utf8

9.对分词结果进行评测

python crf_tag_score.py pku_test_gold.utf8  pku_test_word.utf8

所需文件链接：https://download.csdn/download/qq_27500493/11223964

本文标签：分词 CRF

版权声明：本文标题：Windows10下CRF++ 分词实践内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1727875285a1135116.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

英语-ED分词的用法

9月前

英语-ED分词的用法

2012 英语常见情绪动词

9月前

2012 英语常见情绪动词

_baidu_搜索分词算法

8月前

_baidu_搜索分词算法

高中英语词法之现在分词考点大全笔记

8月前

高中英语词法之现在分词考点大全笔记

现在分词作状语

7月前

现在分词作状语

英语分词的用法(一)

7月前

英语分词的用法(一)

用作状语的-ed分词[整理版]

7月前

用作状语的-ed分词[整理版]

独立分词结构

6月前

独立分词结构

班智达藏文自动分词系统的设计与实现

4月前

班智达藏文自动分词系统的设计与实现

分词是什么意思

4月前

分词是什么意思

自-S12-英语5-学生-非谓语之分词

3月前

年月日发(作者：)非谓语之现在分词&过去分词:.............,,.“,”’..’,’.(普遍存在),-,,.’,—.“,”,:.“.”,“”“”,,,.,,“.”,,.,,().’..时态表示现在分词动作与谓语动作同时发生；或者

高三英语(现在分词、过去分词用法复习)

3月前

年月日发(作者：)教师辅导讲义年级：高三课时数：辅导科目：英语课题教学目标现在分词、过去分词用法复习根据高考大纲，有重点地分析现在分词、过去分词的重要考点和具体语境里的综合运用。教学内容、&?、.检查回家做的作业并对错题进行分析.高考重点词

with复合结构的用法归纳

3月前

年月日发(作者：)复合结构的用法归纳复合结构的用法归纳如下：名词介词短语().().在书面语中。上句也可以说成：,.．名词形容词（强调名词的特性或状态）(),&#;.天气这么闷热，十之八九要下雨。()..名词副词(),抳.约翰走了，我们的地

班智达藏文标注词典设计

2月前

年月日发(作者：)第卷第期中文信息学报．，．年月．，文章编号：—（）——班智达藏文标注词典设计才智杰，才让卓玛（青海师范大学藏文信息研究中心，青海西宁）摘要：语料库加工是一项庞大的语言工程，其中分词标注是最基础性的工作，而分词标注词典是标注

高中英语必修四Unit3知识归纳

2月前

年月日发(作者：)知识归纳词汇．．内容，题材；容量，目录(.)；满足(意).满足的，高兴的(一般不用作定语)；甘愿的.使……满足归纳拓展()...愿意做某事(不能用替换)满意……...()对……感到满意满足()..使……满足于某事()满足(

chatgpt赋能python：Python切词：了解中文分词技术

1月前

Python切词：了解中文分词技术什么是中文分词中文分词是将一段汉字文本切分成一个个有意义的词语的过程。这个过程在中文自然语言处理（NLP）中非常重要，因为汉字没有像英文字母那样有明确的分割符号，所以如果不做分词，机器很难理解汉字文

NLP(自然语言处理)基本入门之分词操作

28天前

文章目录环境问题Hanlp代码解读Hanlp分词Hanlp分词标准分词NLP分词索引分词极速词典分词自定义分词命名实体识别与词性标注关键词提取准确分词（自定义字典）jieba分词hanlp分词

数据库-Elasticsearch进阶学习笔记（分片、映射、分词器、即时搜索、全文搜索等）

27天前

目录基础概念定义特点索引(Index)分片(Shards)副本（Replicas）分配(Allocation) 映射(Mapping)动态映射显式映射常见数据类型文档(document)领域特

Elasticsearch：简体繁体转换分词器 - STConvert analysis

10天前

我的前同事 Medcl 大神，在 github 上也创建了一个转换简体及繁体的分词器。这个在我们的很多的实际应用中也是非常有用的，比如当我的文档是繁体的，但是我们想用中文对它

Win10环境下Elasticsearch 6.4.3 + Kibana 6.4.3的下载安装，中文分词器插件安装，版本选择，各种踩坑填坑过程

4天前

目录前言ElasticSearch简介环境准备版本选择安装包下载安装与配置分词效果演示本篇结束下一篇文章介绍前言不瞒你们说，这是我第一篇博客文章，如果有错误或者更好的解决方案&#

电子爱好者 - 最新技术资讯及电子产品介绍！

Windows10下CRF++ 分词实践

更多相关文章

英语-ED分词 的用法

2012 英语常见情绪动词

_baidu_搜索分词算法

高中英语词法之现在分词考点大全笔记

现在分词作状语

英语分词的用法(一)

用作状语的-ed分词[整理版]

独立分词结构

班智达藏文自动分词系统的设计与实现

分词是什么意思

自-S12-英语5-学生-非谓语之分词

高三英语(现在分词、过去分词用法复习)

with复合结构的用法归纳

班智达藏文标注词典设计

高中英语必修四Unit3知识归纳

chatgpt赋能python：Python切词：了解中文分词技术

NLP(自然语言处理)基本入门之分词操作

数据库-Elasticsearch进阶学习笔记（分片、映射、分词器、即时搜索、全文搜索等）

Elasticsearch：简体繁体转换分词器 - STConvert analysis

Win10环境下Elasticsearch 6.4.3 + Kibana 6.4.3的下载安装，中文分词器插件安装，版本选择，各种踩坑填坑过程

发表评论

推荐文章

启用Win10家庭版的远程桌面服务端

卡西欧相机SD卡格式化后数据恢复指南

正则表达式大全

u盘无法识别怎么办，u盘无法识别解决方法

2345流氓软件权限卸载

热门文章

【面试必备】静态路由与配置相关知识点详解

自动操作Android手机-Appium介绍及安装（学习笔记1）

WIN10专业版安装docker不成功的两种解决思路

U盘格式化了怎么办？这4个工具能帮你恢复数据。

谷歌浏览器调试技巧简介

【Linux】Docker入门

linux内核源文件,Linux内核源代码的下载

浏览器主页劫持，打开就访问889hao，2345导航（已解决）

解决：idea操作pom文件就非常卡顿

CC++,定时关机代码和取消定时关机（应用范畴）

最新文章

pdf转换成word转换器免费版哪里下载

如何使用ArcGIS将Excel数据转换为shp格式

pdg是什么格式文件怎么打开

怎么将pdf转换excel转换器

下载的谷歌卫星地图如何转换成Skyline MPT文件格式

pdf文件转换成word文本文档去水印怎么弄

png图片转换jpg，保姆级教程一学就会

使用万能地图下载器进行坐标转换的时候如何确定平面坐标的选择

dxf geojson 转换_gis各种地图工具的使用（附自动生成海量的geojson数据的josn文件）...

linux系统pdf文件转word文档,PDF如何转换为Word文件？用它，就是这么简单！

怎样完整的转换PDF格式文件

json格式校验(json格式校验器)

可以转换成PPT文件的PDF转换器

svga文件预览_Shu文件预览

使用手机将图片转换成PNG格式怎么做？教你三种转换方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

英语-ED分词的用法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载